ニュース
» 2017年08月24日 10時30分 UPDATE

1ナノ秒で意思決定:半導体レーザーのカオス現象で強化学習を高速化 (1/2)

情報通信研究機構(NICT)の成瀬誠主任研究員らによる研究グループは、半導体レーザーから生じるカオス現象を用い、「強化学習」を極めて高速に実現できることを実証した。

[馬本隆綱,EE Times Japan]

無線通信における周波数の割当てなどを瞬時に判断

 情報通信研究機構(NICT)の成瀬誠主任研究員、埼玉大学大学院理工学研究科の内田淳史教授、慶應義塾大学大学院政策・メディア研究科の金成主特任准教授らによる研究グループは2017年8月22日、半導体レーザーから生じるカオス(レーザーカオス)を用い、「強化学習」を極めて高速に実現できることを実証したと発表した。

 強化学習は、未知の環境で試行錯誤をしながら学習を行う方法である。画像認識などで注目される深層学習(ディープラーニング)と並び、人工知能(AI)を支える機械学習の1つ。応用例としては、多数のスロットマシンが並ぶカジノで、もうけを最大化する問題(多本腕バンディット問題)の解決などに用いられる。実用レベルでは、データセンターにおけるコンピュータ資源の割り当て、アービトレーション処理や、無線通信における周波数の瞬時割当て処理、ロボット制御といった用途で、強化学習の応用が期待されている。

研究の背景 出典:NICT他

 NICTらはこれまで、「自然界の物理現象を直接用いた強化学習」をいち早く提案し、単一光子を用いた方式で実現してきた。今回は、半導体レーザーにおいて生じる、光のカオス現象で得られる乱雑な信号と、独自開発した強化学習方式を組み合わせることで実現した。

 このシステムを用い、「当たり確率の未知な2台のスロットマシンから、当たり確率の高い台を選ぶ問題」(2本腕バンディット問題)を、高速に解決することに成功した。実験の結果、情報が入力されてから出力されるまでの時間はわずか1ナノ秒と、極めて高速に意思決定されたことを確認した。

 具体的には、半導体レーザーで得られたレーザーカオスを高速にサンプリングし、計測した信号レベルが閾値を上回る場合は「スロットマシン1」を選択する。逆に閾値を下回る場合には、「スロットマシン2」を選択するように意思決定する。「閾値は過去の戦歴に基づいて、上下に変更することが重要」と話す。また、仮想的に生成した高速な擬似乱数(カラーノイズ)を用いた従来方式に比べても、優れた性能を示すことを確認した。

レーザーカオスを用いたシステムは、超高速な強化学習を実現 出典:NICT他
       1|2 次のページへ

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

RSSフィード

All material on this site Copyright © 2005 - 2017 ITmedia Inc. All rights reserved.
This site contains articles under license from UBM Electronics, a division of United Business Media LLC.