半導体レーザーのカオス現象で強化学習を高速化：1ナノ秒で意思決定（1/2 ページ）

情報通信研究機構（NICT）の成瀬誠主任研究員らによる研究グループは、半導体レーザーから生じるカオス現象を用い、「強化学習」を極めて高速に実現できることを実証した。

» 2017年08月24日 10時30分公開

[馬本隆綱，EE Times Japan]

印刷する

見るPost

Shareシェア

-はてなブックマーク

無線通信における周波数の割当てなどを瞬時に判断

　情報通信研究機構（NICT）の成瀬誠主任研究員、埼玉大学大学院理工学研究科の内田淳史教授、慶應義塾大学大学院政策・メディア研究科の金成主特任准教授らによる研究グループは2017年8月22日、半導体レーザーから生じるカオス（レーザーカオス）を用い、「強化学習」を極めて高速に実現できることを実証したと発表した。

　強化学習は、未知の環境で試行錯誤をしながら学習を行う方法である。画像認識などで注目される深層学習（ディープラーニング）と並び、人工知能（AI）を支える機械学習の1つ。応用例としては、多数のスロットマシンが並ぶカジノで、もうけを最大化する問題（多本腕バンディット問題）の解決などに用いられる。実用レベルでは、データセンターにおけるコンピュータ資源の割り当て、アービトレーション処理や、無線通信における周波数の瞬時割当て処理、ロボット制御といった用途で、強化学習の応用が期待されている。

研究の背景出典：NICT他

　NICTらはこれまで、「自然界の物理現象を直接用いた強化学習」をいち早く提案し、単一光子を用いた方式で実現してきた。今回は、半導体レーザーにおいて生じる、光のカオス現象で得られる乱雑な信号と、独自開発した強化学習方式を組み合わせることで実現した。

　このシステムを用い、「当たり確率の未知な2台のスロットマシンから、当たり確率の高い台を選ぶ問題」（2本腕バンディット問題）を、高速に解決することに成功した。実験の結果、情報が入力されてから出力されるまでの時間はわずか1ナノ秒と、極めて高速に意思決定されたことを確認した。

　具体的には、半導体レーザーで得られたレーザーカオスを高速にサンプリングし、計測した信号レベルが閾値を上回る場合は「スロットマシン1」を選択する。逆に閾値を下回る場合には、「スロットマシン2」を選択するように意思決定する。「閾値は過去の戦歴に基づいて、上下に変更することが重要」と話す。また、仮想的に生成した高速な擬似乱数（カラーノイズ）を用いた従来方式に比べても、優れた性能を示すことを確認した。