メディア

半導体レーザーのカオス現象で強化学習を高速化：1ナノ秒で意思決定（2/2 ページ）

» 2017年08月24日 10時30分公開

[馬本隆綱，EE Times Japan]

1ナノ秒で強化学習を実現

　実験では、レーザーカオスを最大1000億回/秒でサンプリングし、データ処理をオフラインで行った。2台のスロットマシンの当たり確率を［0.2、0.8］、［0.4、0.6］と設定した場合に、正しい意思決定が行えるかどうかを検証した。スロットマシンの当たり確率は10ナノ秒ごとに入れ替えた。

上段はレーザーカオスを用いた超高速意思決定システムの概要、中段はレーザーカオスなどの時系列信号、下段は環境変化への適応を示したグラフ出典：NICT他

　実験結果から、事前の知識が全くない状態から強化学習を行った場合、レーザーカオスの信号を50ピコ秒間隔でサンプリングしたときに、最も適応性に優れた性能が得られた。約20回の試行で正解率は9割台となった。1ナノ秒という極めて短い時間で強化学習を実現したことになる。

　レーザーカオスの波形を特徴づける自己相関関数の値は、強化学習の性能が最大となるサンプリング間隔50ピコ秒のときに、負の最大値を示した。これに対して、負の自己相関の最大値がより大きな擬似周期信号では、レーザーカオスを用いた場合よりも強化学習の性能が劣ることが分かった。

上段は事前の知識が全くない状態からの強化学習の実現例、下段は実験に用いた信号の自己相関関数出典：NICT他

　強化学習はこれまで、コンピュータ上のアルゴリズムを用いて実現されてきた。今回の研究成果により、レーザーカオスを用いた方式が実証された。これにより、極めて高速な強化学習を実現することが可能になるとみている。

沈黙する人工知能～なぜAIは米大統領選の予測に使われなかったのか
世界中が固唾をのんで、その行方を見守った、2016年11月8日の米国大統領選挙。私は、大統領選の予測こそ、人工知能（AI）を使い倒し、その性能をアピールする絶好の機会だとみていたのですが、果たしてAIを手掛けるメーカーや研究所は沈黙を決め込んだままでした。なぜか――。クリントンvsトランプの大統領選の投票を1兆回、シミュレーションしてみた結果、その答えが見えてきました。
GoogleのAI用チップ、Intelの性能を上回ると報告
Googleが2016年に発表した、機械学習の演算に特化したアクセラレータチップ「TPU（Tensor Processing Unit）」が、IntelのCPUやNVIDIAのGPUの性能を上回ったという。Googleが報告した。
地デジ放送波でゲリラ豪雨を予測？ NICTが開発
情報通信研究機構（NICT）は、地上デジタル放送の電波を用いた水蒸気推定手法の開発に成功したと発表した。ゲリラ豪雨など局所的な気象現象の予測精度向上につながることが期待される。
105Gビット/秒のテラヘルツ送信機を共同開発
広島大学と情報通信研究機構（NICT）、パナソニックは、シリコンCMOS集積回路を用いて、300GHz帯単一チャネルの伝送速度として105Gビット/秒を実現したテラヘルツ送信機を共同開発した。光ファイバーに匹敵する高速無線通信を可能にする。
見通し外の位置にいるドローンの制御が可能に
情報通信研究機構（NICT）は「テクノフロンティア2017」で、障害物を迂回してドローンに電波を届けるマルチホップ無線通信システム「タフワイヤレス」と、ドローン間位置情報共有システム「ドローンマッパー」を発表した。前者は、発信地から見て見通し外の場所にいるドローンを制御するためのシステム。後者は、ドローン同士の衝突を防止するためのシステムだ。
8K映像を分割、複数回線で遠隔配信に成功
情報通信研究機構（NICT）は、109Gビット/秒の8K非圧縮映像と音響環境を分割し、複数回線を使って遠隔配信する実証実験に成功した。大容量の回線が整備されていない環境においても、8Kライブ映像配信が可能となる。