ニュース
» 2017年07月28日 11時30分 UPDATE

音声認識の正答率99.6%:産総研ら、STOを用いた人工ニューロンを開発

産業技術総合研究所(産総研)の常木澄人研究員らによる研究グループは、スピントルク発振素子(STO)を用いた人工ニューロンを開発した。これを用いたニューロモロフィック回路音声認識システムの音声認識正答率は99.6%と高い。

[馬本隆綱,EE Times Japan]

人工知能への応用に期待

 産業技術総合研究所(産総研)スピントロニクス研究センター金属スピントロニクスチームの常木澄人研究員、薬師寺啓研究チーム長、同研究センターの久保田均総括研究主幹、福島章雄副研究センター長らは2017年7月、フランスのパリ・サクレー大学、アメリカ国立標準研究所(NIST)と共同で、スピントルク発振素子(STO)を用いた人工ニューロンを開発したと発表した。これを用いたニューロモロフィック回路音声認識システムは、音声認識の正答率が99.6%となった。

左はスピントルク発振素子を用いた人工ニューロンの回路図 出典:産総研

 産総研はこれまで、不揮発性磁気メモリ「STT-MRAM」の開発で蓄積してきた薄膜材料と微細素子作製の技術を応用し、STOの実用化研究を行ってきた。STOは、直流電流を流すとスピンの共鳴歳差運動が励起されて(強磁性共鳴)、交流電圧が発生する自励発振素子である。

 この発振素子は、直流電流値を変化させることで出力の交流電圧値を変えることができる。このとき、交流電圧の振幅は、「緩和時間」と呼ばれる時間遅れを伴い、徐々に変化する。交流電圧の振幅は、電流値に比例せずに非線形な振る舞いを行う。

 研究グループは、この「緩和時間」と「非線形性」が、ニューロモロフィックシステムで必要となる「short term memory(短時間記憶)」や信号の非線形性として活用できると判断し、ナノメートルサイズのSTOを用いた人工ニューロンを考案した。

左はSTOの模式図、右は直流電流に対する交流電圧の時間変化を示したグラフ 出典:産総研

 さらに今回、開発した人工ニューロンを用いて、人間の脳神経回路網を模したニューロモロフィックシステムを構築し、人間が発する「0〜9」までの数字(英語)10個を認識する実験を行った。学習と認識には、5人分の話者データを用いた。STOを採用した人工ニューロン回路を音声認識に活用すると、学習回数が少なくても正答率は最大99.6%となった。この数値は、大型で複雑な工学系リザーバーコンピュータと同等の正答率だという。

左上は1(ワン)と発音した音声信号の波形、左中央は音声信号に前処理を施したSTOへの入力信号波形、左下はSTOの出力信号波形、右は学習回数と音声認識の成功率 出典:産総研

 研究グループは今後、開発した人工ニューロンに人工シナプスを接続した、高度なニューロモロフィックシステムを新たに開発していく計画である。これにより、ビッグデータのリアルタイム情報処理を実現していく。

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

RSSフィード

All material on this site Copyright © 2005 - 2017 ITmedia Inc. All rights reserved.
This site contains articles under license from UBM Electronics, a division of United Business Media LLC.