メディア

マイコンで深層学習も、エッジコンピューティングの未来：開発が進む「TinyML」（2/2 ページ）

» 2020年09月02日 12時00分公開

小さくても強力な「TinyML」

　TinyMLは比較的新しいパラダイムだが、既に推論（比較的性能の低いマイコンを使用）やトレーニング（高性能マイコンを使用）において、精度の低下を最小限に抑えつつ驚くべき成果を達成している。最近の事例としては、音声／顔認識や、音声命令、自然言語処理などの他、複数の複雑な視覚アルゴリズムの並列実行などが挙げられる。

　これは事実上、価格が2米ドル未満で動作周波数500MHzのArm Cortex-M7コアを搭載したマイコンや、28K～128Kバイトのメモリが、センサーの真のインテリジェント化を実現するために必要な性能を提供することができる、ということを意味する。

　これらのマイコンは、このような価格／性能レベルでも、AES-128などの複数のセキュリティ機能だけでなく、複数種類の外部メモリやイーサネット、USB、SPIに向けたサポート機能を備える他、各種センサーやBluetooth、Wi-Fi、SPDIF、I²Cオーディオインタフェースなどを搭載またはサポートすることも可能だ。もう少しコストを掛ければ、1GHzのArm Cortex-M7や、400MHzのCortex-M4、2MバイトのRAM、グラフィックスアクセラレーションなどをデバイスに搭載することもできる。消費電流は、3.3VDC供給でわずか数ミリアンペアだ。

機械学習のユースケース　出典：NXP

「TOPS」について一言

　1つの測定基準を使用して性能を定義するのは、消費者だけではない。設計者たちも常に使用している他、特にマーケティング部門は非常に熱心に使っている。主役となる仕様があれば、デバイス間の違いを容易に判断できるようになるためだ。

　典型的な例はCPUで、長年にわたりクロックレートによって定義されてきた。幸いなことに、設計者と消費者の両方にとって、これはもはや過去の話になっている。CPUの評価に1つの指標を使うのは、エンジンのレッドラインで車の性能を評価するようなものだ。全く無意味というわけではないが、それはエンジンがどれだけ強力であるか、あるいは車がどれだけ優れた性能を発揮するかとはほとんど関係がない。

　残念ながら高性能MPUやマイコンに搭載されるものを含むニューラルネットワークアクセラレーターについても、同様の傾向が強まっている。しかし、実際にはGOPSやTOPSだけを指標とするのはあまり意味がない。これらは実際の動作環境ではなく、ラボで行われた測定値（間違いなく最高の数値）を表している。例えばTOPSは、メモリ帯域幅の制限、必要なCPUのオーバーヘッド、前後の処理などの要因を考慮していない。これら全ての要素を考慮した場合、例えば特定のボードで実際に動作させた場合の性能なら、システムレベルの性能はデータシート上のTOPS値の50～60%になる可能性がある。

　これらの数値は、ハードウェア内の計算エレメントの数にクロック速度を掛けたものであり、機能する必要があるときにデータが利用可能な状態になる頻度ではないのだ。データが常にすぐに利用可能で、消費電力は問題ではなく、メモリの制約がなく、アルゴリズムがハードウェアにシームレスにマッピングされていれば、これらの数値はより意味のあるものになるだろう。しかし、現実の世界ではそのような理想的な環境は存在しない。

　マイコンのMLアクセラレーターに適用した場合、この指標の価値はさらに低くなる。これらの小さなデバイスのTOPS値は通常、1～3TOPSだが、それでも多くのMLアプリケーションで必要とされる推論機能を提供できる。また、低消費電力MLアプリケーション用に特別に設計されたArm Cortexプロセッサに依拠している。そして、整数演算と浮動演算の両方をサポートし、マイコンの他の多くの機能もサポートしていることから、TOPSや他の単一のメトリックでは、単独でもシステム内でも性能を適切に定義することができないことが明らかになっている。

マイコンで実現するエッジコンピューティングの未来

　IoT領域が可能な限り多くの処理をエッジで実行するようになるにつれ、カメラなどのセンサーに取り付けられたマイコン上で推論を実行したいというニーズは増加している。そして、マイコン内のアプリケーションプロセッサやニューラルネットワークアクセラレーターの開発ペースは速く、より高機能なソリューションが登場してきている。このトレンドは、消費電力やサイズを大きく増加させることなく、ニューラルネットワーク処理などのAI中心の機能をアプリケーションプロセッサと一緒にマイコンに統合することにある。

　今日では、モデルをより強力なCPUやGPUでトレーニングし、TensorFlow Liteなどの推論エンジンを使用してマイコンに実装することで、マイコンのリソース要件を満たすようにサイズを縮小することができている。これによって、より大きなML要件に対応するためスケーリングを簡単に行うことができる。近い将来、これらのデバイス上で推論だけでなくトレーニングを実行することも可能になるはずで、マイコンは、より大きく高価なコンピューティングソリューションに対抗する、強力な競争相手になるだろう。

【翻訳：田中留美、編集：EE Times Japan】

原文へのリンク

ビデオと音声のエッジAIを両方サポートするSoC
Kneronは、同社のニューラルプロセッシングユニット（NPU）IPの最新版を搭載するAI SoC（System on Chip）「KL720」を発表した。同SoCは、モニター付き玄関ベルやロボット掃除機などの低消費電力のエッジデバイスやスマートホームデバイス向けだが、「トースターから自動運転車まで、あらゆるものに対応できる」という。
組み込みAI開発を一元化するソフト「TENSAI Flow」
Eta Computeは、同社の超低消費電力AI（人工知能）チップ「ECM3532」向けに、組み込みAI開発を一元化できるコンパイラを発表し、ツールチェーンの成長を拡大させている。
スタートアップがひしめくAIチップ市場の現状
AI（人工知能）チップ市場は現在、“深層学習が全て”という状態にある。深層学習は、実世界の中でAIアプリケーションを役立てるという機械学習の枠組みの中で、最も成功している分野である。
TinyMLの簡素化に取り組む米スタートアップ
筆者は最近、TinyML（スマートフォンでも動作可能なほど低消費電力の機械学習）関連の動向について取り上げることが増え、その中でEdge Impulseの名前が頻繁に登場するということに気付いた。Edge Impulseはどのような企業なのか。
日本中小企業のAI導入加速を狙う、ジルファルコン
IoT（モノのインターネット）市場の拡大などによってエッジAI（人工知能）へのニーズが急速に高まる中、独自の用途特化型アーキテクチャ（Domain Specific Archtechrure：DSA）を武器としたスタートアップ企業が勢いを増している――。今回、AIアクセラレーターを手掛ける米国シリコンバレー発スタートアップGyrfalcon Technology（以下、Gyrfalcon）の日本法人代表に、同社の技術や日本市場での狙いなどを聞いた。
加速するAIチップ市場、2019年の重要な動き
2019年のAI（人工知能）アクセラレーターのハードウェアセグメントは、非常に活気があった。AIアクセラレーターのハードウェア分野における、2019年の重要な出来事トップ5を紹介する。