メディア

AIプロセッサを開発した東芝メモリの狙い：メモリ以外での勝負も必要に？（2/3 ページ）

» 2018年11月22日 11時30分公開

まるでテトリス、「ビットパラレル」

　ハードウェアアーキテクチャとしては、「ビットパラレル方式」を提案する。レイヤーごとの最適量子化では、複数の演算器において、1ビットずつ時間軸方向に割り当てる「ビットシリアル方式」で演算している。

　東芝メモリが開発したアルゴリズムをこのビットシリアル方式に割り当てると、使用するビット数は減るものの、そのフィルター内の最大ビット数の演算が完了するのを待たなければならないため、演算器の利用効率が落ちてしまう。さらに、リーク電流も流れてしまうので消費電流が発生する。

　それに対し、ビットパラレル方式では、1ビットに分解し、それを各演算器に順番に割り当て、並列動作させる。これによって、演算器の利用効率はほぼ100％に高まり、処理速度（スループット）も高まる。

「ビットパラレル方式」のアーキテクチャ。左＝従来のビットシリアル方式は、各演算器（PE：Processing Element）において時間軸方向（縦軸方向）に1ビットずつ積み上げていくようなイメージ／中央＝フィルターごとの最適量子化を、ビットシリアル方式に適用させると、1個当たりで演算するビット数は減るものの、全体としてみると利用効率がよくない／右＝ビットパラレル方式は、1ビットずつに分解し、各PEに順番に割り当てていく。「テトリス」のように、PEが休むひまなく演算するよう、隙間を埋めていくようなイメージだ出典：東芝メモリ（クリックで拡大）

　東芝メモリは、開発したアルゴリズムを、ハードウェアアーキテクチャを用いてFPGAに実装。実際に演算した結果、重みの精度を16ビットに固定した従来の演算に比べ、演算サイクル数を大幅に削減できることが分かった。具体的には、認識精度をほぼ同等レベルに維持しつつ、演算サイクルを約18.7％に削減。これにより、スループットは従来の約5.3倍、消費エネルギーは約18.7％に改善した。