メディア

演算性能と電力効率を両立したCNNアクセラレーターISSCC 2021でルネサスが発表

ルネサス エレクトロニクス(以下、ルネサス)は2021年2月17日、オンラインで開催された半導体業界最大級の国際学会「ISSCC 2021」(同年2月13〜22日)で、車載SoC(System on Chip)向けに高い性能と電力効率を両立したCNN(畳み込みニューラルネットワーク)アクセラレーターコアおよび機能安全技術を発表した。

» 2021年03月04日 10時30分 公開
[村尾麻悠子EE Times Japan]

演算性能と電力効率を両立

 ルネサス エレクトロニクス(以下、ルネサス)は2021年2月17日、オンラインで開催された半導体業界最大級の国際学会「ISSCC 2021」(同年2月13〜22日)で、車載SoC(System on Chip)向けに高い性能と電力効率を両立したCNN(畳み込みニューラルネットワーク)アクセラレーターコアおよび機能安全技術を発表した。

 CNNアクセラレーターは、60.4TOPSのディープラーニング性能と、13.8TOPS/Wの電力効率を実現したもので、ルネサスは同アクセラレーターを搭載した車載SoC「R-Car V3U」を2020年12月に既に発表している。

 ルネサスによると、「水冷と空冷を分ける消費電力のポイントが25W。そこより高いと水冷になるのでシステムのコストが上がってしまうが、低くし過ぎると今度はディープラーニングの性能が下がってしまう。今回のCNN IP(Intellectual Property)は性能と消費電力のベストバランスを探した」という。

 CNNアクセラレーターの技術的な特長は主に3つある。1)1コア当たり1万3824個の積和演算器を搭載したこと、2)CNNアクセラレーターの専用メモリを設けたこと、3)CNN処理の外付けDRAMとの転送データ量を9割以上削減したことだ。

 R-Car V3Uは、このCNNハードウェアアクセラレーターコアを3個実装したことで、60.4TOPSの性能を実現している。さらに、各アクセラレーターコアに対して2Mバイトの専用メモリ(合計6Mバイト)を搭載し、広帯域のバスでアクセラレーターコアと直接接続した。専用メモリを搭載したことで、CNNと外付けDRAMのデータ転送量を9割以上削減できたという。「外付けDRAMとのデータ転送が、消費電力の大きな割合を占める。そこを削減したことが、優れた電力効率の鍵となった」(ルネサス)

左=水冷と空冷を分ける25Wを基準に、性能とのベストバランスを追求した/右=高い電力効率を実現したCNNハードウェアアクセラレーター 出典:ルネサス エレクトロニクス(クリックで拡大)

ASIL D向けのセーフティメカニズム

 さらに、自己診断が可能なASIL D向けセーフティメカニズムも開発した。従来は、SoCの中でも制御を担う回路部分のみを、高いASILレベル(ASIL Dなど)を実現する領域としていたが、今回は、R-Car V3U用の技術としてその領域をSoC全体に広げている。具体的には、SoC全体でランダムハードウェア故障を高速に検出、制御できるようにした。

 とはいえ、ASIL Dに適応する領域をやみくもに拡大すると、消費電力も増加してしまう。そのため、今回開発したセーフティメカニズムでは、「対象となる機能に適した故障検出機構を組み合わせることで、消費電力を抑えつつ高い故障検出率を両立した」とルネサスは説明する。

 例えば、今回開発したCNNアクセラレーターであれば、処理のほとんどを占める画像認識ではASIL Bレベルの処理に抑え、各センサーの入力結果から周辺環境をモデリングする処理については、より高い安全性レベルのASIL Dを満たす処理を行えるメカニズムを適用した。

 同メカニズムは、ルネサスが「Hardware Supported Software Lockstep」と呼ぶもの。前述のように、R-Car V3Uには3つのCNNアクセラレーターコアが搭載されているが、このうち2個のコア(CNN1、CNN2とする)と、専用のデータ転送エンジン「Lockstep DMAC」を使い、任意の期間ロックステップ処理を実行できる機構が、Hardware Supported Software Lockstepだ。

 Lockstep DMACは、必要なデータを外部メモリから読み出して、CNN1/CNN2の専用メモリに格納するだけでなく、これら2つのコアが実行した処理結果を専用メモリから読み出して比較する。比較した結果が一致しなければ「故障」と判定する。「外部メモリにはCNN1の結果だけを書き込む。それによって、帯域を増やさない工夫も施している」(ルネサス)

左=高いASILレベルを満たす領域を、一部の回路だけでなくSoC全体に広げる/右=「Hardware Supported Software Lockstep」の仕組み 出典:ルネサス(クリックで拡大)

ソフトウェアタスクの従属故障を防ぐ

 ASIL Dに向けた機能安全を強化すべく、安全性レベルが異なるソフトウェアタスクを、相互干渉なく動かす機構も開発した。「FFI(Freedon From Interference)支援機構」と呼ぶ。

 「例えば、セーフティレベルが低いタスクから高いタスクにアクセスできてしまうと、それによって設定やデータが破壊され、従属故障が発生する。こうなるとASIL Dが達成できなくなる」(ルネサス)。この従属故障を防ぐ仕組みがFFI支援機構だ。SoC内のインターコネクトを流れる全てのデータを監視し、タスク間の不正なアクセスを発見したら遮断する。データは、セキュアIDとともに送られる。データの転送先でそのIDをチェックし、許可されたものかどうかを判断する。

「FFI(Freedon From Interference)支援機構」の仕組み 出典:ルネサス(クリックで拡大)
上記の技術を適用した「R-Car V3U」のアーキテクチャ。「コントロール」「画像認識処理」など5つのブロックで構成され、全てインターコネクトというモジュールで接続されている。3つのCNNアクセラレーターコアは、画像認識処理の部分に搭載されている 出典:ルネサス(クリックで拡大)

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.