メインコンテンツに移動

次世代ADASや自動運転システムに向けた高信頼・高性能ディープラーニングアクセラレータ

画像
Katsushige Matsubara
Senior Manager
掲載: 2021年3月30日

次世代ADASや自動運転(AD)システムを製品として市場に投入する場合、正確で高速な認識、判断、ならびに操作が必要になります。畳み込みニューラルネットワーク(CNN)は、パターン認識に用いられるディープラーニング技術ですが、大量の計算を必要とし、搭載されるセンサーの数が増加すると、より高いCNNの性能が必要になります。しかし、それに比例して消費電力が高くなると、重くて高価な水冷システムが必要になります。高いCNNの性能と、軽量でコストに優れる空冷システムを可能とする低消費電力の両立が求められます。LSI 1デバイスあたり、60TOPSのCNN性能を10TOPS/Wの効率で実現することが、実用的な観点からみた最適なターゲットとなります。

画像
cnn-performance-targets

電力効率に優れた高性能CNNハードウェアアクセラレータ

CNNハードウェアアクセラレータ (CNNA)の性能・電力ターゲットは、60TOPSの性能を10TOPS/Wの電力効率で実現することです。実装上の観点から1つのアクセラレータではなく、3つの同一のアクセラレータで実現しました。1つのCNNAは、13,824個のMAC演算器が搭載され、800MHzで動作し、理論最大性能は22TOPSです。3つのCNNAあわせて理論最大性能が66TOPSです。またCNNA一つあたり2MBの専用スクラッチパッドメモリ(SPM)を持ち、512ビットバスを介してCNNAと接続されます。これは、CNNAの実行高効率を高め、CNNAと外部メモリ(DRAM)間のデータ転送量の約9割を削減し、DRAMインタフェースやバスで消費される電力を節約します。テストチップの測定から、VGG16は32TOPSの性能を6.1TOPS/Wの電力効率で、CNNAに最適化したネットワーク(Network-A)は60.6TOPSの性能と13.8TOPS/Wの電力効率で実現しました。

画像
performance-evaluation

ASIL Dタスクに向けたセーフティメカニズム

次世代ADASやADシステムでは、自動車向け安全規格ISO 26262の最も厳しい安全性レベルとなるASIL Dの機能安全を実現することが求められます。デュアルコアロックステップ(DCLS)は、プロセッサなどのハードウェアにおいて、ASIL Dの達成指標(メトリクス)を満たせる手法の一つです。冗長構成をとる2つのハードウェアで同じ処理を実行し、ぞれぞれの出力を比較することで故障を検出します。

CNNAもASIL Dのメトリクスを満たすにはハードウェアの冗長性が必要ですが、単純にDCLSを適用すると、大規模なMAC演算器を冗長に持たなければならず、面積も消費電力も大幅に増加してしまい、現実的ではありません。そこで、ソフトウェアの制御で2つのCNNA (CNNA1、CNNA2)を動的に再構成して、安全性が必要な処理時のみロックステップ実行できるようにしました。

CNNAは、カメラから入力される画像の認識処理(ASIL B)と、各センサーから入力された結果から周辺環境をモデリングする処理(ASIL D)に使用されますが、実行時間の大半は前者のASIL Bの画像認識処理です。したがって、周辺環境モデリング処理時のみCNNA1とCNNA2をロックステップ動作に切り替えることで、性能や電力効率を大きく損なうことなくASIL Dのタスクを実現できます。

画像
safety-mechanism-cnna

下記はロックステップDMAC (LDMAC)を用いてCNNAをロックステップ動作するときの操作です。
1) LDMACは外部メモリからSPM1とSPM2に同じデータをロードする。
2) CNNA1とCNNA2は同じネットワーク処理を実行する。
3) LDMACが実行結果をSPM1とSPM2から読み出して比較し、不一致の場合は故障と判定する。DRAMにはCNNA1の結果のみストアする。

画像
hardware-supported-software-lockstep

ASIL Dを達成するためのもう1つの重要な要素は、タスク間に干渉がないこと(FFI: freedom from interference)です。システムにはASILが異なるタスクが混在しています。それらは、より高いASILのタスクに対し無干渉の必要があります。前述したようにCNNAは異なるASILのタスクからアクセスされるため、各タスクが用いるメモリ空間は分離されなくてはなりません。

画像
concept-ffi

メモリ空間の分離の機構はCNNA、LDMAC、およびメモリ管理ユニット(MMU)のメモリ保護テーブルで実現されます。現在実行中のタスクのコンテキストインデックスが、CNNAやLDMACから出力されるトランザクションに付与されます。MMUはそれを受け取り、トランザクション毎にコンテキストを切り替えます。

画像
support-mechanism-ffi

ルネサスは今回の成果を、2021年2月13日から22日までオンラインで開催された「国際固体素子回路会議 ISSCC 2021(International Solid-State Circuits Conference 2021)」にて発表しました。本技術をベースに、今後も車載LSI製品を開発、展開してまいります。これにより、ADASならびにADシステムの普及を通して、安心・安全なクルマ社会の実現に貢献します。

この記事をシェアする