画像
Shinji Yamano
Shinji Yamano
Principal Specialist
掲載: 2021年11月15日

AIアプリケーションの実社会への適用が拡大し、様々な分野でのサービス組み込み事例も急増しています。 一方で画像を用いたAI(以下Vision AI)のアプリケーションでは、ニューラルネットワーク自体の進化が著しく、AI推論に対する要求性能が一層高まっていくと予想しています。 またこの傾向に伴い、消費電力の増加による発熱の課題が顕著になっています。

今回は皆様がすでに、またはこれから困ることになると思われるAI推論における課題「発熱」を解決するソリューションを紹介します。

ご存知の通り”消費電力が高い”すなわち”発熱が大きくなる”と、冷却部品(ヒートシンクなど)の追加、さらには筐体を大きくしてケース内の温度を保つなどの対策が必要となります。これは機器の価格上昇やサイズの大型化などの要因の一つになります。

それ以外にもサーマルスロットリング*など熱に起因する影響により、長期間運用時の性能が安定しないという課題が発生する可能性があります。
* チップが高温になった際に、クロックを下げて温度を下げる機能

以上から、負荷の高いVision AIを低消費電力実用的な性能で、かつ安定した性能を実現することがエンドポイントAIの必須条件と言えます。

これらの条件を満たすために、組み込み市場を長期間サポートしてきた技術・ノウハウを活用し、Vision AIを低消費電力で実現するRZ/Vシリーズをリリースしました。 このブログではRZ/Vシリーズ第一弾製品のRZ/V2MをAI推論の観点から紹介します。

1. RZ/V2Mとは

RZ/V2MはVision AIをアクセラレートする” DRP-AI”をキーテクノロジーに、さまざまな周辺機能を持つ製品です。 さらにさまざまな低消費電力対策を実施し、AI推論実行中でもボード全体で4Wを切る消費電力を実現*しています。
* ユースケースによって消費電力は異なります

RZ/V2Mの特長は、大きく3つになります。

画像

* ルネサス指定センサ向けに、スペシャリストの手によるパラメータ最適化済みのISP

RZ/V2MはすでにAIを用いた監視カメラ、産業用カメラ、マーケティングカメラ、ゲートウェイ、ロボット、医療機器などの製品へ採用されており、これから市場への展開が始まります。

2. AI推論用アクセラレータ “DRP-AI

DRP-AIの最大の特長は “ハードウェアのみでAI推論の全ての処理を実行可能” です。 DRP-AIは2つのブロックに分割され、CPUを介さずに協調動作を行うことでAI推論を行います。

  • DRP:
    リコンフィギュラブル技術を使用し、Convolution層以外の処理 上記に加え、AI推論の前に必要なリサイズ等の前処理
  • AI-MAC:
    処理量が多く単純な演算を求められるConvolution層の処理

CPUや他のハードウェアを介さないDRP-AIの利点は、AI推論以外の処理を同時に行った場合でもそれらの処理に影響を受けない、すなわち性能のゆらぎがないことが挙げられます。DRP-AIのアーキテクチャについての詳細は、DRP-AIホワイトペーパーを参照ください。

3. RZ/V2Mの性能

一般的にAI性能はTOPS値という指標で表現されますが、組み込みの世界においてはバス帯域や消費電力など、これだけでは表現できない要素の考慮も必要です。 そのためルネサスではTOPSでの表記ではなく、実際の性能で紹介しています。

ここではAI推論速度とカメラ入力やISP処理などのAIに求められる要件を含めたシステム(ボード全体) での消費電力を紹介します。

以下の表は評価ボード上でAIを実行させたときの結果です。

  RZ/V2M
MobileNet V2
RZ/V2M
YOLOv3-tiny
(参考)他社製品
YOLOv3-tiny
 AI推論速度(fps) 55fps 52fps 46fps
 消費電力 2.6W 3.0W 9.8W
 電力効率 21.3 fps/W 17.2 fps/W 4.7 fps/W

このようにRZ/V2Mは他社製品に対して30%の消費電力で、かつ同等以上の推論速度を実現することが出来ます。 ルネサスが紹介している電力効率(fps/W) の値も他社製品の約3.5倍と高効率であることを示しています。

以下の図は実際に本測定を行った評価ボードの外観と表面温度です。

画像
Evaluation board
画像
Surface temperature of the evaluation board

左はボードの外観です。ご覧の通りヒートシンクが未搭載です。

右はこの条件でAI推論を約30分間実行したときのチップ表面温度です。 この画像からチップ表面温度は約30℃であり、この温度では冷却部品が不要ということがご理解頂けると思います。 なおルネサスの評価では、他社製品はヒートシンクがついた状態での発熱が約75℃となっていたことを補記します。

4.まとめ

エンドポイントでのVision AIの需要が高まるにつれ、手軽に評価ができるGPUやFPGAなどで初期評価を開始するお客様が増えてきたと感じています。 一方で「消費電力による発熱の問題があり量産が難しい」と言う声もよく聞きます。

実際にRZ/V2Mを採用頂いたお客様からは以下のようなコメントを頂いています。

  • “FPGAと比べて、1/3以下の消費電力で同程度の性能が確認できた。”
  • “DRP-AIの性能に感銘を受けた。RZ/V2Mを使ったAIの組み込みに高い期待がある。”

本ブログでの情報から、RZ/V2Mはエンドポイント向けのVision AIに最適な製品とご理解いただけることを確信しています。

関連情報:

1. e-AI: ルネサスの提唱するエンドポイントAI
2. RZ/V2M: DRP-AI、高性能ISPを搭載したカメラ応用向けミッドレンジ製品グループ
3. RZ/V2L: DRP-AIを搭載したエントリーレベルの製品グループ
4. DRP-AI, DRP-AIホワイトペーパー:DRP-AIの技術情報

この記事をシェアする