このブログは前回のBlogに続く第2部となり、Embedded World 2023で披露した2つのデモを紹介します。これらのデモでは、ARM® Cortex®-M85コアのAIおよびDSPアプリケーションにおける性能を披露し、組み込みシステムにおける性能向上の大きな可能性を示しました。
PlumerAIとのパートナーシップによる人物検出デモ
図1は、PlumerAI との共同開発によるCortex-M85コアをベースにした人物検出アプリケーションを紹介しています。このビジョンAIアプリケーションは、さまざまな照明や環境条件、さまざまなカメラの角度で、検出距離が20メートル以上に及ぶカメラフレーム内の人物を識別し追跡します。コンパクトで効率的なTinyMLモデルを利用しているため、幅広いIoT機器に対して、低コストで低消費電力のAIソリューションを実現します。
図1. ヘリウムを搭載したCortex-M85コアを使用した人物検出デモ
図2はTensorFlow Lite for Microcontrollers [TFLM] 推論エンジンとPlumerAIの推論エンジンArm®コア別に実測した結果です。Cortex-M85コアは他のArm®コアに比べて性能が良いことが分かります。さらに、ヘリウムMVE技術の有無を測定したことにより、性能が向上した理由が、ヘリウムMVE技術の利用によるものであることが分かります。
図2. 人物検出デモのベンチマーク結果。Cortex-M85コアは、Cortex-M7コアよりも最大3.37倍の性能向上を達成します。グラフはサイクルを比較しており、CPU周波数が高いため、ミリ秒単位での向上は約70%高くなることに注意してください。
ベンチマーク結果は、他のMコアに比べて大幅な性能向上を示し、人物追跡などのより複雑なビジョンユースケースが可能になります。推論速度が速いことは、CPUがより早くスリープモードに戻ることができることを意味し、超低消費電力を実現します。
モーターコントロール故障検出デモ
二つ目のデモ(図3)は、幅広い産業用途で活用できる予測モーターコントロール故障検出の使用例を紹介しています。シャント電流を利用して、モーターがどの程度ずれているか(モーターボードに力を加えることで)を予測しており、その結果が、ルネサスが開発したGUIに表示されます。
図3. CM85コアを使用した予測モーター故障デモ
図4に示されているモーター故障検出ワークフローでは、ADCを介して取得したシャント電流を使用し、それをFFT(ヘリウムによって加速)で前処理し、畳み込みニューラルネットワーク(ヘリウムによって加速)をTFLMとCMSIS-NNを介して実行します。
図4. モーター故障デモアプリケーションのワークフロー
このデモでは、図5で示されるように、使用されたモデルで5倍以上のFFT(←合っている?もしくは性能向上かな?)向上が示されました。また、固定小数点フォーマットでは3倍以上、浮動小数点フォーマットでは2倍以上のFFT向上が見られました。これは、Cortex-M85コアがさまざまなデータ型をネイティブでサポートしているためです。この向上により、Cortex-M85コアとヘリウムがTinyMLアプリケーション向けの強力なソリューションであるだけでなく、低〜中位のDSPアクセラレーターを置き換えてBOMを削減するのにも役立つことが示されています。
図5. ヘリウムの有無にかかわらず、Cortex-M7コアとCortex-M85コアの実シリコンサイクル性能の比較。グラフはサイクルを比較しており、CPU周波数が高いため、ミリ秒単位での向上は約70%高くなります。
まとめです。Embedded World 2023でのCortex-M85コアのデモは、AI/MLおよびDSPワークロードにおける顕著な性能向上の可能性を示しました。その結果、ヘリウムを搭載したCortex-M85コアは、組み込みシステムにおける複雑な処理タスクに適しており、より高度なアプリケーションやソリューションの開発が可能となります。