メインコンテンツに移動

エンベデッドビジョンアプリケーションにおけるエンドポイントAI革命

画像
Karol Saja
Karol Saja
Staff Engineer
掲載: 2022年6月27日

人工知能の領域で今盛り上がりを見せている新しいフロンティアとして、AI処理をエッジで完結できるエンドポイントAIが挙げられます。これはデバイス上で情報管理、関連データの蓄積、ローカルで意思決定が行えるという画期的な技術です。ネットワークのエッジ上でインテリジェント機能を使うので、データ計算に使われるIoTデバイスを、AI機能を組み込んだスマートツールに変身させているとも言えます。これによってリアルタイムの意思決定能力と機能性が向上します。目下の目標は、機械学習に基づいたインテリジェントな意思決定を、データソースにより近づけることです。このような背景から、エンベデッドビジョンはエンドポイントへと移りつつあります。しかもただ画像や映像をピクセルに分解するだけがエンベデッドビジョンの技術ではありません。ピクセル数を把握し、映っているものの内容を理解し、発生したイベントに応じて賢い意思決定を行うことができるのです。これを受けて現在、AI技術やアルゴリズムを改善するために、研究レベルでも産業レベルでも大規模な開発が進んでいます。

エンベデッドビジョンとは何か?

エンベデッドコンピュータビジョンとは、機器に“見る”能力、すなわち視覚を与える一種の技術です。機械学習や深層学習アルゴリズムのサポートにより、周辺の探索が可能となります。多くの産業分野で、コンピュータビジョンに依存するアプリケーションが無数に存在しており、もはや不可欠な要素となっています。より正確に言えば、人工知能(AI)分野のひとつであり、デジタルマルチメディアソースから価値ある情報を抽出し、得られた情報に基づいた行動や提案を機械に実行させるのがコンピュータビジョンになります。こういったことからある意味、人間の視覚に近いと言えるでしょう。しかしながら、大きく異なっている点もあります。まず、人間の視覚は、見たものから様々なことを理解する優れた能力が備わっています。一方、コンピュータビジョンが正確に認識できるのは訓練されたもののみで、それもエラーを含みます。またエンベデッドビジョンにおけるAIは、最小限の処理時間で想定される機能を実行するよう機械を訓練し、より短いタイムフレームで何十万もの画像を分析するため、人間の視覚よりも優れている点もあります。

消費者や産業界の様々なアプリケーションのスマートエンドポイントで利用されている組み込みAIをリードする技術のひとつとして、エンベデッドビジョンがあるのです。その活用例として、工場ラインにおいて製品の品質を計数・分析する、群衆人数をカウントする、物体を識別する、特定の領域に含まれる内容を分析するなど、非常に付加価値の高いユースケースが挙げられます。

しかし、エンドポイントでのエンベデッドビジョンアプリケーションの処理、ならびに操作の性能にはいくつかの課題があります。物体検知デバイスからクラウドへのデータ転送は非常に大きくなりがちで、ネットワークの帯域幅を超える可能性があります。例えば、画像サイズが1920×1080のカメラを30FPS(フレーム毎秒)で動作させた場合、約190MB/Sのデータが生成されます。プライバシー上の懸念に加え、このような大規模なデータ量は、エッジからクラウド、そしてエンドポイントへの転送に伴うレイテンシの要因になります。そしてリアルタイムアプリケーションにおけるエンベデッドビジョンの使用に悪影響を及ぼしかねません。

さらにエンベデッドビジョンアプリケーションの採用と促進においては、IoT セキュリティも考慮されるべきです。一般的に、すべてのIoTデバイスはセキュリティ保護されなければなりません。スマートビジョンデバイスの使用における重大な問題や懸念点として、機密性の高い画像や映像の悪用があります。例えば、スマートカメラへの不正アクセスは、プライバシーの侵害だけでなく、より有害な結果に繋がることも考えられるのです。

エンドポイントでのビジョンAI利用

  • エンドポイントAIによって、膨大な撮影画像から複雑なインサイトを推論する画像処理ができます。
  • スマート画像デバイス内の機械学習や深層学習を使い、AIは膨大なユースケースを確認できます。
  • 最適なパフォーマンスを得るためには、エンベデッドビジョンはAIアルゴリズムをエンドポイントデバイス上で実行し、クラウドにデータを送信しないことが必要です。画像認識デバイスで取り込まれたデータは、同じデバイス内で処理・分析します。

しかしAI処理にかかる大量なMAC演算を行うには、より効率的なマイコンやマイクロプロセッサーが求められ、エンドポイントでの消費電力の制約を破る必要があります。

ビジョンAIアプリケーションの展開

AIをビジョンアプリケーションで展開するユースケースは、豊富にあります。ここでは、ルネサスが提供するMCUやMPUベースの包括的なソリューションと、迅速な開発を可能にする必須ソフトウェアやツールについてご紹介します。

スマートアクセスコントロール:音声と顔認識機能の登場により、セキュリティアクセス制御システムはその価値を高めています。リアルタイム認識には、高度な演算能力とオンチップ・ハードウェア・アクセラレーションを備えた組込み型システムが必要となります。そこでルネサスでは、MCUもしくはMPUというふたつの選択肢をご用意しています。内蔵H.265ハードウェア・デコーディング、2D/3Dグラフィックアクセラレーション、ソフトエラーを排除し高速ビデオ処理を可能にする内部および外部付きECCメモリなど、高性能な顔および音声認識システムに不可欠な主要機能を統合し、非常に高度な演算能力を誇ります。

産業用コントロール:製品の安全性、自動化、製品の仕分けなど、多くのアプリケーションに活用されるエンベデッドビジョンは大きな影響力を持っています。AI技術は、梱包や流通などの生産工程で複数の作業に使われ、あらゆる段階で生産時の品質と安全性を確かなものにします。重要なインフラ、倉庫、生産工場、建物など、高度な人的資源を必要とする建物では、安全性が求められます。

交通機関:コンピュータビジョンは、交通サービスを大幅に向上させる可能性を秘めています。例えば自動運転車では、道路上の物体の検出と分類にコンピュータビジョンが使用されています。さらに3Dマップの作成や周囲の動きを推論するためにも使用されています。つまり、コンピュータビジョンを使用し、カメラやセンサーで周囲の情報を収集します。そして、パターン認識、特徴の抽出、物体の追跡といった技術でデータを解釈・分析し、最適な対応を生み出すのです。

画像
Computer vision is used to detect and classify objects on the road

一般的に、あらゆる用途に活用できるのがエンベデッドビジョンの利点です。それには様々な分野の様々なタイプのデータセットに応じたカスタマイズと、必要とされる学習を伴います。エンベデッドビジョンでできることには、物理的な領域の監視、侵入の検知、群衆密度の検出、人間や物体、動物の認知機能などが挙げられます。また、人間の特定、ナンバープレートによる車の検知、動きの検出、様々なケースでの人の行動分析なども含みます。

ケーススタディ:農業での病害検知

ビジョンAIと深層学習の組み合わせは、様々な異常検知のために使われており、植物病害の検知はその一例です。AI技術のひとつ、深層学習アルゴリズムはこの目的を果たすために広く用いられています。研究によると、従来の手法のコストと時間がかかる労働集約的な結果に比べ、コンピュータビジョンのおかげでよりよい、正確かつ迅速で低コストな結果を得ることができます。

このケーススタディで用いられている処理方法は、他の検知でも同様に使われています。コンピュータ/マシンビジョン内における深層学習の利用には大きく3つのステップに分けられます。

画像
コンピュータ/マシンビジョン内における深層学習の利用の3つのステップ

ステップ1は研究室にある通常のコンピュータ上で行われ、ステップ2はファーム内にあるエンドポイント上のマイコンで展開します。ステップ3で判明する結果は、ユーザー側のスクリーンに表示されます。下図は、その流れを大まかに示したものです。

画像

結論:

現在、私たちはあらゆる分野で起きている、高性能なスマートビジョンアプリケーションによる革命の最中を生きています。エンドポイントにおけるマイクロコントローラやマイクロプロセッサの計算能力の向上によって生まれたこの傾向は、新たなビジョンアプリケーションの可能性を示唆しています。ルネサスのビジョンAIソリューションでは、エンドポイントにおけるインテリジェントなデータ処理を行う組み込み型AI技術の提供により、システム全体の能力を向上させています。低消費電力、マルチモーダル、マルチフィーチャーAI推論機能といったユニークな組み合わせから、エッジ上の高度な画像処理ソリューションが実現しているのです。今こそこのチャンスをつかみ、ルネサスエレクトロニクスとともにビジョンAIアプリケーションの開発を始めてみませんか。

この記事をシェアする