音声認識は、既にロボット、スマートスピーカなどの多くの製品に搭載され、ヒューマン・インタフェースとして使用されています。
これら音声認識は、民生機器や産業機器においてコストをできるだけ抑えながら、より便利な機能を搭載したいというニーズから生まれたものです。
また、視覚障害者や高齢者も容易に操作が可能となるため、重要な付加機能の1つとして注目されています。
ルネサスでは、インターネット接続が不要な音声認識(エッジ音声認識)ソリューションを準備しており、従来製品との差別化や高機能化を実現できます。
(例) 主なノイズ低減技術
小型ボードで実現するエッジ音声認識ソリューション
購入可能なボードで評価ができる音声認識ソリューション
ECM(エレクトレットコンデンサマイク)を使用したコストパフォーマンスに優れたエッジ音声認識ソリューション
エッジ音声認識、音声再生、Bluetooth Low Energy、環境センシングを「RA4W1」1chipで実現するソリュ―ション
エッジ音声認識、静電容量タッチ、LCD制御を「RX671」1chipで実現するソリュ―ション。また、Wi-Fi Pmod™ 拡張ボードを使用することでクラウドを使用した遠隔操作を実現可能。
エッジ音声認識、音声再生、タッチパネル、環境センシングを「RA6M3」1chipで実現するソリュ―ション
小型ボードで実現するエッジ音声認識ソリューション
* RX231音声認識ソリューションのみ対応
RX231音声認識ソリューション | RX651音声認識ソリューション | RA6M1音声認識ソリューション | ||
---|---|---|---|---|
ハードウェア | 搭載MCU | RX231 (R5F52318ADFL) ROM/RAM:512KB/64KB パッケージ:48 ピンLQFP |
RX651 (R5F5651EDDFM) ROM/RAM:2MB/640KB パッケージ: 64 ピンLFQFP |
RA6M1 (R7FA6M1AD3CFM) ROM/RAM:512KB/256KB パッケージ: 64 ピンLQFP |
マイク | デジタルMEMSマイク x2個 | アナログMEMSマイク x2個 | アナログMEMSマイク x2個 | |
その他機能 | 赤外線通信、RGB LED、USB(Full Speed)、プッシュスイッチ | RGB LED、USB(Full Speed)、プッシュスイッチ | RGB LED、USB(Full Speed)、プッシュスイッチ | |
サイズ | 60mm x 40mm | 60mm x 40mm | 60mm x 40mm | |
ソフトウェア | OS | 未使用 | 未使用 | 未使用 |
ミドルウェア | アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス |
アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス |
アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス |
|
- | 東芝デジタルソリューションズ/RECAIUS™ ボイストリガー テクノマセマティカル /ズームボイス |
東芝デジタルソリューションズ/RECAIUS™ ボイストリガー テクノマセマティカル /ズームボイス |
ハードウェア | ソフトウェア(ソースコード&アプリケーションノート)、 音声認識評価ツール |
|
---|---|---|
RX231音声認識ソリューション | RX231 グループ 音声認識デモボード Rev.1.01 (PDF | English, 日本語) | 弊社営業にお問合せください |
RX651音声認識ソリューション | RX651 グループ 音声認識デモボード (PDF | English, 日本語) | |
RA6M1音声認識ソリューション | RA6M1 グループ 音声認識デモボード (PDF | English, 日本語) |
購入可能なボードで実現する音声認識ソリューション
RX671 音声認識ソリューション | RX72N 音声認識ソリューション | ||
---|---|---|---|
ハードウェア | Renesas Starter Kit+ for RX671 (型名:RTK55671EHS10000BE)
|
RX72N Envision Kit (型名:RTK5RX72N0C00000BJ)
|
|
ソフトウェア | OS | 未使用 | 未使用 |
ミドルウェア | アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス |
アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス |
|
東芝デジタルソリューションズ/RECAIUS™ ボイストリガー テクノマセマティカル /ズームボイス |
東芝デジタルソリューションズ/RECAIUS™ ボイストリガー テクノマセマティカル /ズームボイス |
項目 | 備考 |
---|---|
RX671 グループ 音声認識デモンストレーション(AmiVoice Micro) Rev.1.00 - サンプルコード (ZIP | English, 日本語) | 対応言語:日本語、英語 サンプルソースおよび評価ツールの入手方法は、弊社営業にお問合せください |
RX671 グループ 音声認識デモンストレーション(ボイストリガーミドルウェア) | 準備中 |
RX72N グループ 音声認識デモンストレーション(AmiVoice Micro) Rev.1.00 - サンプルコード (ZIP | English, 日本語) | 対応言語:日本語、英語 サンプルソースおよび評価ツールの入手方法は、弊社営業にお問合せください |
RX72N グループ 音声認識デモンストレーション(ボイストリガーミドルウェア) | 準備中 |
ECM(エレクトレットコンデンサマイク)を使用したコストパフォーマンスに優れたエッジ音声認識ソリューション
RA4M2 ECM音声認識ソリューション | ||
---|---|---|
ハードウェア | MCU | RA4M2 (R7FA4M2AD3CFL) ROM/RAM:512KB/128KB パッケージ: 48ピンLQFP |
オペアンプ | READ2303G | |
マイク | エレクトレットコンデンサマイク x1個 | |
その他機能 | RGB LED、USB(Full Speed)、プッシュスイッチ | |
サイズ | 60mm x 40mm | |
ソフトウェア | OS | 未使用 |
ミドルウェア | アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス |
|
東芝デジタルソリューションズ/RECAIUS™ ボイストリガー テクノマセマティカル /ズームボイス |
項目 | 備考 |
---|---|
RA4M2 グループ 音声認識ECMデモボード (PDF | English, 日本語) | デモボードの入手方法は、弊社営業にお問合せください |
RA4M2 グループ 音声認識デモボードサンプルソフトウェア | 入手方法は、弊社営業にお問合せください |
項目 | 備考 |
---|---|
RA4M2 グループ 音声認識デモンストレーション(AmiVoiceMicro) Rev.1.00 (PDF | English, 日本語) | 対応言語:日本語、英語、中国語(標準語) |
RA4M2 グループ 音声認識デモンストレーション(ボイストリガーミドルウェア) Rev.1.00 (PDF | English, 日本語) | 対応言語:日本語、英語(アメリカ英語)、中国語(標準語) |
エッジ音声認識、音声再生、Bluetooth Low Energy、環境センシングを「RA4W1」1chipで実現するソリュ―ション
RA4W1 音声認識 + Bluetooth Low Energy通信ソリューション | ||
---|---|---|
ハードウェア | EK-RA4W1 |
|
HMI Expansion Board | ||
ソフトウェア | OS | 未使用 |
ミドルウェア | アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス CRI・ミドルウェア/かるイイ音 |
|
東芝デジタルソリューションズ/ボイストリガー CRI・ミドルウェア/かるイイ音 ※ 音声再生ファイルは、東芝デジタルソリューションズ/RECAIUS 音声合成ミドルウェア ToSpeak™で作成 |
項目 | 備考 |
---|---|
RA4W1 音声認識 + Bluetooth Low Energyデモボード | 入手方法は、弊社営業にお問合せください |
RA4W1 音声認識 + Bluetooth Low Energyデモボードサンプルソフトウェア |
提供物 | 備考 |
---|---|
RA4W1 グループ 音声認識デモンストレーション(AmiVoiceMicro) (PDF | English, 日本語) | 対応言語:日本語、英語 |
RA4W1 グループ 音声認識デモンストレーション(ボイストリガーミドルウェア) (PDF | English, 日本語) | 対応言語:日本語、英語(アメリカ英語)、中国語(標準語) |
エッジ音声認識、静電容量式タッチ、LCD制御を「RX671」1chipで実現するソリュ―ション。また、Wi-Fi Pmod™ 拡張ボードを使用することでクラウドを使用した遠隔操作を実現可能。
RX671 音声認識・タッチ・クラウドデモ | ||
---|---|---|
ハードウェア | Renesas Starter Kit+ for RX671 |
|
|
||
ソフトウェア | OS | Amazon FreeRTOS |
ミドルウェア | アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス |
|
東芝デジタルソリューションズ/RECAIUS™ ボイストリガー(準備中) |
エッジ音声認識、音声再生、タッチパネル、環境センシングを「RA6M3」1chipで実現するソリュ―ション
RA6M3 HMIソリューション | ||
---|---|---|
ハードウェア | EK-RA6M3G |
|
HMI Expansion Board | ||
ソフトウェア | OS | Amazon Free RTOS |
ミドルウェア | アドバンスト・メディア/AmiVoice Micro テクノマセマティカル /ズームボイス CRI・ミドルウェア/かるイイ音 |
|
東芝デジタルソリューションズ/ボイストリガー テクノマセマティカル /ズームボイス CRI・ミドルウェア/かるイイ音 ※ 音声再生ファイルは、東芝デジタルソリューションズ/RECAIUS 音声合成ミドルウェア ToSpeak™で作成 |
ハードウェア | ソフトウェア(ソースコード&アプリケーションノート)、 音声認識評価ツール |
|
---|---|---|
RA6M3 HMIソリューション | RA6M3 グループ RA6M3 HMI 拡張ボード (PDF | English, 日本語) | 弊社営業にお問合せください |
PCに評価ボードと接続することで以下の機能を実現可能
従来製品にくらべ、低クロック、省メモリ環境での音声認識をインターネット接続なしで実現
対応MCU
ルネサスコア:
ARMコア:
モデル | 必要なメモリサイズ | 対応言語 |
---|---|---|
通常版 | ROM: 33[KB]~, RAM: 23[KB]~ | 日本語、英語、中国語(標準語)、タイ語、韓国語 |
高認識版 | ROM: 482[KB]~, RAM: 23 [KB]~ | 日本語 |
語彙数 | 通常版 | 高認識版 | ||
---|---|---|---|---|
ROM [KB] | RAM [KB] | ROM [KB] | RAM [KB] | |
5 | 33 | 23 | 482 | 23 |
10 | 54 | 25 | 681 | 25 |
20 | 78 | 28 | 995 | 28 |
30 | 96 | 30 | 1,226 | 30 |
40 | 109 | 33 | 1,444 | 33 |
50 | 117 | 33 | 1,587 | 33 |
100 | 143 | 46 | 2,143 | 46 |
150 | 160 | 55 | 2,452 | 55 |
※ 本データは参考値です (言語や認識ワードの内容により増減します)
※ 高認識版は、通常版と比較してROM使用量、計算量が多くなりますが認識精度が向上します。
音声から人の声のみの区間を検出するモジュールが含まれており、利用シーンやタスクに応じて検出感度調整が可能。
エッジ単独での音声操作を実現。音声収録なく検出する語彙(キーワード)を変更することができるので、比較的容易に独自の起動・操作コマンドを実装可能。
対応MCU
ルネサスコア:
ARMコア:
対応言語:日本語、英語(アメリカ英語)、中国語(標準語)
製品化予定(評価利用可能): カナダフランス語、アメリカスペイン語、イギリス英語、フランス語、ドイツ語、スペイン語、イタリア語
語彙数 | ROM [KB] | RAM [KB] |
---|---|---|
5 | 145 | 45 |
10 | 160 | 50 |
20 | 190 | 65 |
※ 上表の数値は参考値です。言語や語彙によって数値は変化します。
2種類のノイズ低減技術をサポート
ビームフォーミング
ノイズサプレッサ
DSP命令に対応した高速処理版を準備
DSP命令対応版の処理速度は、通常版と比較して30%向上
対応MCU
DSP命令対応版:ルネサスコア:
通常版:
ノイズ低減技術 | 必要なメモリサイズ |
---|---|
ビームフォーミング | ROM: 40KB, RAM: 10KB |
ノイズサプレッサ | ROM: 40KB, RAM: 10KB |
ズームボイスを使用することによりノイズ環境下でも高い認識率を実現できます。
特にS/N比=5[dB]以下で非常に高い効果が期待できます。
ノイズ環境下でズームボイスを使用した際の認識率(音声認識は、AmiVoice Microを使用)
※1. ノイズ源は、掃除機、洗濯機の音を使用
※2. ルネサス調べ
音声認識ソフトウェア製品の開発および販売
Contact: https://www.advanced-media.co.jp/contact/total/
TEL:03-5958-1031(代表電話)
システムインテグレーション及びIoT/AIを活用したICTソリューションの開発・製造・販売
Contact: https://www.toshiba-sol.co.jp/pro/recaius/contact.html
Email: [email protected]
ルネサスのLab on the Cloud は、ルネサスの定評ある評価ボード、ウィニング・コンビネーション、ソフトウェアといったソリューションを、ユーザがオンラインでアクセスしてテストできるリモート開発環境です。
このリファレンスデザインは、音声コマンドを認識し、対応する操作を開始します。 高性能なArm® Cortex®-M4コア搭載のRA6M1 MCUを採用しています。
|
|
|
---|---|---|
分類 | タイトル | 日時 |
サンプルコード |
ZIP
2.09 MB
英語
アプリケーション:
キーテクノロジー
Compiler:
CC-RX
Function:
Communication Interface
IDE:
e2 studio
|
|
サンプルコード |
ZIP
3.30 MB
アプリケーション:
キーテクノロジー, 民生機器全般, 産業用機器
Compiler:
CC-RX
Function:
Communication Interface, HMI
IDE:
e2 studio
|
|
サンプルコード |
ZIP
3.30 MB
英語
アプリケーション:
キーテクノロジー
Compiler:
CC-RX
Function:
Communication Interface
IDE:
e2 studio
|
|
3 items
|
本ビデオは、RX660を搭載する音声認識ボードを紹介します。ボード情報、ツールや実際に使用される場所で評価結果等を提示します。