ページの本文へ

Hitachi
お問い合わせお問い合わせ

多言語音声コマンド認識ソフトウェア「Ruby Spotter」

組込み機器向け多言語音声コマンド認識(単語認識)ソフトウェアです。
低リソースのプラットフォーム上で動作可能です。
高いノイズ耐性を要求される車載機器から民生機器、産業機器などにわたる幅広い用途でご使用いただけます。

利用シーン

カーナビゲーション

カーナビゲーションでの音声入力時の
ウェイクアップワード機能

スマートホームのパネル端末

スマートデバイス機器へのハンズフリー入力

ドライブレコーダーや電子ミラー

ロードノイズ、風切り音、音楽再生などの
車内ノイズ下での音声操作

掃除ロボットなどの民生機器
高所作業
手の届かない機器への音声操作

「Ruby Spotter」の特長

高いノイズ耐性と音声認識性能

  • 走行中の自動車内や騒音下の工場の中でも高い認識精度を確保

低リソースのプラットフォーム上で動作可能

  • ROMサイズ230KB、RAMサイズ170KBで動作可能
  • 各種OS(Android、Linux, Windows, iOS, 各種リアルタイムOS)で動作可能
  • CPU負荷、60MIPSで動作可能。SIMD命令使用では35MIPSで動作可能
  • 固定小数点で演算しているため、浮動小数点演算器の必要はありません

ネットワークとの接続は不要

  • ローカル音声認識アルゴリズムなためローカルの環境で実行可能

Phonemeベースのモデリングを採用

  • コマンドのカスタマイズが容易
  • 認識エンジンとコマンドモデルは分離しているため、コマンドモデルの動的な切り替えが可能

ウェイクアップワードとしても利用可能

  • 音声コマンド以外にボイストリガー(ウェイクアップワード)としての利用も可能

40言語以上に対応

  • 日本語、英語、中国語(北京語)、中国語(広東語)、韓国語、イギリス英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語、台湾語、ベトナム語、ヒンディー語、他
*
上記以外はお問い合わせください。

日本語/英語の同時待ち受けが可能

  • 日本語辞書と英語辞書の切り替え無しに同時待ち受けが可能

推奨動作環境

推奨動作環境

ハードウェア

ROM 約230KB以上
RAM 約170KB以上

対応OS

Android、Linux, Windows, iOS, 各種リアルタイムOS(OS非依存)
性能 CPU負荷 約60MIPSまたは約35MIPS(*1)
*1
:SIMD命令利用時

推奨動作環境:ルネサス エレクトロニクス製マイクロコントローラ「RAファミリ」他

入出力データ仕様

入出力データ仕様
音声認識 音声発話データ
  • リニアPCM(pulse code modulation)形式データ
  • サンプリング周波数:16kHz
  • 量子化:16bit モノラル
コマンドデータ テキストをツールで設定しデータ作成
音声認識結果 コマンドに対応したIDを出力

ご提供の流れ

プロフェッショナルサービスによりお客さまシステムへの最適な組込みをサポートします。

開発フェーズ

  • ポーティング:お客さま環境(CPU、OS、エンディアン、他)への組込み作業
  • コマンド辞書開発:コマンド辞書作成、評価サポート
  • 認識率評価:認識率評価、認識率チューニングと音声関連のシステムテストなど
  • 音声HMI開発:「Ruby Spotter」インターフェースと音声HMIのプログラム開発(要件定義からシステムテストまで)

量産フェーズ

  • 量産にあたっては使用許諾契約の締結が必要となります。

ダウンロード

注記

  • Androidは、Google Inc.の商標または登録商標です。
  • Linuxは、LinusTorvalds氏の米国およびその他の国における登録商標または商標です。
  • Windowsは、米国Microsoft Corporationの米国およびその他の国における登録商標または商標です。
  • iOSは、Apple Inc.の登録商標または商標です。
  • 「Ruby Spotter」は、株式会社日立ソリューションズ・テクノロジーの登録商標です。

お問い合わせ

本件に関する詳細について、フォームからお問い合わせいただけます。

お問い合わせフォーム