ページの本文へ

Hitachi
お問い合わせお問い合わせ

多言語音声認識・音声合成「Ruby Box2」

音声による入力・操作・確認が可能で、現場の作業効率向上やサービス向上を実現します。
音声による遠隔指示や自動音声ガイドにより、手を使わずに操作が可能となります。

利用シーン

製造工場での点検業務

騒音の多い工場内での音声による操作

高所での作業

道具を持ったり、手袋をはめた状況下での作業

公共交通機関
公共交通機関
駅構内の騒がしい環境での音声操作

ロボットの音声機能
高所作業
ロボットの音声や音声コマンド入力

製造現場での活用例:日立ソリューションズ・テクノロジー「VCIM-PA」音声認識デモンストレーション

「VCIM-PA」音声認識デモンストレーション

「Ruby Box2」の特長

多言語の音声認識・合成に対応

日本語、英語に対応。音声認識(37言語)および音声合成(65言語)まで拡張が可能

ノイズに強く、ルールグラマベースの音声認識(単語)を搭載

95dBの環境での実績あり

肉声に近く流暢な音声合成を実現

文脈を自動的に推測し、人間らしい自然なイントネーションを実現

通信ができない環境でも利用可能

スタンドアロン型で搭載が可能。オフラインで動作するため、ネットワークに接続することが難しい環境下で利用可能

90dB:騒々しい工場内 100dB:電車が通るときのガード下

対応言語

「Ruby Box2」対応言語
対応 言語
標準 日本語、英語
オプション 中国語(北京語)、中国語(広東語)、韓国語、イギリス英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語、台湾語、タイ語、ほか
*上記にない言語はお問い合わせください。

動作環境

動作環境
CPU arm64/x86_64 1.5GHz以上
メモリ容量 約70MB〜1GB
ストレージ 約40MB
動作OS Windows/Android
*その他のOSはお問い合わせ下さい

入出力データ仕様

入出力データ仕様
音声認識 認識対象 単語認識、数字認識、大語彙に対応
入力フォーマット リニアPCM(pluse code modulation)形式データ
サンプリング周波数:16kHz、16bit モノラル
認識結果 テキスト:UTF-8
音声合成 入力フォーマット プレーンテキストまたはJEITA中間言語テキスト
文字コード:UTF-8 最大1000バイト
*JEITA中間言語テキスト入力は、日本語のみ対応
出力フォーマット リニアPCM(pluse code modulation)形式データ
サンプリング周波数:22kHz、16bit モノラル

プロフェッショナルサービス

「Ruby Box2」をお客さまシステムでお使いいただくためのサービスです。
必要な情報をご提示いただいた上で御見積りします。

プロフェショナルサービス
音声HMI開発 「Ruby Box2」インターフェースと音声HMIのプログラム開発
(要件定義からシステムテストまで)
音声認識
コマンドカスタマイズ
音声認識コマンド設定、評価サポート
音声合成
辞書カスタマイズ
音声合成の辞書カスタマイズ(アクセント、読みなどを含めた単語登録)を行います
その他 認識率評価、認識率チューニングと音声関連のシステムテストなど

導入の流れ

音声インタフェースの開発/認識辞書作成、評価サポート/認識性能チューニング→量産開発(お客さま)→量産(使用許諾契約書の締結が必要となります)

ダウンロード

商標注記

  • Androidは、Google Inc.の商標または登録商標です。
  • Windowsは、米国Microsoft Corporationの米国およびその他の国における登録商標または商標です。
  • 「Ruby Box」は、株式会社日立ソリューションズ・テクノロジーの登録商標です。

お問い合わせ

本件に関する詳細について、フォームからお問い合わせいただけます。

お問い合わせフォーム