ページの本文へ

Hitachi

株式会社 日立ソリューションズ・テクノロジー

多言語音声認識・音声合成「Ruby Box」

音声による入力・操作・確認が可能で、現場の作業効率向上やサービス向上を実現します。
音声による遠隔指示や自動音声ガイドにより、非接触・非対面な作業・接客シーンを実現します。

ご利用シーン/適用事例

「Ruby Box」ご利用シーン

特長

多言語音声認識・音声合成を標準搭載

日本語、英語、中国語、韓国語に対応、最大13言語まで拡張が可能です。
施設構内アナウンス・デジタルサイネージの多言語案内用途に最適です。

音声入力・音声合成でハンズフリーを実現

作業時の目や手が離せない状況下でも、音声で作業指示のやり取りと作業結果の記録が可能になります。作業ミス防止と作業効率向上に繋がります。

通信ができない環境でも利用可能

Windowsタブレットによるスタンドアロン型の動作が可能です。このため、地下室・山の奥など通信できない場所でも利用可能です。

用途に応じての辞書登録・編集は可能

用途に応じて、音声認識、音声合成の辞書範囲を簡単に限定させることが可能です。
用途に関係ない誤認識の動作を防ぐ効果に繋がります。

対応言語

「Ruby Box」対応言語
対応 言語
   
標準対応 日本語、英語、中国語、韓国語
オプション イギリス英語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語、タイ語、広東語(香港語)、台湾語

推奨動作環境

推奨動作環境
ハードウェア CPU Intel Celeron®プロセッサ 1.5GHz Dual以上
RAM 使用可能領域1GB以上
ストレージ容量 使用可能領域3GB以上
NIC 1ポート以上のEthernetカード(100Mbps以上)
※ローカルでTCP/IPプロトコルを利用
ソフトウェア 対応OS Microsoft Windows10 Professional 64bit版
.NET Framework .NET Framework ver.4.5.2

ハードウェア

推奨動作環境(ハードウェア)
   
CPU Intel Celeron®プロセッサ 1.5GHz Dual以上
RAM 使用可能領域1GB以上
ストレージ容量 使用可能領域3GB以上
NIC 1ポート以上のEthernetカード(100Mbps以上)
※ローカルでTCP/IPプロトコルを利用

ソフトウェア

推奨動作環境(ソフトウェア)
   
対応OS
  • Microsoft Windows7 Professional SP1 64bit版
  • Microsoft Windows10 Professional 64bit版
.NET Framework .NET Framework ver.4.5.2

入出力データ仕様

入出力データ仕様
音声認識 音声発話データ
  • リニアPCM(pulse code modulation)形式データ
  • 標本化周波数:16kHz
  • 量子化:16bit モノラル
語彙データ
(グラマ)
  • テキストデータ
  • 文字コード:UTF-8
  • 表記文字列:最大200バイト
  • 書記素文字列:最大200バイト
音声認識結果
  • テキストデータ
  • 文字コード:UTF-8
音声合成 音声合成対象
テキスト
  • プレーンテキストまたはJEITA中間言語テキスト
  • 文字コード:UTF-8
  • 最大1000バイト(終端文字('\0')含まない)
  • ※JEITA中間言語テキスト入力は、日本語のみ対応
出力音声データ
  • リニアPCM(pulse code modulation)形式データ
  • 標本化周波数:22kHz
  • 量子化:16bit モノラル
音声合成話者 各言語女性話者

音声認識

入出力データ仕様(音声認識)
   
音声発話データ
  • リニアPCM(pulse code modulation)形式データ
  • 標本化周波数:16kHz
  • 量子化:16bit モノラル
語彙データ(グラマ)
  • テキストデータ
  • 文字コード:UTF-8
  • 表記文字列:最大200バイト
  • 書記素文字列:最大200バイト
音声認識結果
  • テキストデータ
  • 文字コード:UTF-8

音声合成

入出力データ仕様(音声合成)
   
音声合成対象テキスト
  • プレーンテキストまたはJEITA中間言語テキスト
  • 文字コード:UTF-8
  • 最大1000バイト(終端文字('\0')含まない)
  • ※JEITA中間言語テキスト入力は、日本語のみ対応
出力音声データ
  • リニアPCM(pulse code modulation)形式データ
  • 標本化周波数:22kHz
  • 量子化:16bit モノラル
音声合成話者 各言語女性話者

プロフェッショナルサービス

「Ruby Box」をお客様システムでお使いいただくためのサービスです。
必要な情報をご提示頂いた上で御見積りとさせていただきます。

「Ruby Box」サービスメニュー
   
音声インターフェース
プログラム作成
「Ruby Box」インターフェースまでのインターフェースプログラムを作成します。
音声認識
辞書カスタマイズ
音声認識の辞書カスタマイズを行います。
(単語フレーズ登録)
音声合成
辞書カスタマイズ
音声合成の辞書カスタマイズ(アクセント、読みなどを含めた単語登録)を行います。

採用事例

株式会社トヨタプロダクションエンジニアリング様

2020年8月より発売開始となったトヨタプロダクションエンジニアリング様の
「Excel音声入力システム for Ruby Box」に「Ruby Box」が採用されました。

「Ruby Box」採用事例

ダウンロード

Adobe Readerのダウンロード
PDF形式のファイルをご覧になるには、Adobe Systems Incorporated (アドビシステムズ社)のAdobe® Reader®が必要です。

商標注記

  • Windowsは、米国Microsoft Corporationの米国およびその他の国における登録商標または商標です。
  • Celeronは、米国Intel Corporationの米国およびその他の国における登録商標または商標です。
  • Ethernetは、富士ゼロックス株式会社の登録商標または商標です。
  • 「Ruby Box」は、株式会社日立ソリューションズ・テクノロジーの登録商標です。

お問い合わせ

本件に関する詳細について、フォームからお問い合わせいただけます。

お問い合わせフォーム