ページの本文へ

Hitachi

株式会社 日立ソリューションズ・テクノロジー

多言語音声認識・音声合成「Ruby Boxソフトウェア」

声による入力・操作・確認を実現。音声認識による作業効率化、ミス低減が可能です。
鉄道、公共施設など各種アナウンス用音声合成としてもご利用いただけます。

ご利用シーン/適用事例

「Ruby Boxソフトウェア」ご利用シーン

特長

多言語音声認識・音声合成を標準搭載

日本語、英語、中国語、韓国語に対応、最大13言語まで拡張が可能です。
施設構内アナウンス・デジタルサイネージの多言語案内用途に最適です。

音声入力・音声合成でハンズフリーを実現

作業時の目や手が離せない状況下でも、音声で作業指示のやり取りと作業結果の記録が可能になります。作業ミス防止と作業効率向上に繋がります。

通信ができない環境でも利用可能

Windowsタブレットによるスタンドアロン型の動作が可能です。このため、地下室・山の奥など通信できない場所でも利用可能です。

用途に応じての辞書登録・編集は可能

用途に応じて、音声認識、音声合成の辞書範囲を簡単に限定させることが可能です。
用途に関係ない誤認識の動作を防ぐ効果に繋がります。

対応言語

「Ruby Boxソフトウェア」対応言語
対応 言語
   
標準対応 日本語、英語、中国語、韓国語
オプション イギリス英語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語、タイ語、広東語(香港語)、台湾語

推奨動作環境

推奨動作環境
ハードウェア CPU Intel Celeron®プロセッサ 1.5GHz Dual以上
RAM 使用可能領域1GB以上
ストレージ容量 使用可能領域3GB以上
NIC 1ポート以上のEthernetカード(100Mbps以上)
※ローカルでTCP/IPプロトコルを利用
ソフトウェア 対応OS
  • Microsoft Windows7 Professional SP1 64bit版
  • Microsoft Windows10 Professional 64bit版
.NET Framework .NET Framework ver.4.5.2

ハードウェア

推奨動作環境(ハードウェア)
   
CPU Intel Celeron®プロセッサ 1.5GHz Dual以上
RAM 使用可能領域1GB以上
ストレージ容量 使用可能領域3GB以上
NIC 1ポート以上のEthernetカード(100Mbps以上)
※ローカルでTCP/IPプロトコルを利用

ソフトウェア

推奨動作環境(ソフトウェア)
   
対応OS
  • Microsoft Windows7 Professional SP1 64bit版
  • Microsoft Windows10 Professional 64bit版
.NET Framework .NET Framework ver.4.5.2

入出力データ仕様

入出力データ仕様
音声認識 音声発話データ
  • リニアPCM(pulse code modulation)形式データ
  • 標本化周波数:16kHz
  • 量子化:16bit モノラル
語彙データ
(グラマ)
  • テキストデータ
  • 文字コード:UTF-8
  • 表記文字列:最大200バイト
  • 書記素文字列:最大200バイト
音声認識結果
  • テキストデータ
  • 文字コード:UTF-8
音声合成 音声合成対象
テキスト
  • プレーンテキストまたはJEITA中間言語テキスト
  • 文字コード:UTF-8
  • 最大1000バイト(終端文字('\0')含まない)
  • ※JEITA中間言語テキスト入力は、日本語のみ対応
出力音声データ
  • リニアPCM(pulse code modulation)形式データ
  • 標本化周波数:22kHz
  • 量子化:16bit モノラル
音声合成話者 各言語女性話者

音声認識

入出力データ仕様(音声認識)
   
音声発話データ
  • リニアPCM(pulse code modulation)形式データ
  • 標本化周波数:16kHz
  • 量子化:16bit モノラル
語彙データ(グラマ)
  • テキストデータ
  • 文字コード:UTF-8
  • 表記文字列:最大200バイト
  • 書記素文字列:最大200バイト
音声認識結果
  • テキストデータ
  • 文字コード:UTF-8

音声合成

入出力データ仕様(音声合成)
   
音声合成対象テキスト
  • プレーンテキストまたはJEITA中間言語テキスト
  • 文字コード:UTF-8
  • 最大1000バイト(終端文字('\0')含まない)
  • ※JEITA中間言語テキスト入力は、日本語のみ対応
出力音声データ
  • リニアPCM(pulse code modulation)形式データ
  • 標本化周波数:22kHz
  • 量子化:16bit モノラル
音声合成話者 各言語女性話者

プロフェッショナルサービス

「Ruby Boxソフトウェア」をお客様システムでお使いいただくためのサービスです。
必要な情報をご提示頂いた上で御見積りとさせていただきます。

「Ruby Boxソフトウェア」サービスメニュー
   
音声インターフェース
プログラム作成
「Ruby Boxソフトウェア」インターフェースまでのインターフェースプログラムを作成します。
音声認識
辞書カスタマイズ
音声認識の辞書カスタマイズを行います。
(単語フレーズ登録)
音声合成
辞書カスタマイズ
音声合成の辞書カスタマイズ(アクセント、読みなどを含めた単語登録)を行います。

ダウンロード

Adobe Readerのダウンロード
PDF形式のファイルをご覧になるには、Adobe Systems Incorporated (アドビシステムズ社)のAdobe® Reader®が必要です。

商標注記

  • Windowsは、米国Microsoft Corporationの米国およびその他の国における登録商標または商標です。
  • Celeronは、米国Intel Corporationの米国およびその他の国における登録商標または商標です。
  • Ethernetは、富士ゼロックス株式会社の登録商標または商標です。
  • 「Ruby Box」は、株式会社日立ソリューションズ・テクノロジーの登録商標登録です。