ページの本文へ

Hitachi

株式会社 日立ソリューションズ・テクノロジー

コンタクトセンター向け「Ruby Dictation」

高い音声認識率とAIを活用した追加学習機能でコンタクトセンターの業務改善を支援します。

製品概要

  • 発話音声をリアルタイムに高い精度でテキスト化
  • 業務の進行を止めることなく、専門性の高い単語を容易に学習可能
  • システムのハードウェアリソース低減を実現

利用シーン

他周辺サービス(要約/対話分析/FAQ作成等)と連携することにより、新たなサービスを生み出すことが可能

製品特長

高い音声認識率

  • 2018年に音声認識国際評価イベントCHiME-5にて、世界2位の評価を得た技術を採用
  • 予めさまざまな環境の音声で音響モデルを構築し、雑音や反響音を含んだ音声でも高い認識率を維持

オンプレミスで提供

  • 高い秘匿性を必要とする音声データを閉じた環境でテキスト化することで、機密情報の流出を抑止
  • 顧客システムと連携可能で、音声テキストをリアルタイムに顧客システムに反映

AI活用による言語モデルへの高速適応手法

  • 誤認識したテキスト部の修正により、言語モデルへ即座に反映可能
  • 業務内容、利用シーンに合わせた辞書切り替えを業務を止めることなく、実施可能
  • 専門用語登録のみで、適応する文脈を自動的に推測し、正しい認識が可能

低リソース化

  • 高い音声認識率を維持しつつ、モデルサイズの削減が可能な手法の開発により、CPU負荷50%を実現
  • 複数チャネルによる音声認識に対応

提供範囲

注:製品にハードウエア、OS等は含まれていません。クライアントアプリはお客さまで開発が必要となります。

提供内容

項目 内容 構成
製品 Ruby Dictation DVD-ROMメディア(音声認識エンジン、言語モデル、音響モデル、Web-IF)
保守(有償) 年間保守サービス アップデートメディア提供、問い合わせ対応
プロフェッショナルサービス(有償) セットアップ ご購入後のセットアップ作業支援
カスタム言語モデル構築 専門用語や固有名詞など追加学習し、カスタム言語モデルを提供

製品仕様

項目 仕様 備考
音声認識 リアルタイムの連続音声認識に対応 認識結果は、タイムスタンプ、形態素名、信頼度等を含んだ、メタ情報も取得可
入力音声データフォーマット PCM(16bit/16kHz/モノラル)、μ-law  
対応言語 日本語  
動作OS Linux(RHEL 7.8/8.1、CentOS 7.8/8.1)  
CPU Intel Xeon Silver 2.1GHz以上  
RAM 16GB以上 同時音声認識チャネル数に依存
ストレージ 使用可能領域 32GB以上  

ダウンロード

Adobe Readerのダウンロード
PDF形式のファイルをご覧になるには、Adobe Systems Incorporated (アドビシステムズ社)のAdobe® Reader®が必要です。

注記

  • 「Ruby Dictation」は、株式会社日立ソリューションズ・テクノロジーの登録商標です。
  • その他、記載の会社名、製品名は、それぞれの会社の商号、商標または登録商標です。
  • 本文中および図中では、™マーク、®マークは表記しておりません。
  • 製品の仕様は、予告なく変更する場合があります。