サービスとしてのCloud Pak for Data 上の Watson Speech to Text

説明

IBM Watson Speech to Text for IBM Cloud Pak for Data では、アプリケーション用の音声認識機能が提供されます。 このサービスは機械学習を活用して、文法、言語構造、および音声シグナルの構成に関する知識を組み合わせることで、人間の音声を正確に書き起こします。 このサービスは繰り返し更新されて、受け取る音声データが増えるほど書き起こし機能が向上します。

Watson Speech to Text は各種のプログラミング・インターフェースを備えているため、音声を入力して書き起こしテキストを出力する、どのような用途にも対応できます。 以下のユース・ケースが考えられます。

  • アプリケーション、埋め込みデバイス、および車両装備品の音声制御
  • 会議や電話会議の書き起こし
  • E メール・メッセージやメモの口述筆記

このサービスは、コールセンターの音声から高品質の音声書き起こしを抽出する必要があるお客様に理想的なサービスです。 金融サービス、医療、保険、通信などの業界のお客様は、顧客ケア、顧客音声、エージェント支援などのソリューションとしてクラウド・ネイティブ・アプリケーションを開発できます。

このサービスは、Cloud Pak for Data as a Service の外部の IBM Cloud で実行されるツールまたはその他のタイプのインターフェースを追加し、ノートブックで実行できる API を提供します。

クイック・リンク

統合サービス

表 1. 関連サービス
サービス 機能
Watson Assistant 独自のブランドのアシスタントを任意のデバイス、アプリケーション、またはチャネル内に構築します。 実装したユーザー・インターフェースを介して、ユーザーはアプリケーションと対話します。
Watson Text to Speech 作成されたテキストをアプリケーション用の自然な音声に変換し、その結果を最小限の遅延でクライアントにストリーミングで返します。
Watson Language Translator テキストの言語を識別し、それをプログラムで別の言語に翻訳することができます。