Cloud Pak for Data as a Service 上の Watson Speech サービス

説明

IBM® Cloud Pak for DataWatson Speech サービス は、アプリケーションの音声認識と音声合成の機能を提供します。

  • Watson Speech to Text for IBM Cloud Pak for Data は、発話音声から書かれたテキストを書き起こします。 このサービスは機械学習を活用して、文法、言語構造、および音声シグナルの構成に関する知識を組み合わせることで、人間の音声を正確に書き起こします。 このサービスは繰り返し更新されて、受け取る音声データが増えるほど書き起こし機能が向上します。 このサービスは、コール・センター、カスタム・ケア、エージェント・アシスタンス、および類似のソリューションなどのユース・ケースで高品質の音声書き起こしを抽出する必要があるアプリケーションに理想的です。

    サービスについて詳しくは、 Speech to Textについてを参照してください。

  • Watson Text to Speech for IBM Cloud Pak for Data は、記述されたテキストから自然に聞こえる音声を合成します。 このサービスでは、遅延を最小限に抑えて、結果がストリーミングでクライアントに戻されます。 このサービスは、画面のない音声主体のアプリケーション (優先される出力方式が音声であるアプリケーション) に適しています。

    サービスについて詳しくは、 Text to Speechについてを参照してください。

Watson Speech サービスをカスタマイズして、言語とアプリケーションのニーズに合わせることができます。 どちらのサービスも、音声を生成または受け入れるすべてのアプリケーションに適した HTTP および WebSocket プログラミング・インターフェースを提供します。

サービスは、 IBM Cloud で Cloud Pak for Data as a Service の外部で実行されるツールまたはその他のタイプのインターフェースを追加し、ノートブックで実行できる API を提供します。

クイック・リンク

統合サービス

表 1. 関連サービス以下の関連サービスは、多くの場合、このサービスと一緒に使用され、補完機能を提供しますが、必須ではありません。
サービス 機能
Watson Assistant 独自のブランドのアシスタントを任意のデバイス、アプリケーション、またはチャネル内に構築します。 実装したユーザー・インターフェースを介して、ユーザーはアプリケーションと対話します。