Cloud Pak for Data as a Service 上の Watson Speech サービス
説明
IBM® Cloud Pak for Data の Watson Speech サービス は、アプリケーションの音声認識と音声合成の機能を提供します。
Watson Speech to Text for IBM Cloud Pak for Data は、発話音声から書かれたテキストを書き起こします。 このサービスは機械学習を活用して、文法、言語構造、および音声シグナルの構成に関する知識を組み合わせることで、人間の音声を正確に書き起こします。 このサービスは繰り返し更新されて、受け取る音声データが増えるほど書き起こし機能が向上します。 このサービスは、コール・センター、カスタム・ケア、エージェント・アシスタンス、および類似のソリューションなどのユース・ケースで高品質の音声書き起こしを抽出する必要があるアプリケーションに理想的です。
サービスについて詳しくは、 Speech to Textについてを参照してください。
Watson Text to Speech for IBM Cloud Pak for Data は、記述されたテキストから自然に聞こえる音声を合成します。 このサービスでは、遅延を最小限に抑えて、結果がストリーミングでクライアントに戻されます。 このサービスは、画面のない音声主体のアプリケーション (優先される出力方式が音声であるアプリケーション) に適しています。
サービスについて詳しくは、 Text to Speechについてを参照してください。
Watson Speech サービスをカスタマイズして、言語とアプリケーションのニーズに合わせることができます。 どちらのサービスも、音声を生成または受け入れるすべてのアプリケーションに適した HTTP および WebSocket プログラミング・インターフェースを提供します。
サービスは、 IBM Cloud で Cloud Pak for Data as a Service の外部で実行されるツールまたはその他のタイプのインターフェースを追加し、ノートブックで実行できる API を提供します。
クイック・リンク
統合サービス
サービス | 機能 |
---|---|
Watson Assistant | 独自のブランドのアシスタントを任意のデバイス、アプリケーション、またはチャネル内に構築します。 実装したユーザー・インターフェースを介して、ユーザーはアプリケーションと対話します。 |