Watson Speech servicesONCloud Pak for Data as a Service

説明

Watson Speech services for IBM Cloud Pak® for Data は、アプリケーションに対して音声認識機能と音声合成機能を提供します。

Watson Speech to Text for IBM Cloud Pak for Data は、発話音声から書き込まれたテキストを書き起こします。このサービスは機械学習を活用して、文法、言語構造、および音声シグナルの構成に関する知識を組み合わせることで、人間の音声を正確に書き起こします。このサービスは繰り返し更新されて、受け取る音声データが増えるほど書き起こし機能が向上します。このサービスは、コール・センター、カスタム・ケア、エージェント・アシスタンス、および類似のソリューションなどのユース・ケースで高品質の音声書き起こしを抽出する必要があるアプリケーションに理想的です。

サービスについて詳しくは、 Watson Speech to Textについてを参照してください。
Watson Text to Speech for IBM Cloud Pak for Data は、記述されたテキストから自然に聞こえる音声を合成します。このサービスでは、遅延を最小限に抑えて、結果がストリーミングでクライアントに戻されます。このサービスは、画面のない音声主体のアプリケーション (優先される出力方式が音声であるアプリケーション) に適しています。

サービスについて詳しくは、 Watson Text to Speechについてを参照してください。

Watson Speech サービスをカスタマイズして、言語とアプリケーションのニーズに合わせることができます。どちらのサービスも、HTTP および WebSocket プログラミング・インターフェースを提供します。これらのインターフェースは、音声を生成または受け入れるすべてのアプリケーションに適しています。

サービスは、 IBM Cloud で Cloud Pak for Data as a Service の外部で実行されるツールまたはその他のタイプのインターフェースを追加し、ノートブックで実行できる API を提供します。

クイック・リンク

使用: サービスの処理
開発: コードの作成とアプリケーションの作成
新機能: 各週の新機能について
作成: サービス・インスタンスの作成

統合サービス

表 1. 関連サービス。以下の関連サービスは、多くの場合、このサービスと一緒に使用され、補完機能を提供しますが、必須ではありません。
サービス	機能
watsonx Assistant	独自のブランドのアシスタントを任意のデバイス、アプリケーション、またはチャネル内に構築します。実装したユーザー・インターフェースを介して、ユーザーはアプリケーションと対話します。