0 / 0
Go back to the English version of the documentation
Watson Speech services on Cloud Pak for Data as a Service
Last updated: 2024年12月13日
Watson Speech services on Cloud Pak for Data as a Service

描述

Watson Speech services 可为您的应用提供语音识别和语音合成功能:

  • Watson Speech to Text 从口语音频转录书面文本。 此服务利用机器学习来组合语法知识、语言结构以及音频和语音信号组合,从而精确地转录人声。 由于收到的语音音频越来越多,该服务将不断更新和优化其转录功能。 对于需要为用例 (例如,呼叫中心,定制护理,代理辅助和类似解决方案) 提取高质量语音文字记录的应用程序,该服务是理想的服务。

    有关该服务的更多信息,请参阅 "关于 "Watson Speech to Text

  • Watson Text to Speech 根据书面文字合成自然语音。 服务可在延迟极短的情况下将结果流式传输回客户机。 该服务适用于由语音驱动的无屏幕应用程序,其中输出的首选方式是音频。

    有关该服务的更多信息,请参阅 "关于 "Watson Text to Speech

您可以根据自己的语言和应用需求进行定制。 这两项服务都提供 HTTP 和 WebSocket 编程接口,适用于任何制作或接受音频的应用程序。

这些服务添加了在 Cloud Pak for Data as a Service 以外的 IBM Cloud运行的工具或其他类型的接口,并提供可在笔记本中运行的 API。

快速链接

集成服务

表 1. 相关服务以下相关服务通常与此服务配合使用,并提供补充功能,但它们不是必需的。
服务 功能
watsonx Assistant 在任意设备、应用程序或通道中构建您自有品牌的 Assistant。 用户通过您实现的用户界面与应用程序进行交互。
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more