Volver a la versión inglesa de la documentaciónWatson Speech services on Cloud Pak for Data as a Service
Watson Speech services on Cloud Pak for Data as a Service
Última actualización: 13 dic 2024
Descripción
Watson Speech services ofrece funciones de reconocimiento y síntesis de voz para sus aplicaciones:
- Watson Speech to Text transcribe texto escrito a partir de audio hablado. El servicio utiliza el aprendizaje de máquina para combinar los conocimientos de gramática, la estructura del lenguaje y la composición de las señales de audio y de voz para transcribir con precisión la voz humana. Actualiza y refina continuamente su transcripción a medida que recibe más audio de voz. El servicio es ideal para aplicaciones que necesitan extraer transcripciones de voz de alta calidad para casos de uso como, por ejemplo, centros de atención telefónica, atención personalizada, asistencia al agente y soluciones similares.
Para más información sobre el servicio, consulte Acerca de ' Watson Speech to Text.
- Watson Text to Speech sintetiza voz natural a partir de texto escrito. El servicio transmite los resultados de vuelta al cliente con un retardo mínimo. El servicio resulta adecuado para aplicaciones guiadas por voz y sin pantalla, donde el audio es el método de salida recomendado.
Para más información sobre el servicio, consulte Acerca de ' Watson Text to Speech.
Puede personalizarlo para adaptarlo a sus necesidades lingüísticas y de aplicación. Ambos servicios ofrecen interfaces de programación HTTP y WebSocket que los hacen adecuados para cualquier aplicación que produzca o acepte audio.
Los servicios añaden una herramienta u otro tipo de interfaz que se ejecuta en IBM Cloud fuera de Cloud Pak for Data as a Service y proporciona API que puede ejecutar en cuadernos.
Enlaces rápidos
- Usar: Trabajar con el servicio
- Desarrollar: Escribir código y compilar aplicaciones
- Novedades: Novedades semanales
- Crear: Crear la instancia de servicio
Servicios integrados
Servicio | Prestación |
---|---|
watsonx Assistant | Cree un asistente con su propia marca en cualquier dispositivo, aplicación o canal. Los usuarios interactúan con la aplicación mediante la interfaz de usuario que implemente. |