Cloud Pak for Data as a Service에서 Watson Speech services

설명

Watson Speech services for IBM Cloud Pak® for Data 는 애플리케이션에 대한 음성 인식 및 음성 합성 기능을 제공합니다.

Watson Speech to Text for IBM Cloud Pak for Data 는 음성 오디오에서 쓰여진 텍스트를 변환합니다. 이 서비스는 머신 러닝을 활용하여 문법, 언어 구조, 오디오 및 음성 신호 구성에 대한 지식을 결합함으로써 사람 음성을 정확하게 문자로 기록합니다. 더 많은 음성 오디오를 수신함에 따라 대화 내용을 지속적으로 업데이트하고 정제합니다. 이 서비스는 콜 센터, 사용자 정의 관리, 에이전트 지원 및 유사한 솔루션과 같은 유스 케이스에 대한 고품질 음성 대화 내용을 추출해야 하는 애플리케이션에 적합합니다.

서비스에 대한 자세한 정보는 Watson Speech to Text정보를 참조하십시오.
Watson Text to Speech for IBM Cloud Pak for Data 는 작성된 텍스트에서 자연스럽게 들리는 음성을 합성합니다. 서비스는 지연을 최소로 하여 결과를 다시 클라이언트로 스트리밍합니다. 서비스는 오디오가 선호 출력 방법인 음성 구동 및 화면 없는 애플리케이션에 적합합니다.

서비스에 대한 자세한 정보는 Watson Text to Speech정보를 참조하십시오.

사용자의 언어 및 애플리케이션 요구사항에 맞게 Watson 음성 서비스를 사용자 정의할 수 있습니다. 두 서비스 모두 오디오를 생성하거나 승인하는 애플리케이션에 적합하도록 하는 HTTP및 WebSocket 프로그래밍 인터페이스를 제공합니다.

이 서비스는 Cloud Pak for Data as a Service 외부의 IBM Cloud 에서 실행되는 도구 또는 기타 유형의 인터페이스를 추가하고 노트북에서 실행할 수 있는 API를 제공합니다.

표 1. 관련 서비스. 다음 관련 서비스는 종종 이 서비스와 함께 사용되며 보완적인 기능을 제공하지만 필수는 아닙니다.
서비스	기능
watsonx Assistant	임의의 디바이스, 애플리케이션 또는 채널에 대한 사용자 고유의 지원을 빌드합니다. 사용자는 구현하는 사용자 인터페이스를 통해 애플리케이션과 상호작용합니다.