Watson 음성 서비스 on Cloud Pak for Data as a Service

설명

IBM® Cloud Pak for DataWatson 음성 서비스 는 애플리케이션에 대한 음성 인식 및 음성 합성 기능을 제공합니다.

  • IBM Cloud Pak for DataWatson Speech to Text 는 구어된 오디오에서 텍스트를 기록합니다. 이 서비스는 머신 러닝을 활용하여 문법, 언어 구조, 오디오 및 음성 신호 구성에 대한 지식을 결합함으로써 사람 음성을 정확하게 문자로 기록합니다. 더 많은 음성 오디오를 수신함에 따라 대화 내용을 지속적으로 업데이트하고 정제합니다. 이 서비스는 콜 센터, 맞춤형 관리, 에이전트 지원 및 유사한 솔루션과 같은 유스 케이스에 대해 고급 음성 전사물을 추출해야 하는 애플리케이션에 이상적이다.

    서비스에 대한 자세한 정보는 Speech to Text 정보의 내용을 참조하십시오.

  • IBM Cloud Pak for DataWatson Text to Speech 는 작성된 텍스트에서 자연스럽게 소리를 내는 음성을 합성합니다. 서비스는 지연을 최소로 하여 결과를 다시 클라이언트로 스트리밍합니다. 서비스는 오디오가 선호 출력 방법인 음성 구동 및 화면 없는 애플리케이션에 적합합니다.

    서비스에 대한 자세한 정보는 Text to Speech 정보의 내용을 참조하십시오.

사용자의 언어 및 응용프로그램 요구에 맞게 Watson Speech 서비스를 사용자 정의할 수 있습니다. 두 서비스 모두 오디오를 생성하거나 승인하는 애플리케이션에 적합하도록 HTTP및 WebSocket 프로그래밍 인터페이스를 제공한다.

서비스는 Cloud Pak for Data as a Service 외부에서 IBM Cloud 에서 실행되는 도구나 기타 유형의 인터페이스를 추가하고 노트북에서 실행할 수 있는 API를 제공합니다.

빠른 링크

통합 서비스

표 1. 관련 서비스. 다음 관련 서비스는 종종 이 서비스와 함께 사용되며 보완 기능을 제공하지만 필요하지 않습니다.
서비스 기능
Watson Assistant 임의의 디바이스, 애플리케이션 또는 채널에 대한 사용자 고유의 지원을 빌드합니다. 사용자는 구현하는 사용자 인터페이스를 통해 애플리케이션과 상호작용합니다.