영어 버전 문서로 돌아가기Watson Speech services on Cloud Pak for Data as a Service
Watson Speech services on Cloud Pak for Data as a Service
마지막 업데이트 날짜: 2024년 12월 13일
설명
Watson Speech services 에서는 애플리케이션을 위한 음성 인식 및 음성 합성 기능을 제공합니다:
- Watson Speech to Text 음성 오디오에서 서면 텍스트를 전사합니다. 이 서비스는 머신 러닝을 활용하여 문법, 언어 구조, 오디오 및 음성 신호 구성에 대한 지식을 결합함으로써 사람 음성을 정확하게 문자로 기록합니다. 더 많은 음성 오디오를 수신함에 따라 대화 내용을 지속적으로 업데이트하고 정제합니다. 이 서비스는 콜 센터, 사용자 정의 관리, 에이전트 지원 및 유사한 솔루션과 같은 유스 케이스에 대한 고품질 음성 대화 내용을 추출해야 하는 애플리케이션에 적합합니다.
서비스에 대한 자세한 내용은 ' Watson Speech to Text' 소개를 참조하세요.
- Watson Text to Speech 는 서면 텍스트에서 자연스러운 음성을 합성합니다. 서비스는 지연을 최소로 하여 결과를 다시 클라이언트로 스트리밍합니다. 서비스는 오디오가 선호 출력 방법인 음성 구동 및 화면 없는 애플리케이션에 적합합니다.
서비스에 대한 자세한 내용은 ' Watson Text to Speech' 소개를 참조하세요.
언어 및 애플리케이션 요구 사항에 맞게 사용자 지정할 수 있습니다. 두 서비스 모두 HTTP 및 WebSocket 프로그래밍 인터페이스를 제공하여 오디오를 생성하거나 수신하는 모든 애플리케이션에 적합합니다.
이 서비스는 Cloud Pak for Data as a Service 외부의 IBM Cloud 실행되는 도구 또는 기타 유형의 인터페이스를 추가하고 노트북에서 실행할 수 있는 API를 제공합니다.
빠른 링크
통합 서비스
서비스 | 기능 |
---|---|
watsonx Assistant | 임의의 디바이스, 애플리케이션 또는 채널에 대한 사용자 고유의 지원을 빌드합니다. 사용자는 구현하는 사용자 인터페이스를 통해 애플리케이션과 상호작용합니다. |