0 / 0
영어 버전 문서로 돌아가기
Watson Speech services on Cloud Pak for Data as a Service
마지막 업데이트 날짜: 2024년 12월 13일
Watson Speech services on Cloud Pak for Data as a Service

설명

Watson Speech services 에서는 애플리케이션을 위한 음성 인식 및 음성 합성 기능을 제공합니다:

  • Watson Speech to Text 음성 오디오에서 서면 텍스트를 전사합니다. 이 서비스는 머신 러닝을 활용하여 문법, 언어 구조, 오디오 및 음성 신호 구성에 대한 지식을 결합함으로써 사람 음성을 정확하게 문자로 기록합니다. 더 많은 음성 오디오를 수신함에 따라 대화 내용을 지속적으로 업데이트하고 정제합니다. 이 서비스는 콜 센터, 사용자 정의 관리, 에이전트 지원 및 유사한 솔루션과 같은 유스 케이스에 대한 고품질 음성 대화 내용을 추출해야 하는 애플리케이션에 적합합니다.

    서비스에 대한 자세한 내용은 ' Watson Speech to Text' 소개를 참조하세요.

  • Watson Text to Speech 는 서면 텍스트에서 자연스러운 음성을 합성합니다. 서비스는 지연을 최소로 하여 결과를 다시 클라이언트로 스트리밍합니다. 서비스는 오디오가 선호 출력 방법인 음성 구동 및 화면 없는 애플리케이션에 적합합니다.

    서비스에 대한 자세한 내용은 ' Watson Text to Speech' 소개를 참조하세요.

언어 및 애플리케이션 요구 사항에 맞게 사용자 지정할 수 있습니다. 두 서비스 모두 HTTP 및 WebSocket 프로그래밍 인터페이스를 제공하여 오디오를 생성하거나 수신하는 모든 애플리케이션에 적합합니다.

이 서비스는 Cloud Pak for Data as a Service 외부의 IBM Cloud 실행되는 도구 또는 기타 유형의 인터페이스를 추가하고 노트북에서 실행할 수 있는 API를 제공합니다.

빠른 링크

통합 서비스

표 1. 관련 서비스. 다음 관련 서비스는 종종 이 서비스와 함께 사용되며 보완적인 기능을 제공하지만 필수는 아닙니다.
서비스 기능
watsonx Assistant 임의의 디바이스, 애플리케이션 또는 채널에 대한 사용자 고유의 지원을 빌드합니다. 사용자는 구현하는 사용자 인터페이스를 통해 애플리케이션과 상호작용합니다.
일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기