Watson Speech services w sekcji Cloud Pak for Data as a Service (Cloud Pak for Data as a Service)

Opis

Watson Speech services for IBM® Cloud Pak for Data oferuje funkcje rozpoznawania mowy i syntezy mowy w przypadku aplikacji użytkownika:

  • Watson Speech to Text w przypadku transkryptu IBM Cloud Pak for Data napisanego w formacie audio z wypowiedzi mówionej. Serwis wykorzystuje naukę maszyną do łączenia wiedzy o gramatyce, strukturze językowej oraz kompozycji sygnałów audio i głosowych, aby precyzyjnie dokonać transkryptalizacji głosu ludzkiego. Stale aktualizuje i udoskonali transkrypcję, ponieważ otrzymuje więcej mowy audio. Usługa jest idealna dla aplikacji, które muszą wyodrębnić wysokiej jakości transkryptów mowy do przypadków użycia, takich jak centra połączeń, opieka niestandardowa, asysta agenta i podobne rozwiązania.

    Więcej informacji na temat usługi znajduje się w sekcji Informacje o programie Speech to Text.

  • Watson Text to Speech w publikacji IBM Cloud Pak for Data syntetyzuje naturalną wymowę z tekstu pisanego. Usługa strumienie wyniki z powrotem do klienta z minimalnym opóźnieniem. Usługa jest odpowiednia dla aplikacji opartych na głosowaniach i ekranach ekranowych, gdzie audio jest preferowaną metodą wyjścia.

    Więcej informacji na temat usługi zawiera sekcja Informacje o Text to Speech.

Usługi Watson Speech można dostosować w taki sposób, aby odpowiadał potrzebom danego języka i aplikacji. Obie usługi oferują interfejsy programistyczne HTTP i WebSocket, które sprawiają, że nadają się one do dowolnej aplikacji, która produkuje lub akceptuje audio.

Usługi dodają narzędzie lub inny typ interfejsu, który działa w chmurze IBM Cloud poza programem Cloud Pak for Data as a Service , a także udostępnia interfejsy API, które można uruchamiać w notatnikach.

Szybkie odsyłacze

Usługi zintegrowane

Tabela 1. Usługi pokrewne. Następujące usługi pokrewne są często używane z tą usługą i udostępniają komplementarne funkcje, ale nie są one wymagane.
Usługa Możliwość
Watson Assistant Budowanie własnego rozgałęzionego asystenta w dowolnym urządzeniu, aplikacji lub kanale. Użytkownicy współpracują z aplikacją przy użyciu interfejsu użytkownika, który jest implementowany.