Środowisko robocze analizy tekstu (SPSS Modeler) | IBM Cloud Pak for Data as a Service

Translation not up to date

The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.

Go back to the English version of the documentation

Środowisko robocze analizy tekstu

Last updated: 03 lis 2023

Środowisko robocze analizy tekstu (SPSS Modeler)

Z poziomu węzła modelowania Text Mining można uruchomić interaktywną sesję środowiska roboczego analizy tekstu po uruchomieniu przepływu. W tym środowisku roboczym można wyodrębniać kluczowe pojęcia z danych tekstowych, budować kategorie, eksplorować wzorce analizy powiązań w tekście i generować modele kategorii.

Ta sekcja zawiera przegląd interfejsu środowiska roboczego analizy tekstu wraz z głównymi elementami, z którymi użytkownik będzie pracować, w tym:

Pojęcia. Po przeprowadzeniu wyodrębniania są to kluczowe słowa i frazy, które zostały zidentyfikowane i wyodrębnione z danych tekstowych, zwane również wynikami wyodrębniania. Pojęcia te są pogrupowane w typy. Korzystając z tych pojęć i typów, można eksplorować dane i tworzyć kategorie. Są one zarządzane na karcie Pojęcia .
Odsyłacze tekstowe. Jeśli zasoby lingwistyczne zawierają reguły wzorców powiązań w tekście lub próbujesz używać szablonu zasobów, który zawiera już jakieś reguły TLA, możesz wyodrębniać wzorce z danych tekstowych. Wzorce te pomagają w ujawnianiu interesujących relacji między pojęciami w danych. Można także użyć ich jako deskryptorów w definicjach kategorii. Są one zarządzane na karcie Powiązania tekstowe .
Kategorie. Korzystając z deskryptorów (takich jak wyniki wyodrębniania, wzorce i reguły) jako definicji, można ręcznie lub automatycznie utworzyć zestaw kategorii, do których będą przypisywane rekordy w zależności od tego, czy zawierają część definicji kategorii, czy nie. Są one zarządzane na karcie Kategorie .
Zasoby lingwistyczne. Proces wyodrębniania realizowany jest w oparciu o zestaw parametrów i definicji lingwistycznych, które rządzą sposobem wyodrębniania pojęć z tekstu. Są one zarządzane w postaci szablonów i bibliotek na karcie Edytor zasobów .

Wykres 1. Środowisko robocze analizy tekstu