0 / 0
Go back to the English version of the documentation
Jak kategorizace funguje
Last updated: 04. 7. 2023
Jak kategorizace funguje (SPSS Modeler)

Při vytváření modelů kategorií v produktu Text Analytics existuje několik různých metod, z nichž můžete vybírat, aby se vytvářeli kategorie. Protože každá datová sada je jedinečná, může se změnit počet technik a pořadí, ve kterém se tyto datové sady mohou měnit.

Vzhledem k tomu, že vaše interpretace výsledků se může lišit od někoho jiného, možná budete muset experimentovat s různými technikami, abyste zjistili, který z nich produkuje nejlepší výsledky pro vaše textová data. V produktu Text Analytics můžete v relaci pracovní plochy vytvořit modely kategorií, ve kterých můžete dále zkoumat a dokončovat své kategorie.

V této dokumentaci odkazuje kategorie budovy na generaci definic kategorií a klasifikace prostřednictvím použití jedné nebo více vestavěných metod a kategorizace odkazuje na hodnocení nebo na označování, proces, kdy jsou jedinečné identifikátory (název/hodnota/hodnota) přiřazeny k definicím kategorií pro každý záznam nebo dokument.

Během sestavování kategorie se koncepty a typy, které byly extrahovány, používají jako stavební bloky pro vaše kategorie. Při sestavování kategorií jsou záznamy nebo dokumenty automaticky přiřazovány do kategorií, obsahují-li text, který odpovídá prvku definice kategorie.

Produkt Text Analytics nabízí několik technik automatizované správy kategorií, které vám pomohou rychle kategorizovat vaše dokumenty nebo záznamy.

Metody seskupování

Každá z dostupných technik je vhodná pro určité typy dat a situací, ale často je užitečné kombinovat metody v rámci stejné analýzy k zachycení úplného rozsahu záznamů dokumentů. Můžete se podívat na koncept ve více kategoriích nebo najít redundantní kategorie.

Sémantická síť. Tato technika začíná tím, že identifikuje možné smysly každého konceptu ze svého rozsáhlého indexu vztahů slov a poté vytvoří kategorie seskupením souvisejících koncepcí. Tato technika je nejlepší, když jsou koncepce známy se sémantickou sítí a nejsou příliš nejednoznačné. To je méně užitečné, když text obsahuje specializovanou terminologii nebo žargon neznámý na síti. V jednom příkladu by koncepce granny smith apple mohla být seskupena s gala apple a winesap apple , protože jsou sourozenci od babičkovského smáře. V jiném příkladě může být koncept animal seskupen s cat a kangaroo , protože jsou hyponyma animal. Tato technika je k dispozici pouze pro anglický text.

Zahrnutí koncepce. Tato technika sestavuje kategorie seskupením víceslovných konceptů (složených slov) na základě toho, zda obsahují slova, která jsou podmnožinou nebo nadřazená slova v druhém slově. Například koncept seat by byl seskupen s safety seat, seat belta seat belt buckle.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more