Translation not up to date
Při vytváření modelů kategorií v produktu Text Analytics existuje několik různých metod, z nichž můžete vybírat, aby se vytvářeli kategorie. Protože každá datová sada je jedinečná, může se změnit počet technik a pořadí, ve kterém se tyto datové sady mohou měnit.
Vzhledem k tomu, že vaše interpretace výsledků se může lišit od někoho jiného, možná budete muset experimentovat s různými technikami, abyste zjistili, který z nich produkuje nejlepší výsledky pro vaše textová data. V produktu Text Analytics můžete v relaci pracovní plochy vytvořit modely kategorií, ve kterých můžete dále zkoumat a dokončovat své kategorie.
V této dokumentaci odkazuje kategorie budovy na generaci definic kategorií a klasifikace prostřednictvím použití jedné nebo více vestavěných metod a kategorizace odkazuje na hodnocení nebo na označování, proces, kdy jsou jedinečné identifikátory (název/hodnota/hodnota) přiřazeny k definicím kategorií pro každý záznam nebo dokument.
Během sestavování kategorie se koncepty a typy, které byly extrahovány, používají jako stavební bloky pro vaše kategorie. Při sestavování kategorií jsou záznamy nebo dokumenty automaticky přiřazovány do kategorií, obsahují-li text, který odpovídá prvku definice kategorie.
Produkt Text Analytics nabízí několik technik automatizované správy kategorií, které vám pomohou rychle kategorizovat vaše dokumenty nebo záznamy.
Metody seskupování
Každá z dostupných technik je vhodná pro určité typy dat a situací, ale často je užitečné kombinovat metody v rámci stejné analýzy k zachycení úplného rozsahu záznamů dokumentů. Můžete se podívat na koncept ve více kategoriích nebo najít redundantní kategorie.
Sémantická síť. Tato technika začíná tím, že identifikuje možné smysly každého konceptu ze svého rozsáhlého indexu vztahů slov a poté vytvoří kategorie seskupením souvisejících koncepcí. Tato technika je nejlepší, když jsou koncepce známy se sémantickou sítí a nejsou příliš nejednoznačné. To je méně užitečné, když text obsahuje specializovanou terminologii nebo žargon neznámý na síti. V jednom příkladu by koncepce granny smith apple
mohla být seskupena s gala apple
a winesap apple
, protože jsou sourozenci od babičkovského smáře. V jiném příkladě může být koncept animal
seskupen s cat
a kangaroo
, protože jsou hyponyma animal
. Tato technika je k dispozici pouze pro anglický text.
Zahrnutí koncepce. Tato technika sestavuje kategorie seskupením víceslovných konceptů (složených slov) na základě toho, zda obsahují slova, která jsou podmnožinou nebo nadřazená slova v druhém slově. Například koncept seat
by byl seskupen s safety seat
, seat belt
a seat belt buckle
.