0 / 0
Go back to the English version of the documentation
Rozšířená nastavení frekvence
Last updated: 12. 1. 2023
Rozšířená nastavení frekvence (SPSS Modeler)

Kategorie můžete sestavovat na základě jednoduché a mechanické techniky frekvence. Pomocí této techniky můžete sestavit jednu kategorii pro každou položku (typ, koncept nebo vzorek), u které bylo zjištěno, že je vyšší než daný záznam nebo počet dokumentů. Kromě toho můžete sestavit jednu kategorii pro všechny méně často se vyskytující položky. Počítáme-li počet záznamů nebo dokumentů obsahujících extrahovaný koncept (a všechna její synonyma), typ nebo vzorec, na rozdíl od celkového počtu výskytů v celém textu, odkazujeme na počet záznamů nebo dokumentů obsahujících extrahovaný koncept (a všechna jeho synonyma).

Seskupení často se vyskytujících položek může přinést zajímavé výsledky, protože může označovat běžnou nebo významnou odezvu. Technika je velmi užitečná u nepoužitých výsledků extrakce po použití jiných technik. Další aplikací je spustit tuto techniku okamžitě po extrakci, když neexistují žádné další kategorie, upravit výsledky k odstranění nezajímavých kategorií a pak rozšířit tyto kategorie tak, aby odpovídaly ještě více záznamů nebo dokumentů.

Místo použití této techniky můžete seřadit koncepce nebo vzory konceptů sestupně podle počtu záznamů nebo dokumentů v podokně výsledků extrakce a poté pomocí myši přetáhnout ty, které mají nejvíce záznamů do podokna kategorií, a vytvořit odpovídající kategorie.

Pro volbu Použít frekvence k sestavení kategorií v nastavení kategorie jsou k dispozici následující rozšířená nastavení.

Generovat deskriptory kategorie v. Vyberte typ vstupu pro deskriptory.
  • Úroveň konceptů. Výběr této volby znamená, že se použijí koncepce nebo frekvence vzorů pojmů. Budou použity koncepty, pokud byly vybrány typy jako vstup pro sestavení kategorie a vzorce koncepce se používají, pokud byly vybrány vzory typu. Obecně platí, že použití této techniky na úroveň koncepce bude vytvářet specifičtější výsledky, protože koncepce a koncepce koncepce představují nižší úroveň měření.
  • Úroveň typů. Vyberete-li tuto volbu, znamená to, že se použijí frekvence typu nebo frekvence typu. Typy budou použity, pokud byly vybrány typy jako vstup pro sestavení kategorie a jsou použity vzory typů, pokud byly vybrány vzory typu. Použitím této techniky na úroveň typu můžete získat rychlý přehled o druhu poskytnutých informací.

Minimální záznam/dokument. počítat pro položky, které mají vlastní kategorii. Pomocí této volby můžete sestavovat kategorie z často se vyskytujících položek. Tato volba omezuje výstup pouze na ty kategorie, které obsahují deskriptor, který se vyskytl alespoň v řadě X záznamů nebo dokumentů, kde X je hodnota, která má být zadána pro tuto volbu.

Seskupte všechny zbývající položky do volané kategorie. Tuto volbu použijte, chcete-li seskupit všechny koncepty nebo typy, které se vyskytují zřídka, do jediné kategorie "catch-all" s názvem dle vašeho výběru. Při výchozím nastavení má tato kategorie název Jiný.

Vstup kategorie. Vyberte skupinu, na kterou se mají použít techniky:
  • Nepoužité výsledky extrakce. Tato volba umožňuje sestavovat kategorie z výsledků extrakce, které nejsou použity v žádných existujících kategoriích. To minimalizuje tendenci záznamů tak, aby odpovídaly více kategoriím a limitovaly počet vyprodukovaných kategorií.
  • Všechny výsledky extrakce. Tato volba umožňuje sestavení kategorií pomocí libovolné z výsledků extrakce. To je nejužitečnější, když neexistuje nebo jen málo kategorií již existuje.

Vyřešit duplicitní názvy kategorií podle. Vyberte způsob zpracování všech nových kategorií nebo podkategorií, jejichž názvy by byly stejné jako existující kategorie. Můžete buď sloučit ty nové (a jejich deskriptory) s existujícími kategoriemi se stejným názvem, nebo můžete zvolit přeskočení vytvoření všech kategorií, pokud se v existujících kategoriích nachází duplicitní název.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more