0 / 0
Go back to the English version of the documentation
Zaawansowane ustawienia liczebności
Last updated: 12 sty 2023
Zaawansowane ustawienia częstotliwości (SPSS Modeler)

Istnieje możliwość utworzenia kategorii na podstawie prostej i mechanicznej techniki zliczania wystąpień. Za pomocą tej techniki można zbudować jedną kategorię dla każdej pozycji (typu, koncepcji lub wzorca), która została uznana za wyższą niż dany rekord lub liczbę dokumentów. Dodatkowo można utworzyć pojedynczą kategorię dla wszystkich elementów o mniejszej liczebności. Z kolei odnosimy się do liczby zapisów lub dokumentów zawierających wyodrębnione pojęcie (i dowolne jego synonimy), typu lub wzorca, w przeciwieństwie do całkowitej liczby wystąpień w całym tekście.

Grupowanie często używanych elementów może przynieść interesujące wyniki, ponieważ często ujawnia typowe lub istotne odpowiedzi. Technika ta jest bardzo przydatna do analizy niewykorzystanych wyników wyodrębniania już po zastosowaniu innych technik. Inną aplikacją jest uruchomienie tej techniki natychmiast po wyodrębnieniu, gdy nie istnieją żadne inne kategorie, edycja wyników w celu usunięcia nieinteresujących kategorii, a następnie rozszerzenie tych kategorii w taki sposób, aby były one zgodne z większą liczbę rekordów lub dokumentów.

Zamiast używać tej techniki, można sortować pojęcia lub wzorce pojęć malejąco według liczby rekordów lub dokumentów w panelu wyników wyodrębniania, a następnie przeciągać je z największą liczbą rekordów do panelu kategorii w celu utworzenia odpowiadających im kategorii.

Następujące ustawienia zaawansowane są dostępne dla opcji Użyj częstotliwości do budowania kategorii w ustawieniach kategorii.

Generuj deskryptory kategorii w. Wybierz rodzaj kryteriów wejściowych dla deskryptorów.
  • Poziom pojęć. Wybranie tej opcji oznacza, że używane będą liczebności pojęć lub wzorców pojęć. Pojęcia będą używane, jeśli jako kryteria wejściowe dla tworzenia kategorii wybrano typy, a wzorce pojęć będą używane, jeśli wybrano wzorce typów. Z reguły zastosowanie tej techniki na poziomie pojęć spowoduje wygenerowanie bardziej szczegółowych wyników, ponieważ pojęcia i wzorce pojęć reprezentują niższy poziom pomiaru.
  • Poziom typów. Wybranie tej opcji oznacza, że używane będą liczebności typów lub wzorców typów. Typy będą używane, jeśli jako kryteria wejściowe dla tworzenia kategorii wybrano typy, a wzorce typów będą używane, jeśli wybrano wzorce typów. Stosując tę technikę do poziomu typu, można uzyskać szybki podgląd rodzaju podanych informacji.

Minimalna liczba rekordów/liczbę liczebność dla pozycji do posiadania własnej kategorii. Za pomocą tej opcji można budować kategorie z często występujących elementów. Ta opcja ogranicza dane wyjściowe tylko do tych kategorii, które zawierają deskryptor, który wystąpił w co najmniej X liczbie rekordów lub dokumentów, gdzie X jest wartością, która ma zostać wprowadzona dla tej opcji.

Grupuj wszystkie pozostałe elementy w określonej kategorii. Użyj tej opcji, jeśli chcesz zgrupować wszystkie pojęcia lub typy występujące rzadko w jedną kategorię catch-all z wybraną przez Ciebie nazwą. Domyślnie ta kategoria ma nazwę Other.

wprowadzanie kategorii. Wybierz grupę, do której chcesz zastosować techniki:
  • Nieużywane wyniki wyodrębniania. Ta opcja umożliwia tworzenie kategorii na podstawie wyników wyodrębniania, które nie są używane w żadnych istniejących kategoriach. Minimalizuje to tendencję do dopasowywania tych samych rekordów do wielu kategorii i ogranicza liczbę generowanych kategorii.
  • Wszystkie wyniki wyodrębniania. Ta opcja powoduje budowanie kategorii przy użyciu dowolnych wyników wyodrębniania. Taki sposób postępowania jest najbardziej użyteczny, gdy nie istnieją jeszcze kategorie lub jeśli istnieje niewiele kategorii.

Rozstrzygnij zduplikowane nazwy kategorii przez. Wybierz, w jaki sposób postępować z nowymi kategoriami lub podkategoriami, których nazwy byłyby takie same, jak nazwy istniejących kategorii. Istnieje możliwość scalenia nowych (i ich deskryptorów) z istniejącymi kategoriami o tej samej nazwie lub pominięcie tworzenia dowolnych kategorii, jeśli w istniejących kategoriach zostanie znaleziona zduplikowana nazwa.