0 / 0
Go back to the English version of the documentation
Właściwości węzła Symulacje Dopasowanie
Last updated: 04 lip 2023
Węzeł Sim dopasowania (SPSS Modeler)

Węzeł Symulacje Dopasowanie dopasowuje zestaw potencjalnych rozkładów statystycznych do poszczególnych zmiennych w danych. Dopasowanie każdego rozkładu do zmiennej jest oceniane na podstawie kryterium dobroci dopasowania. Po uruchomieniu węzła Symulacje Dopasowanie zostanie zbudowany węzeł Symulacje Generowanie (lub istniejący węzeł zostanie zaktualizowany). Do każdej zmiennej przypisany jest rozkład i najlepszym dopasowaniu. Węzeł Symulacje Generowanie może być wówczas użyty do wygenerowania danych objętych symulacją dla każdej zmiennej.

Mimo że węzeł Symulacje Dopasowanie jest węzłem końcowym, nie dodaje danych wyjściowych do panelu Wyjścia ani nie eksportuje danych.

Uwaga: Jeśli dane historyczne są rzadkie (to znaczy, że istnieje wiele braków danych), może być trudne, aby komponent pasujący znalazł wystarczającą liczbę poprawnych wartości do dopasowania rozkładów do danych. W przypadku kiedy dane są rzadkie, przed dopasowaniem należy usunąć rzadkie zmienne, o ile nie są one wymagane, lub podstawić braki danych. Korzystając z opcji JAKOŚĆ w węźle Audyt danych, można wyświetlić liczbę kompletnych rekordów, określić, które pola są rzadkie, a następnie wybrać metodę podstawiania. Jeśli liczba rekordów jest niewystarczająca dla dopasowania rozkładu, można użyć węzła równoważenia, aby zwiększyć liczbę rekordów.

Korzystanie z węzła Sim Fit w celu automatycznego utworzenia węzła Sim Gen

Przy pierwszym uruchomieniu węzła Symulacje Dopasowanie generowany jest węzeł Symulacje Generowanie wraz z odsyłaczem aktualizacji do węzła Symulacje Dopasowanie. Jeśli węzeł Symulacje Dopasowanie zostanie uruchomiony ponownie, nowy węzeł Symulacje Generowanie zostanie wygenerowany tylko wtedy, gdy odsyłacz aktualizacji został usunięty. Można również użyć węzła Symulacje Dopasowanie, aby zaktualizować połączony węzeł Symulacje Generowanie. Wynik zależy od tego, czy w obu węzłach znajdują się takie same zmienne oraz czy zmienne nie zostały zablokowane w węźle Symulacje Generowanie. Więcej informacji na ten temat zawiera sekcja Węzeł Sim Gen .

Węzeł Symulacje Dopasowanie umożliwia również zaktualizowanie połączonego węzła Symulacje Generowanie. Aby zdefiniować łącze aktualizacji dla węzła Symulacje Generowanie, należy wykonać następujące kroki:

  1. Kliknij prawym przyciskiem myszy węzeł Symulacje Dopasowanie i wybierz opcję Zdefiniuj łącze aktualizacji.
  2. Kliknij węzeł Symulacje Generowanie, dla którego ma zostać zdefiniowane łącze aktualizacji.

Aby usunąć odsyłacz aktualizacji między węzłem Symulacje Dopasowanie a węzłem Symulacje Generowanie, kliknij prawym przyciskiem myszy odsyłacz aktualizacji i wybierz opcję Usuń odsyłacz.

Dopasowywanie rozkładu

Rozkład statystyczny to teoretyczna częstość wystąpienia wartości, jakie mogą istnieć dla zmiennej. W węźle Symulacje Dopasowanie zestaw rozkładów statystycznych jest porównywany z danymi każdej zmiennej. Parametry rozkładu teoretycznego są dopasowywane tak, aby najlepiej pasowały do danych zgodnie z pomiarem dobroci dopasowania; kryterium Anderson-Darling lub kryterium Kolmogorov-Smirnov . Wyniki dopasowania rozkładu za pośrednictwem węzła Symulacje Dopasowanie pokazują, które rozkłady zostały dopasowane, najlepsze oszacowania parametrów dla poszczególnych rozkładów oraz stopień dopasowania każdego rozkładu do danych. W czasie dopasowywania rozkładu obliczane są również korelacje pomiędzy zmiennymi z liczbowym typem składowania oraz kontyngencje pomiędzy zmiennymi z rozkładem jakościowym. Wyniki dopasowywania rozkładu służą do utworzenia węzła Symulacje Generowanie.

Przed dopasowaniem rozkładów do danych w pierwszym 1000 rekordów przeprowadzane jest sprawdzenie, czy nie ma w nich braków danych. Jeśli braków danych jest zbyt wiele, dopasowanie rozkładu jest niemożliwe. W takiej sytuacji należy zdecydować, czy odpowiednie będzie użycie jednej z następujących opcji:
  • Użyj węzła poprzedzającego, aby usunąć rekordy z brakującą wartością
  • Użyj węzła znajdującego się w kierunku przeciwnym do podstawienia wartości brakujących wartości.
Podczas dopasowywania rozkładu braki danych nie są wykluczane. Jeśli dane mają braki danych zdefiniowane przez użytkownika, a wartości te mają być wykluczone z dopasowywania dystrybucji, to należy ustawić te wartości w systemie, w którym brakuje wartości systemowych.

Podczas dopasowywania rozkładu rola zmiennej nie jest brana pod uwagę. Przykładowo zmienne z rolą przewidywana są traktowane tak samo, jak zmienne z rolami wejściowa, brak, oba elementy, podział, separacja, częstość i Id.

Zmienne traktowane są odmiennie w czasie dopasowywania rozkładu w zależności od ich typu składowania oraz poziomu pomiaru. Sposób traktowania zmiennych w czasie dopasowywania rozkładu został opisany w poniższej tabeli.

Tabela 1. Dopasowywanie rozkładu w zależności od typu składowania i poziomu pomiaru zmiennych
Typ składowania     Poziom pomiaru      
  Ciągle Jakościowa Flaga Symboliczny Porządkowy Nieokreślony
Łańcuch Niemożliwe   Jakościowy, dopasowywane są rozkłady Dice'a i stały      
Liczba całkowita          
BRL          
Czas Dopasowywane są wszystkie rozkłady. Obliczane są korelacje i kontyngencje. Dopasowywany jest rozkład jakościowy. Korelacje nie są obliczane.   Dopasowywane są rozkłady dwumianowy, ujemny dwumianowy oraz Poissona; obliczane są korelacje. Zmienna jest ignorowana i nie jest przekazywana do węzła Symulacje Generowanie.
Data          
Datownik          
Nieznany sprawca   Na podstawie danych określany jest odpowiedni typ składowania.    

Zmienne z porządkowym typem pomiaru są traktowane jak zmienne ilościowe i są uwzględniane w tabeli korelacji w węźle Symulacje Generowanie. Jeśli chcesz, aby rozkład inny niż dwumianowy, ujemny dwumianowy lub Poissona był dopasowany do pola porządkowego, to należy zmienić poziom pomiaru pola na ciągły. Jeśli wcześniej zdefiniowano etykietę dla każdej wartości zmiennej porządkowej, a następnie poziom pomiaru zostanie zmieniony na ilościowy, etykiety zostaną utracone.

Zmienne z pojedynczymi wartościami nie są podczas dopasowywania rozkładu traktowane inaczej niż zmienne z wieloma wartościami. Zmienne z typem składowania czas, data lub znacznik czasu są traktowane jako numeryczne.

Dopasowywanie rozkładów do zmiennych podziału

Jeśli dane zawierają zmienną podziału, a dopasowywanie rozkładu ma zostać wykonane osobno dla każdego podziału, konieczne jest przeprowadzenie transformacji danych za pomocą węzła Restrukturyzacja. Korzystając z węzła restrukturyzacji, należy wygenerować nową zmienną dla każdej wartości zmiennej podziału. Następnie zrestrukturyzowane dane można wykorzystać do dopasowania rozkładu w węźle Symulacje Dopasowanie.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more