0 / 0
Go back to the English version of the documentation
Węzeł automatycznego przygotowywania danych
Last updated: 04 lip 2023
Węzeł Auto Data Prep (SPSS Modeler)

Przygotowywanie danych do analizy jest jednym z najbardziej istotnych kroków w każdym projekcie — i również jednym z najbardziej czasochłonnych. Automatyczne przygotowanie danych (Automated Data Preparation — ADP) ma za zadanie analizę danych i identyfikację stałych, klasyfikację pól (zmiennych), które są problematyczne lub mają małe prawdopodobieństwo bycia użytecznymi, w razie potrzeby obliczanie nowych atrybutów i zwiększanie wydajności poprzez wykorzystywanie inteligentnych technik klasyfikowania. Można używać tego algorytmu w sposób w pełni automatyczny, pozwalając mu na wybór i zastosowanie stałych, lub korzystać z niego w sposób interaktywny, przeglądając zmiany przed ich dokonaniem i zaakceptować je lub odrzucać.

Użycie funkcji automatycznego przygotowania danych (ADP) umożliwia przygotowanie danych do szybkiego i łatwego budowania modelu, bez konieczności uzyskiwania wiedzy na temat użytych koncepcji statystycznych. Modele mają tendencję do szybszego budowania i oceny

Uwaga: Kiedy proces automatycznego przygotowywania danych przygotowuje zmienną do analizy, tworzona jest nowa zmienna zawierająca korekty lub transformacje, zamiast zastępowania istniejących wartości i właściwości starej zmiennej. Stara zmienna nie jest używana w dalszej analizie; jej rola jest ustawiona na Brak.

Przykład. Firma ubezpieczeniowa o ograniczonych środkach na sprawdzenie roszczeń chce zbudować model do flagowania podejrzanych, potencjalnie oszukańczych roszczeń. Przed utworzeniem modelu dane będą przygotowane do modelowania przy użyciu automatycznego przygotowywania danych. Ponieważ firma chce mieć możliwość przejrzenia zaproponowanych transformacji przed ich zastosowaniem, użyte zostanie automatyczne przygotowywanie danych w trybie interaktywnym.

Grupa z branży motoryzacyjnej śledzi sprzedaż różnych pojazdów osobowych. Podejmując próbę zidentyfikowania najbardziej i najmniej rentownych modeli, chcą ustalić relacje pomiędzy sprzedażą pojazdów a charakterystykami pojazdów. Automatyczne przygotowywanie danych umożliwia przygotowanie danych do analizy, a utworzenie modeli z użyciem danych „przed” i „po” przygotowaniu pozwoli zobaczyć różnice w wynikach.

Jaki jest cel? Automatyczne przygotowywanie danych rekomenduje kroki przygotowania danych, które będą wpływały na szybkość, z jaką inne algorytmy mogą budować modele i które ulepszą jakość predykcji tych modeli. Możliwe działania to przykładowo przekształcanie, tworzenie i wybór predyktorów. Możliwe jest również przekształcenie zmiennej przewidywanej. Można określić priorytety budowania modelu, na jakich proces przygotowywania danych powinien się skoncentrować.

  • Zrównoważenie szybkości i dokładności. Ta opcja umożliwia przygotowanie danych, tak aby nadać jednakowy priorytet szybkości przetwarzania danych przez algorytmy budowania modelu oraz dokładności predykcji.
  • Optymalizacja dla szybkości. Ta opcja umożliwia przygotowanie danych, tak aby nadać priorytet szybkości przetwarzania danych przez algorytmy budowania modelu. Opcję tę należy wybrać w przypadku pracy z dużymi zbiorami danych lub poszukiwania szybkiej odpowiedzi.
  • Optymalizacja dla dokładności. Ta opcja umożliwia przygotowywanie danych, taka aby nadać priorytet dokładności predykcji tworzonych przez algorytmy budowania modelu.
  • Analiza niestandardowa. Opcję tę należy wybrać, aby ręcznie zmienić algorytm na karcie Ustawienia. Jeśli w późniejszym czasie na karcie Ustawienia dokonane zostaną zmiany opcji, które są niekompatybilne z jednym z pozostałych celów, należy pamiętać, że to ustawienie jest zaznaczane automatycznie.

Uczenie węzła

Węzeł automatycznego przygotowywania danych (ADP) jest implementowany jako węzeł procesowy i działa podobnie, jak węzeł typu; uczenie węzła ADP odnosi się do określania węzła typu. Po przeprowadzeniu analizy określone transformacje są stosowane do danych bez dalszej analizy, dopóki model danych w kierunku przeciwnym nie ulegnie zmianie. Podobnie jak w przypadku węzłów typu i filtrowania, jeśli węzeł automatycznego przygotowywania danych zostanie odłączony, będzie pamiętał model danych i transformacje, dzięki czemu po ponownym podłączeniu nie ma konieczności ponownego uczenia go; pozwala to na uczenie węzła na podzbiorze typowych danych, a następnie skopiowanie lub wdrożenie do użycia z danymi rzeczywistymi tak często, jak to konieczne.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more