Konfigurowanie eksperymentu klasyfikacji lub regresji

Translation not up to date

The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.

Go back to the English version of the documentation

Konfigurowanie eksperymentu klasyfikacji lub regresji

Last updated: 25 sie 2023

Konfigurowanie eksperymentu klasyfikacji lub regresji

AutoAI oferuje ustawienia eksperymentu, które można wykorzystać do skonfigurowania i dostosowania eksperymentów klasyfikacji lub regresji.

Ustawienia eksperymentu-przegląd

Po przesłaniu danych eksperymentu i wybraniu typu eksperymentu i co do przewidywania, AutoAI określa domyślne konfiguracje i metryki dla eksperymentu. Można zaakceptować te wartości domyślne i przejść do eksperymentu lub kliknąć opcję Ustawienia eksperymentu , aby dostosować konfiguracje. Dostosowując konfiguracje, można precyzyjnie sterować sposobem budowania przez eksperyment rurociągów modelu kandydata.

Poniższe tabele umożliwiają eksperymentowanie ustawień klasyfikacji i eksperymentów regresyjnych. Szczegółowe informacje na temat konfigurowania eksperymentu szeregów czasowych można znaleźć w sekcji Budowanie eksperymentu szeregu czasowego.

Ustawienia predykcji

Większość ustawień predykcji znajduje się na głównej stronie Ogólne . Przejrzyj lub zaktualizuj następujące ustawienia.

Ustawienie	Opis
Typ predykcji	Typ predykcji można zmienić lub nadpisać. Na przykład, jeśli funkcja AutoAI wykryje tylko dwie klasy danych i skonfiguruje binarny eksperyment klasyfikacji, ale wiadomo, że istnieją trzy klasy danych, można zmienić typ na wieloklasowy.
Klasa dodatnia	W przypadku binarnych eksperymentów klasyfikacji zoptymalizowanych dla opcji Dokładność, Średnia precyzja, Rekreacjalub F1wymagana jest klasa dodatnia. Upewnij się, że klasa dodatnia jest poprawna lub eksperyment może generować niedokładne wyniki.
Zoptymalizowany pomiar	Zmiana wielkości mierzonej w celu optymalizacji i rankingu modelowych rurociągów kandydackich.
Wybór zoptymalizowanego algorytmu	Wybierz, w jaki sposób AutoAI wybiera algorytmy, które mają być używane do generowania modeli rurociągów kandydujących. Możesz zoptymalizować dla aloritmów z najlepszym wynikiem, lub zoptymalizować dla algorytmów z najwyższą punktacji w najkrótszym czasie wykonywania.
Algorytmy do włączenia	Wybierz, które z dostępnych algorytmów mają być wartościowane po uruchomieniu eksperymentu. Lista algorytmów jest oparta na wybranym typie predykcji.
Algorytmy do użycia	AutoAI testuje określone algorytmy i używa najlepszych wykonawców do tworzenia rurociągów modelowych. Wybierz liczbę najlepszych algorytmów, które mają zostać zastosowane. Każdy algorytm generuje 4-5 rurociągów, co oznacza, że jeśli wybierzesz 3 algorytmy do wykorzystania, Twoje wyniki eksperymentu będą zawierać 12-15 sklasyfikowanych rurociągów. Więcej algorytmów zwiększa środowisko wykonawcze dla eksperymentu.

Ustawienia fairness danych

Kliknij kartę Fairness (Fairness), aby ocenić eksperyment dotyczący wartości godziwości w przewidywanych wynikach. Szczegółowe informacje na temat konfigurowania wykrywania uczciwości można znaleźć w sekcji Stosowanie testów bezstronności w eksperymentach z produktem AutoAI.

Ustawienia źródła danych

Na karcie Ogólne ustawień źródła danych dostępne są opcje służące do konfigurowania sposobu, w jaki eksperyment zużywa i przetwarza dane przeznaczone do szkolenia i oceny eksperymentu.

Ustawienie	Opis
Duplikuj wiersze	Aby przyspieszyć szkolenie, możesz zdecydować się na pominięcie zduplikowanych wierszy w danych uczących.
Metoda podpróby wyboru potoku	W przypadku dużego zestawu danych należy użyć podzbioru danych w celu przeszkolenia eksperymentu. Ta opcja przyspiesza wyniki, ale może mieć wpływ na dokładność.
Imputacja danych	Interpoluj brakujące wartości w źródle danych. Szczegółowe informacje na temat zarządzania imputacją danych można znaleźć w sekcji Imputacja danych w eksperymentach AutoAI.
Inżynieria elementów tekstowych	Jeśli ta opcja jest włączona, kolumny, które są wykrywane jako tekst, są przekształcane w wektory w celu lepszej analizy podobieństwa semantycznego między łańcuchami. Włączenie tego ustawienia może spowodować zwiększenie czasu wykonywania. Szczegółowe informacje na ten temat zawiera sekcja Tworzenie eksperymentu analizy tekstu.
Ostateczny zestaw danych uczących	Wybierz, jakie dane mają być używane do szkolenia końcowych rurociągów. Jeśli zostanie wybrana opcja uwzględniania tylko danych uczących, wygenerowane zeszyty zawierają komórkę na potrzeby pobierania danych wstrzymanych, które są używane do oceny poszczególnych rurociągów.
Obsługa wartości odstających	Wybierz, czy funkcja AutoAI powoduje wykluczenie wartości wartości odstających z kolumny docelowej w celu zwiększenia dokładności treningu. Jeśli ta opcja jest włączona, funkcja AutoAI korzysta z metody interquartile range (IQR) w celu wykrywania i wykluczania wartości odstających z końcowych danych treningowych, niezależnie od tego, czy są to tylko dane uczących, czy też szkolenia i dane wstrzymane.
Metoda szkolenia i holdout	Dane treningowe są wykorzystywane do uczenia modelu, a dane holdout są wstrzymane ze szkolenia modelu i wykorzystywane do pomiaru wydajności modelu. Istnieje możliwość podzielenia źródła danych typu singe na dane treningowe i testowe (holdout) lub do drugiego pliku danych, który jest przeznaczony dla danych testowych. W przypadku podziału danych uczących należy określić wartości procentowe, które będą używane w danych uczących i danych holdout. Można również określić liczbę składów, od domyślnej trzech krotności do maksymalnie 10. Walidacja krzyżowa dzieli dane treningowe na foldy lub grupy na potrzeby testowania wydajności modelu.
Wybierz funkcje do uwzględnienia	Wybierz kolumny ze źródła danych, które zawierają dane, które obsługują kolumnę predykcji. Wykluczanie zbędnych kolumn może poprawić czas wykonywania.

Ustawienia środowiska wykonawczego

Przejrzyj ustawienia eksperymentu lub zmień zasoby obliczeniowe, które są przydzielone do uruchamiania eksperymentu.

Następne kroki

Konfigurowanie eksperymentu analizy tekstu

Temat nadrzędny: Budowanie modelu AutoAI