0 / 0
Go back to the English version of the documentation
Konfigurowanie eksperymentu klasyfikacji lub regresji
Last updated: 18 sie 2023
Konfigurowanie eksperymentu klasyfikacji lub regresji

AutoAI oferuje ustawienia eksperymentu, które można wykorzystać do skonfigurowania i dostosowania eksperymentów klasyfikacji lub regresji.

Ustawienia eksperymentu-przegląd

Po przesłaniu danych eksperymentu i wybraniu typu eksperymentu i co do przewidywania, AutoAI określa domyślne konfiguracje i metryki dla eksperymentu. Można zaakceptować te wartości domyślne i przejść do eksperymentu lub kliknąć opcję Ustawienia eksperymentu , aby dostosować konfiguracje. Dostosowując konfiguracje, można precyzyjnie sterować sposobem budowania przez eksperyment rurociągów modelu kandydata.

Poniższe tabele umożliwiają eksperymentowanie ustawień klasyfikacji i eksperymentów regresyjnych. Szczegółowe informacje na temat konfigurowania eksperymentu szeregów czasowych można znaleźć w sekcji Budowanie eksperymentu szeregu czasowego.

Ustawienia predykcji

Większość ustawień predykcji znajduje się na głównej stronie Ogólne . Przejrzyj lub zaktualizuj następujące ustawienia.

Ustawienie Opis
Typ predykcji Typ predykcji można zmienić lub nadpisać. Na przykład, jeśli funkcja AutoAI wykryje tylko dwie klasy danych i skonfiguruje binarny eksperyment klasyfikacji, ale wiadomo, że istnieją trzy klasy danych, można zmienić typ na wieloklasowy.
Klasa dodatnia W przypadku binarnych eksperymentów klasyfikacji zoptymalizowanych dla opcji Dokładność, Średnia precyzja, Rekreacjalub F1wymagana jest klasa dodatnia. Upewnij się, że klasa dodatnia jest poprawna lub eksperyment może generować niedokładne wyniki.
Zoptymalizowany pomiar Zmiana wielkości mierzonej w celu optymalizacji i rankingu modelowych rurociągów kandydackich.
Wybór zoptymalizowanego algorytmu Wybierz, w jaki sposób AutoAI wybiera algorytmy, które mają być używane do generowania modeli rurociągów kandydujących. Możesz zoptymalizować dla aloritmów z najlepszym wynikiem, lub zoptymalizować dla algorytmów z najwyższą punktacji w najkrótszym czasie wykonywania.
Algorytmy do włączenia Wybierz, które z dostępnych algorytmów mają być wartościowane po uruchomieniu eksperymentu. Lista algorytmów jest oparta na wybranym typie predykcji.
Algorytmy do użycia AutoAI testuje określone algorytmy i używa najlepszych wykonawców do tworzenia rurociągów modelowych. Wybierz liczbę najlepszych algorytmów, które mają zostać zastosowane. Każdy algorytm generuje 4-5 rurociągów, co oznacza, że jeśli wybierzesz 3 algorytmy do wykorzystania, Twoje wyniki eksperymentu będą zawierać 12-15 sklasyfikowanych rurociągów. Więcej algorytmów zwiększa środowisko wykonawcze dla eksperymentu.

Ustawienia fairness danych

Kliknij kartę Fairness (Fairness), aby ocenić eksperyment dotyczący wartości godziwości w przewidywanych wynikach. Szczegółowe informacje na temat konfigurowania wykrywania uczciwości można znaleźć w sekcji Stosowanie testów bezstronności w eksperymentach z produktem AutoAI.

Ustawienia źródła danych

Na karcie Ogólne ustawień źródła danych dostępne są opcje służące do konfigurowania sposobu, w jaki eksperyment zużywa i przetwarza dane przeznaczone do szkolenia i oceny eksperymentu.

Ustawienie Opis
Duplikuj wiersze Aby przyspieszyć szkolenie, możesz zdecydować się na pominięcie zduplikowanych wierszy w danych uczących.
Metoda podpróby wyboru potoku W przypadku dużego zestawu danych należy użyć podzbioru danych w celu przeszkolenia eksperymentu. Ta opcja przyspiesza wyniki, ale może mieć wpływ na dokładność.
Imputacja danych Interpoluj brakujące wartości w źródle danych. Szczegółowe informacje na temat zarządzania imputacją danych można znaleźć w sekcji Imputacja danych w eksperymentach AutoAI.
Inżynieria elementów tekstowych Jeśli ta opcja jest włączona, kolumny, które są wykrywane jako tekst, są przekształcane w wektory w celu lepszej analizy podobieństwa semantycznego między łańcuchami. Włączenie tego ustawienia może spowodować zwiększenie czasu wykonywania. Szczegółowe informacje na ten temat zawiera sekcja Tworzenie eksperymentu analizy tekstu.
Ostateczny zestaw danych uczących Wybierz, jakie dane mają być używane do szkolenia końcowych rurociągów. Jeśli zostanie wybrana opcja uwzględniania tylko danych uczących, wygenerowane zeszyty zawierają komórkę na potrzeby pobierania danych wstrzymanych, które są używane do oceny poszczególnych rurociągów.
Obsługa wartości odstających Wybierz, czy funkcja AutoAI powoduje wykluczenie wartości wartości odstających z kolumny docelowej w celu zwiększenia dokładności treningu. Jeśli ta opcja jest włączona, funkcja AutoAI korzysta z metody interquartile range (IQR) w celu wykrywania i wykluczania wartości odstających z końcowych danych treningowych, niezależnie od tego, czy są to tylko dane uczących, czy też szkolenia i dane wstrzymane.
Metoda szkolenia i holdout Dane treningowe są wykorzystywane do uczenia modelu, a dane holdout są wstrzymane ze szkolenia modelu i wykorzystywane do pomiaru wydajności modelu. Istnieje możliwość podzielenia źródła danych typu singe na dane treningowe i testowe (holdout) lub do drugiego pliku danych, który jest przeznaczony dla danych testowych. W przypadku podziału danych uczących należy określić wartości procentowe, które będą używane w danych uczących i danych holdout. Można również określić liczbę składów, od domyślnej trzech krotności do maksymalnie 10. Walidacja krzyżowa dzieli dane treningowe na foldy lub grupy na potrzeby testowania wydajności modelu.
Wybierz funkcje do uwzględnienia Wybierz kolumny ze źródła danych, które zawierają dane, które obsługują kolumnę predykcji. Wykluczanie zbędnych kolumn może poprawić czas wykonywania.

Ustawienia środowiska wykonawczego

Przejrzyj ustawienia eksperymentu lub zmień zasoby obliczeniowe, które są przydzielone do uruchamiania eksperymentu.

Następne kroki

Konfigurowanie eksperymentu analizy tekstu

Temat nadrzędny: Budowanie modelu AutoAI

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more