Translation not up to date
AutoAI oferuje ustawienia eksperymentu, które można wykorzystać do skonfigurowania i dostosowania eksperymentów klasyfikacji lub regresji.
Ustawienia eksperymentu-przegląd
Po przesłaniu danych eksperymentu i wybraniu typu eksperymentu i co do przewidywania, AutoAI określa domyślne konfiguracje i metryki dla eksperymentu. Można zaakceptować te wartości domyślne i przejść do eksperymentu lub kliknąć opcję Ustawienia eksperymentu , aby dostosować konfiguracje. Dostosowując konfiguracje, można precyzyjnie sterować sposobem budowania przez eksperyment rurociągów modelu kandydata.
Poniższe tabele umożliwiają eksperymentowanie ustawień klasyfikacji i eksperymentów regresyjnych. Szczegółowe informacje na temat konfigurowania eksperymentu szeregów czasowych można znaleźć w sekcji Budowanie eksperymentu szeregu czasowego.
Ustawienia predykcji
Większość ustawień predykcji znajduje się na głównej stronie Ogólne . Przejrzyj lub zaktualizuj następujące ustawienia.
Ustawienie | Opis |
---|---|
Typ predykcji | Typ predykcji można zmienić lub nadpisać. Na przykład, jeśli funkcja AutoAI wykryje tylko dwie klasy danych i skonfiguruje binarny eksperyment klasyfikacji, ale wiadomo, że istnieją trzy klasy danych, można zmienić typ na wieloklasowy. |
Klasa dodatnia | W przypadku binarnych eksperymentów klasyfikacji zoptymalizowanych dla opcji Dokładność, Średnia precyzja, Rekreacjalub F1wymagana jest klasa dodatnia. Upewnij się, że klasa dodatnia jest poprawna lub eksperyment może generować niedokładne wyniki. |
Zoptymalizowany pomiar | Zmiana wielkości mierzonej w celu optymalizacji i rankingu modelowych rurociągów kandydackich. |
Wybór zoptymalizowanego algorytmu | Wybierz, w jaki sposób AutoAI wybiera algorytmy, które mają być używane do generowania modeli rurociągów kandydujących. Możesz zoptymalizować dla aloritmów z najlepszym wynikiem, lub zoptymalizować dla algorytmów z najwyższą punktacji w najkrótszym czasie wykonywania. |
Algorytmy do włączenia | Wybierz, które z dostępnych algorytmów mają być wartościowane po uruchomieniu eksperymentu. Lista algorytmów jest oparta na wybranym typie predykcji. |
Algorytmy do użycia | AutoAI testuje określone algorytmy i używa najlepszych wykonawców do tworzenia rurociągów modelowych. Wybierz liczbę najlepszych algorytmów, które mają zostać zastosowane. Każdy algorytm generuje 4-5 rurociągów, co oznacza, że jeśli wybierzesz 3 algorytmy do wykorzystania, Twoje wyniki eksperymentu będą zawierać 12-15 sklasyfikowanych rurociągów. Więcej algorytmów zwiększa środowisko wykonawcze dla eksperymentu. |
Ustawienia fairness danych
Kliknij kartę Fairness (Fairness), aby ocenić eksperyment dotyczący wartości godziwości w przewidywanych wynikach. Szczegółowe informacje na temat konfigurowania wykrywania uczciwości można znaleźć w sekcji Stosowanie testów bezstronności w eksperymentach z produktem AutoAI.
Ustawienia źródła danych
Na karcie Ogólne ustawień źródła danych dostępne są opcje służące do konfigurowania sposobu, w jaki eksperyment zużywa i przetwarza dane przeznaczone do szkolenia i oceny eksperymentu.
Ustawienie | Opis |
---|---|
Duplikuj wiersze | Aby przyspieszyć szkolenie, możesz zdecydować się na pominięcie zduplikowanych wierszy w danych uczących. |
Metoda podpróby wyboru potoku | W przypadku dużego zestawu danych należy użyć podzbioru danych w celu przeszkolenia eksperymentu. Ta opcja przyspiesza wyniki, ale może mieć wpływ na dokładność. |
Imputacja danych | Interpoluj brakujące wartości w źródle danych. Szczegółowe informacje na temat zarządzania imputacją danych można znaleźć w sekcji Imputacja danych w eksperymentach AutoAI. |
Inżynieria elementów tekstowych | Jeśli ta opcja jest włączona, kolumny, które są wykrywane jako tekst, są przekształcane w wektory w celu lepszej analizy podobieństwa semantycznego między łańcuchami. Włączenie tego ustawienia może spowodować zwiększenie czasu wykonywania. Szczegółowe informacje na ten temat zawiera sekcja Tworzenie eksperymentu analizy tekstu. |
Ostateczny zestaw danych uczących | Wybierz, jakie dane mają być używane do szkolenia końcowych rurociągów. Jeśli zostanie wybrana opcja uwzględniania tylko danych uczących, wygenerowane zeszyty zawierają komórkę na potrzeby pobierania danych wstrzymanych, które są używane do oceny poszczególnych rurociągów. |
Obsługa wartości odstających | Wybierz, czy funkcja AutoAI powoduje wykluczenie wartości wartości odstających z kolumny docelowej w celu zwiększenia dokładności treningu. Jeśli ta opcja jest włączona, funkcja AutoAI korzysta z metody interquartile range (IQR) w celu wykrywania i wykluczania wartości odstających z końcowych danych treningowych, niezależnie od tego, czy są to tylko dane uczących, czy też szkolenia i dane wstrzymane. |
Metoda szkolenia i holdout | Dane treningowe są wykorzystywane do uczenia modelu, a dane holdout są wstrzymane ze szkolenia modelu i wykorzystywane do pomiaru wydajności modelu. Istnieje możliwość podzielenia źródła danych typu singe na dane treningowe i testowe (holdout) lub do drugiego pliku danych, który jest przeznaczony dla danych testowych. W przypadku podziału danych uczących należy określić wartości procentowe, które będą używane w danych uczących i danych holdout. Można również określić liczbę składów, od domyślnej trzech krotności do maksymalnie 10. Walidacja krzyżowa dzieli dane treningowe na foldy lub grupy na potrzeby testowania wydajności modelu. |
Wybierz funkcje do uwzględnienia | Wybierz kolumny ze źródła danych, które zawierają dane, które obsługują kolumnę predykcji. Wykluczanie zbędnych kolumn może poprawić czas wykonywania. |
Ustawienia środowiska wykonawczego
Przejrzyj ustawienia eksperymentu lub zmień zasoby obliczeniowe, które są przydzielone do uruchamiania eksperymentu.
Następne kroki
Konfigurowanie eksperymentu analizy tekstu
Temat nadrzędny: Budowanie modelu AutoAI