Translation not up to date
Narzędzie graficzne AutoAI analizuje dane i wykorzystuje algorytmy danych, transformacje i ustawienia parametrów w celu utworzenia najlepszego modelu predykcyjnego. AutoAI wyświetla różne potencjalne modele jako modelowe potokami kandydującymi i klasyfikuje je na tablicy liderów, z której można wybierać.
- Wymagana usługa
- Watson Machine Learning
- Watson Studio
- Format daty
- Tabelaryczne: pliki CSV, z przecinkiem (,) ogranicznikiem dla wszystkich typów eksperymentów AutoAI .
- Połączono dane z IBM Cloud Object Storage.
Można użyć zasobu danych, który jest zapisywany jako Grupa składników (beta) , ale metadane nie są używane do zapełniania ustawień eksperymentu AutoAI .
- Wielkość danych
- Do 1 GB lub do 20 GB. Szczegółowe informacje można znaleźć w sekcji AutoAI data use.
Użycie danych AutoAI
Limity te są oparte na domyślnej konfiguracji obliczenia 8 procesora i 32 GB.
Eksperymenty klasyfikacji i regresji AutoAI :
- Do eksperymentów AutoAI można przesłać plik o pojemności do 1 GB.
- W przypadku nawiązania połączenia ze źródłem danych, który przekracza 1 GB, używane jest tylko pierwsze 1 GB rekordów.
Eksperymenty dotyczące szeregów czasowych AutoAI :
Jeśli źródło danych zawiera kolumnę datownika, AutoAI próbkuje dane z jednolitą częstotliwością. Na przykład dane mogą być z przyrostem jednej minuty, jednej godziny lub jednego dnia. Określony znacznik czasu jest używany do określania okna wyszukiwania w celu poprawy dokładności modelu.
Uwaga:Jeśli wielkość pliku jest większa niż 1 GB, funkcja AutoAi sortuje dane w porządku malejącym , a tylko pierwsze 1 GB jest używane do uczenia eksperymentu.
Jeśli źródło danych nie zawiera kolumny datownika, upewnij się, że AutoAI próbkuje dane w jednakowych odstępach czasu i sortuje dane w kolejności rosnąco . Rosnąca kolejność sortowania oznacza, że wartość w pierwszym wierszu jest najstarsza, a wartość w ostatnim wierszu jest najświeższą.
Uwaga: Jeśli wielkość pliku jest większa niż 1 GB, należy obciąć wielkość pliku w taki sposób, aby była mniejsza niż 1 GB.
Więcej informacji na temat wybierania odpowiedniego narzędzia dla danych i przypadków użycia zawiera sekcja Wybieranie narzędzia.
Proces AutoAI
Korzystając z interfejsu AutoAI, można zbudować i wdrożyć model uczenia maszynowego o wyrafinowanych funkcjach szkoleniowych i bez kodowania. Narzędzie wykonuje większość pracy dla Ciebie.
Aby wyświetlić kod, który utworzył dany eksperyment, lub interakcję z eksperymentem programowo, można zapisać eksperyment jako notatnik.
Funkcja AutoAI automatycznie uruchamia następujące zadania w celu zbudowania i oceny kandydatów do rurociągów modelowych:
- Wstępne przetwarzanie danych
- Zautomatyzowany wybór modelu
- Zautomatyzowane inżynieria składników
- Optymalizacja parametru Hyperparameter
Informacje na temat procesu AutoAI
Dodatkowe informacje na temat każdej z tych faz, w tym odsyłacze do powiązanych dokumentów badawczych i opisów algorytmów zastosowanych do tworzenia rurociągów modelowych, zawiera sekcja Szczegóły implementacjiAutoAI.
Wstępne przetwarzanie danych
Większość zbiorów danych zawiera różne formaty danych i braki danych, ale standardowe algorytmy uczenia maszynowego działają tylko z numerami i bez braków danych. Dlatego też funkcja AutoAI stosuje różne algorytmy lub estymatory do analizowania, czyszczenia i przygotowywania surowych danych na potrzeby uczenia maszynowego. Ta technika automatycznie wykrywa i kategoryzuje wartości w oparciu o funkcje, takie jak typ danych: jakościowy lub liczbowy. W zależności od kategoryzacji, funkcja AutoAI wykorzystuje optymalizację hyper-parameter w celu określenia najlepszej kombinacji strategii dla brakujących podstawiania wartości, kodowania opcji i skalowania funkcji dla danych użytkownika.
Zautomatyzowany wybór modelu
Funkcja AutoAI korzysta z automatycznego wyboru modelu w celu zidentyfikowania najlepszego modelu danych. Ta nowatorska metoda testuje potencjalne modele na małych podzbiorach danych i szereguje je w oparciu o dokładność. AutoAI następnie wybiera najbardziej obiecujące modele i zwiększa rozmiar podzbioru danych, dopóki nie wykryje najlepszego dopasowania. Takie podejście oszczędza czas i zwiększa wydajność poprzez stopniowe zawężanie potencjalnych modeli w oparciu o dokładność.
Informacje na temat obsługi automatycznie generowanych rurociągów w celu wybrania najlepszego modelu można znaleźć w sekcji Wybór modelu AutoAI.
Zautomatyzowane inżynieria składników
Inżynieria składników identyfikuje najbardziej dokładny model, transformując surowe dane w kombinację funkcji, które najlepiej reprezentują problem. To unikalne podejście wykorzystuje różne opcje budowy funkcji w sposób ustrukturyzowany, niewyczerpujący, a jednocześnie stopniowo maksymalizujący dokładność modelu dzięki uczeniu się w procesie wzmocnienia. Ta technika prowadzi do zoptymalizowanej sekwencji transformacji danych, które najlepiej pasują do algorytmów kroku wyboru modelu.
Optymalizacja parametrów hiperparametrów
Optymalizacja hiperparametrów ogranicza najlepsze modele wykonania. Funkcja AutoAI korzysta z nowatorskiego algorytmu optymalizacji hiperparametrów dla niektórych ocen funkcji, takich jak modelowanie i ocenianie, które są typowe dla uczenia maszynowego. Takie podejście szybko identyfikuje najlepszy model pomimo długich czasów wartościowania w każdej iteracji.
Następne kroki
KursAutoAI : Budowanie binarnego modelu klasyfikacji
Temat nadrzędny: Analizowanie danych i modeli budynków