0 / 0
Go back to the English version of the documentation
AutoAI -przegląd
Last updated: 31 sie 2023
AutoAI -przegląd

Narzędzie graficzne AutoAI analizuje dane i wykorzystuje algorytmy danych, transformacje i ustawienia parametrów w celu utworzenia najlepszego modelu predykcyjnego. AutoAI wyświetla różne potencjalne modele jako modelowe potokami kandydującymi i klasyfikuje je na tablicy liderów, z której można wybierać.

Format daty
Tabelaryczne: pliki CSV, z przecinkiem (,) ogranicznikiem dla wszystkich typów eksperymentów AutoAI .
Połączono dane z IBM Cloud Object Storage.
Uwaga:

Można użyć zasobu danych, który jest zapisywany jako Grupa składników (beta) , ale metadane nie są używane do zapełniania ustawień eksperymentu AutoAI .

Wielkość danych
Do 1 GB lub do 20 GB. Szczegółowe informacje można znaleźć w sekcji AutoAI data use.

Użycie danych AutoAI

Limity te są oparte na domyślnej konfiguracji obliczenia 8 procesora i 32 GB.

Eksperymenty klasyfikacji i regresji AutoAI :

  • Do eksperymentów AutoAI można przesłać plik o pojemności do 1 GB.
  • W przypadku nawiązania połączenia ze źródłem danych, który przekracza 1 GB, używane jest tylko pierwsze 1 GB rekordów.

Eksperymenty dotyczące szeregów czasowych AutoAI :

  • Jeśli źródło danych zawiera kolumnę datownika, AutoAI próbkuje dane z jednolitą częstotliwością. Na przykład dane mogą być z przyrostem jednej minuty, jednej godziny lub jednego dnia. Określony znacznik czasu jest używany do określania okna wyszukiwania w celu poprawy dokładności modelu.

    Uwaga:

    Jeśli wielkość pliku jest większa niż 1 GB, funkcja AutoAi sortuje dane w porządku malejącym , a tylko pierwsze 1 GB jest używane do uczenia eksperymentu.

  • Jeśli źródło danych nie zawiera kolumny datownika, upewnij się, że AutoAI próbkuje dane w jednakowych odstępach czasu i sortuje dane w kolejności rosnąco . Rosnąca kolejność sortowania oznacza, że wartość w pierwszym wierszu jest najstarsza, a wartość w ostatnim wierszu jest najświeższą.

    Uwaga: Jeśli wielkość pliku jest większa niż 1 GB, należy obciąć wielkość pliku w taki sposób, aby była mniejsza niż 1 GB.

Proces AutoAI

Korzystając z interfejsu AutoAI, można zbudować i wdrożyć model uczenia maszynowego o wyrafinowanych funkcjach szkoleniowych i bez kodowania. Narzędzie wykonuje większość pracy dla Ciebie.

Aby wyświetlić kod, który utworzył dany eksperyment, lub interakcję z eksperymentem programowo, można zapisać eksperyment jako notatnik.

Proces AutoAI pobiera dane z pliku ustrukturyzowanego, przygotowuje dane, wybiera typ modelu, a następnie generuje i szereguje rurociągi, dzięki czemu można zapisać i wdrożyć model.

Funkcja AutoAI automatycznie uruchamia następujące zadania w celu zbudowania i oceny kandydatów do rurociągów modelowych:

Informacje na temat procesu AutoAI

Dodatkowe informacje na temat każdej z tych faz, w tym odsyłacze do powiązanych dokumentów badawczych i opisów algorytmów zastosowanych do tworzenia rurociągów modelowych, zawiera sekcja Szczegóły implementacjiAutoAI.

Wstępne przetwarzanie danych

Większość zbiorów danych zawiera różne formaty danych i braki danych, ale standardowe algorytmy uczenia maszynowego działają tylko z numerami i bez braków danych. Dlatego też funkcja AutoAI stosuje różne algorytmy lub estymatory do analizowania, czyszczenia i przygotowywania surowych danych na potrzeby uczenia maszynowego. Ta technika automatycznie wykrywa i kategoryzuje wartości w oparciu o funkcje, takie jak typ danych: jakościowy lub liczbowy. W zależności od kategoryzacji, funkcja AutoAI wykorzystuje optymalizację hyper-parameter w celu określenia najlepszej kombinacji strategii dla brakujących podstawiania wartości, kodowania opcji i skalowania funkcji dla danych użytkownika.

Zautomatyzowany wybór modelu

Funkcja AutoAI korzysta z automatycznego wyboru modelu w celu zidentyfikowania najlepszego modelu danych. Ta nowatorska metoda testuje potencjalne modele na małych podzbiorach danych i szereguje je w oparciu o dokładność. AutoAI następnie wybiera najbardziej obiecujące modele i zwiększa rozmiar podzbioru danych, dopóki nie wykryje najlepszego dopasowania. Takie podejście oszczędza czas i zwiększa wydajność poprzez stopniowe zawężanie potencjalnych modeli w oparciu o dokładność.

Informacje na temat obsługi automatycznie generowanych rurociągów w celu wybrania najlepszego modelu można znaleźć w sekcji Wybór modelu AutoAI.

Zautomatyzowane inżynieria składników

Inżynieria składników identyfikuje najbardziej dokładny model, transformując surowe dane w kombinację funkcji, które najlepiej reprezentują problem. To unikalne podejście wykorzystuje różne opcje budowy funkcji w sposób ustrukturyzowany, niewyczerpujący, a jednocześnie stopniowo maksymalizujący dokładność modelu dzięki uczeniu się w procesie wzmocnienia. Ta technika prowadzi do zoptymalizowanej sekwencji transformacji danych, które najlepiej pasują do algorytmów kroku wyboru modelu.

Optymalizacja parametrów hiperparametrów

Optymalizacja hiperparametrów ogranicza najlepsze modele wykonania. Funkcja AutoAI korzysta z nowatorskiego algorytmu optymalizacji hiperparametrów dla niektórych ocen funkcji, takich jak modelowanie i ocenianie, które są typowe dla uczenia maszynowego. Takie podejście szybko identyfikuje najlepszy model pomimo długich czasów wartościowania w każdej iteracji.

Następne kroki

KursAutoAI : Budowanie binarnego modelu klasyfikacji

Temat nadrzędny: Analizowanie danych i modeli budynków

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more