AutoAI Übersicht

Letzte Aktualisierung: 15. Nov. 2024

AutoAI Übersicht

Das Grafiktool AutoAI analysiert Ihre Daten und verwendet Datenalgorithmen, Transformationen und Parametereinstellungen, um das beste Vorhersagemodell zu erstellen. AutoAI zeigt verschiedene potenzielle Modelle als Modellkandidatenpipelines an und stuft sie in einer Bestenliste ein, aus der Sie auswählen können.

Erforderliche Bescheinigungen: Aufgaben-Anmeldeinformationen
Datenformat: Tabellarisch: CSV-Dateien mit Komma (,) als Trennzeichen für alle Typen von AutoAI -Experimenten.; Verbundene Daten aus IBM Cloud Object Storage.
Data Size: Bis zu 1 GB oder bis zu 20 GB. Details finden Sie unter AutoAI -Datennutzung.

AutoAI-Datennutzung

Trainingsdaten und Modelleingabedaten haben ein Tabellenformat. Die Spaltennamen in der Tabelle müssen eindeutig sein. Doppelte Spaltennamen führen zu einem Fehler.

Diese Grenzwerte basieren auf der Standardrechenkonfiguration von 8 CPUs und 32 GB.

AutoAI -Klassifikations-und Regressionsexperimente:

Sie können eine Datei mit bis zu 1 GB für AutoAI -Experimente hochladen.
Wenn Sie eine Verbindung zu einer Datenquelle herstellen, die 1 GB überschreitet, werden nur die ersten 1 GB Datensätze verwendet.

AutoAI -Zeitreihenexperimente:

Wenn die Datenquelle eine Zeitmarkenspalte enthält, erfasst AutoAI die Daten mit einer einheitlichen Häufigkeit. Daten können beispielsweise in Inkrementen von einer Minute, einer Stunde oder einem Tag angegeben werden. Die angegebene Zeitmarke wird zur Bestimmung des Lookback-Fensters verwendet, um die Modellgenauigkeit zu verbessern.

Hinweis:
Wenn die Dateigröße größer als 1 GB ist, sortiert AutoAi die Daten in absteigender Zeitreihenfolge und nur die ersten 1 GB werden zum Trainieren des Experiments verwendet.
Wenn die Datenquelle keine Zeitmarkenspalte enthält, stellen Sie sicher, dass AutoAI Stichproben der Daten in gleichmäßigen Intervallen erstellt und die Daten in aufsteigender Zeitreihenfolge sortiert. Eine aufsteigende Sortierreihenfolge bedeutet, dass der Wert in der ersten Zeile der älteste und der Wert in der letzten Zeile der aktuellste ist.

Hinweis: Wenn die Dateigröße größer als 1 GB ist, schneiden Sie die Dateigröße ab, sodass sie kleiner als 1 GB ist.

AutoAI-Prozess

Mit AutoAI können Sie ein Modell für maschinelles Lernen mit hoch entwickelten Trainingsfunktionen und ohne Codierung erstellen und bereitstellen. Das Tool übernimmt die meiste Arbeit.

Sie können ein Experiment als Notebook speichern, um den Code anzuzeigen, über den ein bestimmtes Experiment erstellt wurde, oder um programmgesteuert mit dem Experiment interagieren zu können.

Der AutoAI -Prozess verwendet Daten aus einer strukturierten Datei, bereitet die Daten vor, wählt den Modelltyp aus und generiert Pipelines und ordnet sie an, sodass Sie ein Modell speichern und bereitstellen können.

AutoAI führt die folgenden Tasks automatisch aus, um Kandidaten für Modellpipelines zu erstellen und zu auszuwerten:

Vorverarbeitung der Daten
Automatisierte Modellauswahl
Automatisierte Merkmalsentwicklung
Hyperparameteroptimierung

Erläuterungen zum AutoAI-Prozess

Weitere Details zu den einzelnen Phasen, einschließlich von Links zu zugehörigen Forschungsarbeiten und zu Beschreibungen von Algorithmen, die zum Erstellen der Modellpipelines angewendet werden, finden Sie unter AutoAI-Bereitstellungsdetails.

Vorverarbeitung der Daten

Die meisten Datasets enthalten unterschiedliche Datenformate und fehlende Werte, aber Standardalgorithmen für maschinelles Lernen funktionieren nur mit Zahlen und ohne fehlende Werte. Daher wendet AutoAI verschiedene Algorithmen oder Schätzer an, um Ihre Rohdaten für maschinelles Lernen zu analysieren, zu bereinigen und vorzubereiten. Dieses Verfahren erkennt und kategorisiert Werte automatisch auf der Basis von Merkmalen wie dem Datentyp: kategorial oder numerisch. Je nach Kategorisierung verwendet AutoAI die Hyperparameteroptimierung , um die beste Kombination von Strategien für Imputation fehlender Werte, Merkmalcodierung und Merkmalskalierung für Ihre Daten zu bestimmen.

Automatisierte Modellauswahl

AutoAI verwendet die automatisierte Modellauswahl, um das beste Modell für Ihre Daten zu ermitteln. Dieser neuartige Ansatz testet potenzielle Modelle anhand kleiner Teilmengen der Daten und stuft sie auf der Basis der Genauigkeit ein. AutoAI wählt dann die vielversprechendsten Modelle aus und erhöht die Größe des Datensubsets, bis die beste Übereinstimmung ermittelt wird. Dieser Ansatz spart Zeit und verbessert die Leistung, indem die potenziellen Modelle basierend auf der Genauigkeit schrittweise eingegrenzt werden.

Informationen zur Handhabung automatisch generierter Pipelines zur Auswahl des besten Modells finden Sie unter AutoAI-Modell auswählen.

Automatisierte Featureentwicklung

Feature-Engineering identifiziert das genaueste Modell, indem Rohdaten in eine Kombination von Features umgewandelt werden, die das Problem am besten darstellen. Dieser einzigartige Ansatz untersucht verschiedene Optionen für die Featurekonstruktion auf strukturierte, nicht erschöpfende Weise und maximiert gleichzeitig schrittweise die Modellgenauigkeit durch den Einsatz von Verstärkungslernen. Dieses Verfahren führt zu einer optimierten Sequenz von Umsetzungen für die Daten, die den Algorithmen des Modellauswahlschritts am besten entsprechen.

Hyperparameteroptimierung

Die Hyperparameteroptimierung optimiert die Modelle mit der besten Leistung. AutoAI verwendet einen neuartigen Hyperparameteroptimierungsalgorithmus für bestimmte Funktionsauswertungen, wie z. B. Modelltraining und Scoring, die für maschinelles Lernen typisch sind. Dieser Ansatz ermittelt schnell das beste Modell trotz langer Auswertungszeiten bei jeder Iteration.

Nächste Schritte

Nutzen Sie das Lernprogramm Schnelleinstieg: Erstellen und Bereitstellen eines Modells für maschinelles Lernen mit AutoAI .

Übergeordnetes Thema: Daten analysieren und Modelle erstellen

War das Thema hilfreich?

0/1000

AutoAI-DatennutzungCopy link to section

AutoAI-ProzessCopy link to section

Erläuterungen zum AutoAI-ProzessCopy link to section

Vorverarbeitung der DatenCopy link to section

Automatisierte ModellauswahlCopy link to section

Automatisierte FeatureentwicklungCopy link to section

HyperparameteroptimierungCopy link to section

Nächste SchritteCopy link to section