0 / 0
Zurück zur englischen Version der Dokumentation
AutoAI Übersicht
Letzte Aktualisierung: 21. Nov. 2024
AutoAI Übersicht

Das Grafiktool AutoAI analysiert Ihre Daten und verwendet Datenalgorithmen, Transformationen und Parametereinstellungen, um das beste Vorhersagemodell zu erstellen. AutoAI zeigt verschiedene potenzielle Modelle als Modellkandidatenpipelines an und stuft sie in einer Bestenliste ein, aus der Sie auswählen können.

Erforderlicher Service
watsonx.ai Laufzeit
watsonx.ai Studio
Erforderliche Bescheinigungen
Aufgaben-Anmeldeinformationen
Datenformat
Tabellarisch: CSV-Dateien mit Komma (,) als Trennzeichen für alle Typen von AutoAI -Experimenten.
Verbundene Daten aus IBM Cloud Object Storage.
Data Size
Bis zu 1 GB oder bis zu 20 GB. Details finden Sie unter AutoAI -Datennutzung.

AutoAI-Datennutzung

Trainingsdaten und Modelleingabedaten haben ein Tabellenformat. Die Spaltennamen in der Tabelle müssen eindeutig sein. Doppelte Spaltennamen führen zu einem Fehler.

Diese Grenzwerte basieren auf der Standardrechenkonfiguration von 8 CPUs und 32 GB.

AutoAI -Klassifikations-und Regressionsexperimente:

  • Sie können eine Datei mit bis zu 1 GB für AutoAI -Experimente hochladen.
  • Wenn Sie eine Verbindung zu einer Datenquelle herstellen, die 1 GB überschreitet, werden nur die ersten 1 GB Datensätze verwendet.

AutoAI -Zeitreihenexperimente:

  • Wenn die Datenquelle eine Zeitmarkenspalte enthält, erfasst AutoAI die Daten mit einer einheitlichen Häufigkeit. Daten können beispielsweise in Inkrementen von einer Minute, einer Stunde oder einem Tag angegeben werden. Die angegebene Zeitmarke wird zur Bestimmung des Lookback-Fensters verwendet, um die Modellgenauigkeit zu verbessern.

    Hinweis:

    Wenn die Dateigröße größer als 1 GB ist, sortiert AutoAi die Daten in absteigender Zeitreihenfolge und nur die ersten 1 GB werden zum Trainieren des Experiments verwendet.

  • Wenn die Datenquelle keine Zeitmarkenspalte enthält, stellen Sie sicher, dass AutoAI Stichproben der Daten in gleichmäßigen Intervallen erstellt und die Daten in aufsteigender Zeitreihenfolge sortiert. Eine aufsteigende Sortierreihenfolge bedeutet, dass der Wert in der ersten Zeile der älteste und der Wert in der letzten Zeile der aktuellste ist.

    Hinweis: Wenn die Dateigröße größer als 1 GB ist, schneiden Sie die Dateigröße ab, sodass sie kleiner als 1 GB ist.

Weitere Informationen zur Auswahl des richtigen Tools für Ihre Daten und Ihren Anwendungsfall finden Sie unter Tool auswählen.

AutoAI-Prozess

Mit AutoAI können Sie ein Modell für maschinelles Lernen mit hoch entwickelten Trainingsfunktionen und ohne Codierung erstellen und bereitstellen. Das Tool übernimmt die meiste Arbeit.

Sie können ein Experiment als Notebook speichern, um den Code anzuzeigen, über den ein bestimmtes Experiment erstellt wurde, oder um programmgesteuert mit dem Experiment interagieren zu können.

Der AutoAI -Prozess verwendet Daten aus einer strukturierten Datei, bereitet die Daten vor, wählt den Modelltyp aus und generiert Pipelines und ordnet sie an, sodass Sie ein Modell speichern und bereitstellen können.

AutoAI führt die folgenden Tasks automatisch aus, um Kandidaten für Modellpipelines zu erstellen und zu auszuwerten:

Erläuterungen zum AutoAI-Prozess

Weitere Details zu den einzelnen Phasen, einschließlich von Links zu zugehörigen Forschungsarbeiten und zu Beschreibungen von Algorithmen, die zum Erstellen der Modellpipelines angewendet werden, finden Sie unter AutoAI-Bereitstellungsdetails.

Vorverarbeitung der Daten

Die meisten Datasets enthalten unterschiedliche Datenformate und fehlende Werte, aber Standardalgorithmen für maschinelles Lernen funktionieren nur mit Zahlen und ohne fehlende Werte. Daher wendet AutoAI verschiedene Algorithmen oder Schätzer an, um Ihre Rohdaten für maschinelles Lernen zu analysieren, zu bereinigen und vorzubereiten. Dieses Verfahren erkennt und kategorisiert Werte automatisch auf der Basis von Merkmalen wie dem Datentyp: kategorial oder numerisch. Je nach Kategorisierung verwendet AutoAI die Hyperparameteroptimierung , um die beste Kombination von Strategien für Imputation fehlender Werte, Merkmalcodierung und Merkmalskalierung für Ihre Daten zu bestimmen.

Automatisierte Modellauswahl

AutoAI verwendet die automatisierte Modellauswahl, um das beste Modell für Ihre Daten zu ermitteln. Dieser neuartige Ansatz testet potenzielle Modelle anhand kleiner Teilmengen der Daten und stuft sie auf der Basis der Genauigkeit ein. AutoAI wählt dann die vielversprechendsten Modelle aus und erhöht die Größe des Datensubsets, bis die beste Übereinstimmung ermittelt wird. Dieser Ansatz spart Zeit und verbessert die Leistung, indem die potenziellen Modelle basierend auf der Genauigkeit schrittweise eingegrenzt werden.

Informationen zur Handhabung automatisch generierter Pipelines zur Auswahl des besten Modells finden Sie unter AutoAI-Modell auswählen.

Automatisierte Merkmalentwicklung

Feature-Engineering identifiziert das genaueste Modell, indem Rohdaten in eine Kombination von Features umgewandelt werden, die das Problem am besten darstellen. Dieser einzigartige Ansatz untersucht verschiedene Optionen für die Featurekonstruktion auf strukturierte, nicht erschöpfende Weise und maximiert gleichzeitig schrittweise die Modellgenauigkeit durch den Einsatz von Verstärkungslernen. Dieses Verfahren führt zu einer optimierten Sequenz von Umsetzungen für die Daten, die den Algorithmen des Modellauswahlschritts am besten entsprechen.

Hyperparameteroptimierung

Die Hyperparameteroptimierung optimiert die Modelle mit der besten Leistung. AutoAI verwendet einen neuartigen Hyperparameteroptimierungsalgorithmus für bestimmte Funktionsauswertungen, wie z. B. Modelltraining und Scoring, die für maschinelles Lernen typisch sind. Dieser Ansatz ermittelt schnell das beste Modell trotz langer Auswertungszeiten bei jeder Iteration.

Nächste Schritte

Nutzen Sie das Lernprogramm Schnelleinstieg: Erstellen und Bereitstellen eines Modells für maschinelles Lernen mit AutoAI .

Übergeordnetes Thema: Daten analysieren und Modelle erstellen

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen