Die folgende Liste enthält die häufigsten Probleme, die für AutoAIbekannt sind. Wenn Ihr AutoAI-Experiment nicht erfolgreich ausgeführt oder bereitgestellt werden kann, prüfen Sie einige dieser allgemeinen Probleme und Lösungen.
Beschleunigung des Experimentierens mit großen Datensätzen
Wenn Sie feststellen, dass das Training eines Modells zu lange dauert, sollten Sie diese Richtlinien zur Verkürzung der Trainingszeit beachten:
Auf den Experiment-Einstellungsseiten des AutoAI-Tools:
- Stellen Sie sicher, dass die Option Optimierte Algorithmusauswahl auf Score und Laufzeit eingestellt ist.
- Deaktivieren Sie das Modell XGBRegressor. Durch diese Anpassung können Sie schneller zu Ergebnissen kommen, aber die Punktzahl könnte etwas niedriger sein.
Für ein kodiertes Experiment:
- Übergeben Sie den Parameter "
daub_give_priority_to_runtime
wie in der SDK-Dokumentation beschrieben.Hinweis: Dieser Parameter kann den Indeterminismus (Unreproduzierbarkeit) des Experiments erhöhen.
Die Übergabe eines unvollständigen Eingabewerts oder eines Ausreißereingabewerts an die Bereitstellung kann zu einer Ausreißervorhersage führen.
Nachdem Sie Ihr Modell für maschinelles Lernen bereitgestellt haben, beachten Sie, dass die Bereitstellung von Eingabedaten, die sich deutlich von den Daten unterscheiden, die zum Trainieren des Modells verwendet werden, eine Ausreißervorhersage erzeugen kann. Wenn lineare Regressionsalgorithmen wie Ridge und LinearRegression an einen Eingabewert außerhalb des Maßstabs übergeben werden, extrapoliert das Modell die Werte und weist ihm eine relativ große Gewichtung zu. Dies führt zu einem Score, der nicht den konformen Daten entspricht.
Zeitreihenpipeline mit unterstützenden Funktionen schlägt beim Abrufen fehl
Wenn Sie ein AutoAI -Zeitreihenexperiment mithilfe unterstützender Funktionen trainieren und der Fehler 'Error: name' tspy_interpolators 'is not defined' angezeigt wird, wenn das System versucht, die Pipeline für Vorhersagen abzurufen, überprüfen Sie, ob auf Ihrem System Java 8 oder höher ausgeführt wird.
Die Ausführung eines Notebooks für eine Pipeline oder ein Experiment schlägt mit einem Softwarespezifikationsfehler fehl
Wenn sich unterstützte Softwarespezifikationen für AutoAI -Experimente ändern, erhalten Sie möglicherweise einen Fehler, wenn Sie ein Notebook ausführen, das mit einer älteren Softwarespezifikation erstellt wurde, z. B. mit einer älteren Version von Python. Führen Sie in diesem Fall das Experiment erneut aus, speichern Sie dann ein neues Notebook und versuchen Sie es erneut.
Fehler aufgrund abnormaler Speicherbedingungen beheben
Wenn beim Ausführen einer Zelle über ein AutoAI generiertes Notebook ein Speicherfehler auftritt, erstellen Sie eine Notebook-Laufzeit mit mehr Ressourcen für das AutoAI -Notebook und führen Sie die Zelle erneut aus.
Notebook für ein Experiment mit Subsampling kann keine Vorhersagen generieren
Wenn Sie Pipeline Refinery ausführen, um das Modell vorzubereiten, und das Experiment während des Trainings eine Teilstichprobe der Daten verwendet, tritt möglicherweise ein Fehler aufgrund einer unbekannten Klasse auf, wenn Sie ein Notebook ausführen, das aus dem Experiment gespeichert wurde.
Das Problem stammt von einer unbekannten Klasse, die nicht im Trainingsdataset enthalten ist. Die Problemumgehung besteht darin, das gesamte Dataset für das Training zu verwenden oder die im Experiment verwendete Unterstichprobe neu zu erstellen.
Zum Erstellen einer Teilstichprobe (Subsampling) der Trainingsdaten (vor fit()
) müssen Sie den Stichprobenumfang über die Anzahl Zeilen oder über einen Bruchteil der Stichprobe angeben (wie im Experiment geschehen).
Wenn in den Einstellungen für das Subsampling die Anzahl Datensätze verwendet wurde, können Sie den Wert von
n
erhöhen. Beispiel:train_df = train_df.sample(n=1000)
Wenn das Subsampling als Bruchteil des Datasets dargestellt wird, erhöhen Sie den Wert von
frac
. Beispiel:train_df = train_df.sample(frac=0.4, random_state=experiment_metadata['random_state'])
Pipelineerstellung schlägt für Binärklassifikation fehl
AutoAI analysiert eine Teilmenge der Daten, um die beste Anpassung für den Experimenttyp zu ermitteln. Wenn die Beispieldaten in der Vorhersagespalte nur zwei Werte enthalten, empfiehlt AutoAI ein binäres Klassifikationsexperiment und wendet die zugehörigen Algorithmen an. Wenn das vollständige Dataset jedoch mehr als zwei Werte in der Vorhersagespalte enthält, schlägt die binäre Klassifizierung fehl und Sie erhalten einen Fehler, der angibt, dass AutoAI die Pipelines nicht erstellen kann.
In diesem Fall ändern Sie den Experimenttyp manuell von binär entweder in eine Mehrklassenklassifikation (für eine definierte Gruppe von Werten) oder in eine Regression (für eine nicht angegebene Gruppe von Werten).
- Klicken Sie auf das Symbol Experiment neu konfigurieren, um die Experimenteinstellungen zu bearbeiten.
- Ändern Sie auf der Seite Vorhersage der Experimenteinstellungen den Vorhersagetyp in den Typ, der am besten mit den Daten in der Vorhersagespalte übereinstimmt.
- Speichern Sie die Änderungen und führen Sie das Experiment erneut aus.
Nächste Schritte
Übergeordnetes Thema: AutoAI - Übersicht