Il seguente elenco contiene i problemi più comuni noti per AutoAI. Se l'esperimento AutoAI non riesce ad essere eseguito o distribuito correttamente, esaminare alcuni di questi problemi e risoluzioni comuni.
Accelerare l'addestramento degli esperimenti con grandi insiemi di dati
Se si nota che l'addestramento di un modello si interrompe o richiede un tempo insolitamente lungo, considerare le seguenti linee guida per ridurre il tempo di addestramento:
Dalle pagine delle impostazioni dell'esperimento dello strumento AutoAI:
- Assicuratevi che l'opzione Selezione algoritmo ottimizzato sia impostata su Punteggi e tempi di esecuzione.
- Disabilita il modello XGBRegressor. Questa regolazione può aiutare a ottenere risultati più rapidamente, ma i punteggi potrebbero essere leggermente inferiori.
Per un esperimento codificato:
- Passare il parametro '
daub_give_priority_to_runtime
come descritto nel parametro 'Documentazione SDK.Nota: Questo parametro può aumentare l'indeterminismo (irriproducibilità) dell'esperimento.
Il passaggio di un valore di input incompleto o anomalo alla distribuzione può portare alla previsione di valori anomali
Dopo aver distribuito il tuo modello di machine learning, tieni presente che fornire dati di input notevolmente diversi dai dati utilizzati per addestrare il modello può produrre una previsione di valori anomali. Quando agli algoritmi di regressione lineare come Ridge e LinearRegression viene passato un valore di input fuori scala, il modello estrapola i valori e gli assegna un peso relativamente grande, producendo un punteggio che non è in linea con i dati conformi.
La pipeline di Tempo Series con funzioni di supporto fallisce sul richiamo
Se si addestra un esperimento di serie temporali AutoAI utilizzando le funzioni di supporto e si riceve l'errore 'Errore: il nome' tspy_interpolators 'non è definito' quando il sistema tenta di richiamare la pipeline per le previsioni, verificare che il sistema stia eseguendo Java 8 o superiore.
L'esecuzione di un notebook o di un notebook non riesce con un errore di specifica del software
Se le specifiche software supportate per gli esperimenti AutoAI cambiano, potresti ricevere un errore quando esegui un notebook creato con una specifica software precedente, come una versione precedente di Python. In questo caso, eseguire nuovamente l'esperimento, quindi salvare un nuovo notebook e riprovare.
Risoluzione di un errore Out of Memory
Se si riceve un errore di memoria quando si esegue una cella da un notebook generato da AutoAI , creare un runtime del notebook con più risorse per il notebook AutoAI ed eseguire nuovamente la cella.
Notebook per un esperimento con sottocampionamento può non generare previsioni
Se si esegue una raffinazione della pipeline per preparare il modello e l'esperimento utilizza un sottocampionamento dei dati durante l'addestramento, è possibile che si verifichi un errore di "classe sconosciuta" quando si esegue un notebook salvato dall'esperimento.
Il problema deriva da una classe sconosciuta non inclusa nel dataset di addestramento. Il workaround è quello di utilizzare l'intero set di dati per la formazione o ricreare il sottocampionamento utilizzato nell'esperimento.
Per sottocampionare i dati formativi (prima di fit()
), fornire la dimensione del campione per numero di righe o per frazione del campione (come fatto nell'esperimento).
Se il numero di record è stato utilizzato nelle impostazioni di sottocampionamento, è possibile aumentare il valore di
n
. Ad esempio:train_df = train_df.sample(n=1000)
Se il sottocampionamento è rappresentato come una frazione del dataset, aumentare il valore di
frac
. Ad esempio:train_df = train_df.sample(frac=0.4, random_state=experiment_metadata['random_state'])
Creazione pipeline non riesce per la classificazione binaria
AutoAI analizza un sottoinsieme di dati per determinare la soluzione migliore per il tipo di esperimento. Se i dati di esempio nella colonna di previsione contengono solo due valori, AutoAI consiglia un esperimento di classificazione binaria e applica gli algoritmi correlati. Tuttavia, se l'intero dataset contiene più di due valori nella colonna di previsione, la classificazione binaria non riesce e si riceve un errore che indica che AutoAI non è in grado di creare le pipeline.
In questo caso, cambiare manualmente il tipo di esperimento da binario a multiclass, per una serie definita di valori, o regressione, per una serie non specificata di valori.
- Clicca sull'icona Reconfigurare Experiment per modificare le impostazioni dell'esperimento.
- Nella pagina Previsione di Impostazioni esperimento, modificare il tipo di previsione in quello che meglio corrisponde ai dati nella colonna di previsione.
- Salva i cambiamenti e corri di nuovo l'esperimento.
Passi successivi
Argomento principale AutoAI