La liste suivante répertorie les problèmes courants connus pour AutoAI. Si votre expérimentation AutoAI ne parvient pas à s'exécuter ou se déployer correctement, examinez certains des problèmes courants et les résolutions correspondantes.
Accélérer l'entraînement à l'expérimentation avec de grands ensembles de données
Si vous constatez que la formation d'un modèle est interrompue ou prend un temps anormalement long, tenez compte des conseils suivants pour réduire la durée de la formation :
Dans les pages de paramétrage de l'expérience de l'outil AutoAI :
- Assurez-vous que l'option Sélection optimisée d'algorithmes est réglée sur Score et temps d'exécution.
- Désactive le modèle XGBRegressor. Cette adaptation peut vous permettre d'obtenir des résultats plus rapidement, mais les scores risquent d'être légèrement inférieurs.
Pour une expérience codée :
- Passer le paramètre "
daub_give_priority_to_runtime
comme décrit dans la documentation du SDK.Note: Ce paramètre peut augmenter l'indéterminisme (non reproductibilité) de l'expérience.
La transmission d'une valeur d'entrée incomplète ou aberrante au déploiement peut conduire à une prévision des valeurs extrêmes
Après avoir déployé votre modèle d'apprentissage automatique, notez que le fait de fournir des données d'entrée nettement différentes des données utilisées pour entraîner le modèle peut générer une prévision des valeurs extrêmes. Lorsque des algorithmes de régression linéaire tels que Ridge et LinearRegression sont transmis hors de l'échelle, le modèle extrapole les valeurs et leur affecte une pondération relativement importante, produisant un score qui n'est pas conforme aux données de conformité.
Le pipeline de séries temporelles avec les fonctions de prise en charge échoue lors de l'extraction
Si vous entraînez une expérimentation de séries temporelles AutoAI à l'aide de fonctions de support et que vous obtenez l'erreur'Error: name'tspy_interpolators'is not defined'lorsque le système tente d'extraire le pipeline pour les prévisions, vérifiez que votre système exécute Java 8 ou version ultérieure.
L'exécution d'un bloc-notes de pipeline ou d'expérimentation échoue avec une erreur de spécification logicielle
Si les spécifications logicielles prises en charge pour les expérimentations AutoAI changent, vous risquez d'obtenir une erreur lorsque vous exécutez un bloc-notes généré avec une spécification logicielle plus ancienne, telle qu'une version plus ancienne de Python. Dans ce cas, exécutez à nouveau l'expérimentation, puis enregistrez un nouveau bloc-notes et réessayez.
Résolution d'une erreur de mémoire insuffisante
Si vous obtenez une erreur de mémoire lorsque vous exécutez une cellule à partir d'un bloc-notes généré par AutoAI , créez un environnement d'exécution de bloc-notes avec plus de ressources pour le bloc-notes AutoAI et exécutez à nouveau la cellule.
Le bloc-notes d'une expérimentation avec un sous-échantillonnage peut ne pas parvenir à générer des prévisions
Si vous effectuez une opération d'affinage de pipeline pour préparer le modèle et que l'expérimentation utilise le sous-échantillonnage des données lors de l'entraînement, vous risquez de rencontrer une erreur de classe "inconnue" lorsque vous exécutez un bloc-notes qui est sauvegardé à partir de l'expérimentation.
Le problème provient d'une classe inconnue qui n'est pas incluse dans le jeu de données d'apprentissage. La solution consiste à utiliser l'intégralité du jeu de données pour l'entraînement ou à recréer le sous-échantillonnage utilisé dans l'expérimentation.
Pour faire un sous-échantillon les données d'apprentissage (avant fit()
), fournir la taille de l'échantillon par nombre de lignes ou par fraction de l'échantillon (comme cela a été fait dans l'expérience).
Si le nombre d'enregistrements a été utilisé dans les paramètres de sous-échantillonnage, vous pouvez augmenter la valeur de
n
. Par exemple :train_df = train_df.sample(n=1000)
Si le sous-échantillonnage est représenté comme une fraction du fichier, augmentez la valeur de
frac
. Par exemple :train_df = train_df.sample(frac=0.4, random_state=experiment_metadata['random_state'])
Echec de la création de pipeline pour la classification binaire
AutoAI analyse un sous-ensemble des données pour déterminer la meilleure concordance pour le type d'expérimentation. Si les exemples de données dans la colonne de prévision ne contiennent que deux valeurs, AutoAI recommande une expérimentation de classification binaire et applique les algorithmes associés. Toutefois, si le jeu de données complet contient plus de deux valeurs dans la colonne de prévision, la classification binaire échoue et vous obtenez une erreur indiquant que AutoAI ne peut pas créer les pipelines.
Dans ce cas, remplacez manuellement le type d'expérimentation Binaire par Multiclasse, pour un ensemble de valeurs défini, ou par Régression, pour un ensemble de valeurs non spécifié.
- Cliquez sur l'icône Reconfigurer l'expérimentation pour modifier les paramètres de l'expérimentation.
- Sur la page Prévision des paramètres de l'expérimentation, remplacez le type de prévision par celui qui correspond le mieux aux données de la colonne de prévision.
- Sauvegardez les modifications et réexécutez l'expérimentation.
Etapes suivantes
Rubrique parent : Présentation d'AutoAI