0 / 0
Retourner à la version anglaise de la documentation
Présentation d'AutoAI
Dernière mise à jour : 21 nov. 2024
Présentation d'AutoAI

L'outil graphique AutoAI analyse vos données et utilise des algorithmes de données, des transformations et des paramètres pour créer le meilleur modèle prédictif. AutoAI affiche divers modèles potentiels en tant que pipelines de candidats de modèle et les classe sur un tableau de classement parmi lesquels vous pouvez faire votre choix.

service requis
watsonx.ai Runtime
studio watsonx.ai
Titres de compétences requis
Références des tâches
Format des données
Tabulaire: fichiers CSV, avec une virgule (,) comme délimiteur pour tous les types d'expérimentations AutoAI .
Données connectées à partir du IBM Cloud Object Storage
Taille des données
Jusqu'à 1 Go ou jusqu'à 20 Go. Pour plus de détails, voir Utilisation des donnéesAutoAI.

Utilisation des données AutoAI

Les données d'entraînement et les données d'entrée de modèle sont présentées sous forme de tableau. Les noms de colonne de la table doivent être uniques. Les noms de colonne en double entraîneront une erreur.

Ces limites sont basées sur la configuration de calcul par défaut de 8 UC et 32 Go.

Expérimentations de classification et de régression AutoAI :

  • Vous pouvez télécharger un fichier jusqu'à 1 Go pour les expérimentations AutoAI .
  • Si vous vous connectez à une source de données qui dépasse 1 Go, seuls les premiers 1 Go d'enregistrements sont utilisés.

Expérimentations de séries temporelles AutoAI :

  • Si la source de données contient une colonne d'horodatage, AutoAI échantillonne les données à une fréquence uniforme. Par exemple, les données peuvent être par incréments d'une minute, d'une heure ou d'un jour. L'horodatage spécifié est utilisé pour déterminer la fenêtre de récupération des consultations afin d'améliorer la précision du modèle.

    Remarque :

    Si la taille du fichier est supérieure à 1 Go, AutoAi trie les données dans l'ordre temporel décroissant et seuls les 1 Go sont utilisés pour entraîner l'expérimentation.

  • Si la source de données ne contient pas de colonne d'horodatage, vérifiez que AutoAI échantillonne les données à intervalles réguliers et trie les données dans l'ordre temporel croissant . Un ordre de tri croissant signifie que la valeur de la première ligne est la plus ancienne et que la valeur de la dernière ligne est la plus récente.

    Remarque: si la taille du fichier est supérieure à 1 Go, tronquez la taille du fichier pour qu'elle soit inférieure à 1 Go.

Pour plus d'informations sur le choix de l'outil approprié pour vos données et cas d'utilisation, voir Choix d'un outil.

Processus AutoAI

Avec AutoAI, vous pouvez générer et déployer un modèle d'apprentissage automatique avec des fonctions d'entraînement sophistiquées et aucun codage. L'outil effectue le plus gros du travail pour vous.

Pour afficher le code qui a créé une expérimentation particulière ou interagir avec l'expérimentation à l'aide d'un programme, vous pouvez enregistrer une expérimentation comme bloc-notes.

Le processus AutoAI prend les données d'un fichier structuré, prépare les données, sélectionne le type de modèle et génère et classe les pipelines afin que vous puissiez sauvegarder et déployer un modèle.

AutoAI exécute automatiquement les tâches suivantes pour générer et évaluer des pipelines de modèle candidats :

Comprendre le processus AutoAI

Pour plus de détails sur chacune de ces phases, y compris des liens vers des documents de recherche associés et des descriptions des algorithmes appliqués pour créer les pipelines de modèle, voir Détails de l'implémentation AutoAI.

Prétraitement des données

La plupart des jeux de données contiennent des formats de données et des valeurs manquantes différents, mais les algorithmes d'apprentissage automatique standard ne fonctionnent qu'avec des nombres et aucune valeur manquante. Par conséquent, AutoAI applique divers algorithmes ou estimateurs pour analyser, nettoyer et préparer vos données brutes pour l'apprentissage automatique. Cette technique détecte et catégorise automatiquement les valeurs en fonction de caractéristiques, telles que le type de données: catégoriel ou numérique. En fonction de la catégorisation, AutoAI utilise l' optimisation des hyperparamètres pour déterminer la meilleure combinaison de stratégies pour l'imputation des valeurs manquantes, le codage des fonctions et la mise à l'échelle des fonctions pour vos données.

Sélection de modèle automatisée

AutoAI utilise la sélection de modèle automatisée pour identifier le meilleur modèle pour vos données. Cette nouvelle approche teste les modèles potentiels par rapport à de petits sous-ensembles de données et les classe en fonction de la précision. AutoAI sélectionne ensuite les modèles les plus prometteurs et augmente la taille du sous-ensemble de données jusqu'à ce qu'il identifie la meilleure correspondance. Cette approche permet d'économiser du temps et d'améliorer les performances en réduisant progressivement les modèles potentiels en fonction de la précision.

Pour plus d'informations sur la gestion des pipelines générés automatiquement pour sélectionner le meilleur modèle, voir Sélection d'un modèle AutoAI.

Ingénierie de fonctionnalité automatisée

L'ingénierie des fonctions identifie le modèle le plus précis en transformant les données brutes en une combinaison de fonctions qui représentent le mieux le problème. Cette approche unique explore les différents choix de construction de caractéristiques d'une manière structurée et non exhaustive, tout en maximisant progressivement la précision du modèle en utilisant l'apprentissage par renforcement. Cette technique permet d'obtenir une séquence optimisée de transformations pour les données qui correspondent le mieux aux algorithmes de l'étape de sélection du modèle.

Optimisation d'hyperparamètres

L'optimisation des hyperparamètres affine les modèles les plus performants. AutoAI utilise un nouvel algorithme d'optimisation d'hyperparamètres pour certaines évaluations de fonction, telles que l'apprentissage et le scoring des modèles, qui sont typiques de l'apprentissage automatique. Cette approche identifie rapidement le meilleur modèle malgré de longs temps d'évaluation à chaque itération.

Etapes suivantes

Essayez le tutoriel Démarrage rapide: Génération et déploiement d'un modèle d'apprentissage automatique avec AutoAI .

Rubrique parent: Analyse des données et génération de modèles

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus