Démarrage rapide : Génération et déploiement d'un modèle d'apprentissage automatique avec AutoAI

Vous pouvez automatiser le processus de création d'un modèle d'apprentissage automatique à l'aide de l'outil AutoAI. Lisez à propos de l'outil AutoAI, puis regardez une vidéo et prenez un tutoriel qui convient aux débutants et qui n'a pas besoin de coder.

Service requis Watson Machine Learning

Votre flux de travaux de base inclut les tâches suivantes :

  1. Créez un projet. Les projets sont l'endroit où vous collaborez avec d'autres personnes sur les données.
  2. Ajoutez vos données au projet. Vous pouvez ajouter des fichiers CSV ou des données à partir d'une source de données distante via une connexion.
  3. Créez une expérimentation AutoAI dans le projet.
  4. Passez en revue les pipelines de modèle et enregistrez le pipeline souhaité sous forme de modèle à déployer ou de bloc-notes à personnaliser.
  5. Déployez et testez votre modèle.

En savoir plus sur AutoAI

L'outil graphique AutoAI de Watson Studio analyse vos données et génère automatiquement des pipelines de modèle de candidats personnalisés pour votre problème de modélisation prédictive. Ces pipelines de modèle sont créés de manière itérative à mesure qu'AutoAI analyse votre jeu de données et détecte les transformations de données, les algorithmes et les valeurs de paramètres qui fonctionnent le mieux pour votre problème. Les résultats s'affichent dans un tableau de classement, avec les pipelines de modèle générés automatiquement classifiés en fonction de l'objectif d'optimisation de votre problème.

En savoir plus sur AutoAI

En savoir plus sur les autres méthodes de génération de modèles

Regarder une vidéo sur la création d'un modèle à l'aide d'AutoAI

Regarder une vidéo Regardez cette vidéo pour voir comment créer et exécuter une expérimentation AutoAI basée sur l'exemple de marketing bancaire.

Cette vidéo constitue une alternative visuelle aux procédures figurant dans cette documentation.

  • Durée Retranscription
    00:00 Cette vidéo montre comment exécuter un exemple d'expérimentation AutoAI pour créer un modèle Watson Machine Learning.
    00:08 Démarrez dans un projet Watson Studio et ajoutez à ce projet une nouvelle expérimentation AutoAI.
    00:16 Pour exécuter une expérimentation AutoAI, vous aurez besoin du service Watson Machine Learning.
    00:22 Vous avez la possibilité d'associer un service Watson Machine Learning à ce projet.
    00:29 Vous pouvez créer une instance de service ou sélectionner une instance de service existante.
    00:39 Lorsque vous revenez à la page où vous créez l'expérience, rechargez la page et vous verrez la nouvelle instance de service répertoritée.
    00:48 Pour cette première expérience, vous sélectionnerez un échantillon.
    00:52 L'échantillon "Marketing bancaire" contient des données texto recueillies à partir d'appels téléphoniques à une banque en réponse à une campagne de marketing.
    01:01 Lorsque vous sélectionnez un échantillon, le nom et la description de l'expérience sont remplis pour vous, alors vous êtes prêt à créer l'expérience.
    01:11 Ensuite, le générateur d'expérimentation AutoAI s'affiche.
    01:15 Comme cette expérience provient d'un échantillon, le fichier source de marketing bancaire est déjà sélectionné.
    01:22 Et la colonne à prévoir est également déjà sélectionnée.
    01:26 Dans ce cas, c'est la colonne "y", qui indique si un utilisateur va s'inscrire pour un dépôt à terme dans le cadre de la campagne de marketing.
    01:35 En fonction du fichier et de la colonne sélectionnée pour la prédiction, AutoAI analyse un sous-ensemble des données et choisit un type de prédiction et une métrique à optimiser.
    01:47 Dans ce cas, puisque la colonne à prévoir contient les valeurs "Y" ou "N" (pour oui ou non) la classification binaire a été choisie.
    01:57 La classe positive est "Yes" et la mesure optimisée est ROC AUC.
    02:03 La métrique ROC ROC équilibre la précision, la précision et le rappel.
    02:10 Maintenant, exécutez l'expérience et attendez que le "Pipeline leaderboard" se remplit.
    02:17 Pendant la formation AutoAI, votre ensemble de données est divisé en deux parties: données de formation et données de retenues.
    02:24 Les données de formation sont utilisées par les étapes de formation AutoAI pour générer les pipelines modèles et les scores de validation croisée sont utilisés pour les classer après la formation.
    02:34 Après la formation, les données de retenues sont utilisées pour l'évaluation du modèle de pipeline qui en résulte et le calcul de l'information sur le rendement, comme les courbes ROC et les matrices de confusion.
    02:48 Ensuite, AutoAI génère des pipelines à l'aide de différents estimateurs, tels que le discriminant XGBoost, ou des améliorations, telles que l'optimisation des hyperparamètres et l'ingénierie des fonctions, les pipelines étant classés en fonction de l'indicateur de précision.
    03:06 L'optimisation des hyperparamètres est un mécanisme permettant d'explorer automatiquement un espace de recherche d'hyperparamètres potentiels, de construire une série de modèles et de comparer les modèles à l'aide de métriques d'intérêt.
    03:20 L'ingénierie de fonctionnalité tente de transformer les données brutes dans la combinaison de fonctions qui représente le mieux le problème afin d'atteindre la prévision la plus exacte possible.
    03:31 Ok, la course est terminée.
    03:34 La légende explique où trouver les données, l'algorithme supérieur, les pipelines et les transformateurs de fonctions sur la carte de la relation.
    03:44 Vous pouvez afficher le journal complet pour afficher les détails complets.
    03:48 Par défaut, vous verrez la "mappe de relations", mais vous pouvez échanger des vues pour voir la "mappe de progression".
    03:57 Faites défiler vers le bas pour jeter un coup d'oeil à la direction.
    04:01 Vous pouvez commencer par comparer les pipelines.
    04:05 Ce graphique fournit des métriques pour les huit pipelines, visualisés par score de validation croisée ou par score de retenue.
    04:13 Vous pouvez voir les pipelines classés en fonction d'autres mesures, telles que la précision moyenne.
    04:21 Dans l'onglet "Récapitulatif de l'expérimentation", développez un pipeline pour afficher les mesures d'évaluation du modèle et la courbe ROC.
    04:30 Vous pouvez afficher un pipeline individuel pour afficher plus de détails en plus de la matrice de confusion, de la courbe de rappel de précision, des informations de modèle, des transformations de fonction et de l'importance de la fonction.
    04:49 Ce pipeline a le classement le plus élevé, vous pouvez donc le sauvegarder en tant que modèle d'apprentissage automatique.
    04:55 Il suffit d'accepter les valeurs par défaut et de sauvegarder le modèle.
    05:01 Maintenant que vous avez formé le modèle, vous êtes prêt à afficher le modèle et à le déployer.
    05:06 L'onglet "Présentation" affiche un récapitulatif de modèle et le schéma d'entrée.
    05:12 Pour déployer le modèle, vous devez le promouvoir dans un espace de déploiement.
    05:17 Étant donné que ce projet n'a pas encore d'espace de déploiement associé, vous devez d'abord configurer l'association.
    05:25 Vous pouvez soit sélectionner un espace de déploiement existant, soit créer un espace de déploiement.
    05:31 Lorsque vous créez un espace, fournissez un nom et une description et sélectionnez le service Cloud Object Storage et Watson Machine Learning.
    05:41 Créez ensuite l'espace.
    05:45 Sélectionnez maintenant ce nouvel espace, ajoutez une description pour le modèle et cliquez sur "Promouvoir".
    05:53 Utilisez le lien pour accéder à l'espace de déploiement.
    06:00 Voici le modèle que vous venez de créer, que vous pouvez maintenant déployer.
    06:04 Dans ce cas, il s'agit d'un déploiement en ligne.
    06:08 Il suffit de fournir un nom pour le déploiement et de cliquer sur "Créer".
    06:12 Attendu alors que le modèle est déployé.
    06:16 Une fois le déploiement du modèle terminé, affichez le déploiement.
    06:20 Dans l'onglet "Référence de l'API", vous trouverez le noeud final de scoring pour référence ultérieure.
    06:26 Vous trouverez également des fragments de code pour différents langages de programmation pour utiliser ce déploiement à partir de votre application.
    06:35 Dans l'onglet "Test", vous pouvez tester la prévision du modèle.
    06:40 Vous pouvez entrer des données d'entrée de test ou coller des données d'entrée JSON, puis cliquer sur "Prédire".
    06:52 Cela montre qu'il y a une très forte probabilité que la première personne ne s'abonne pas à un dépôt à terme et qu'il y a une forte probabilité que la seconde personne s'abonne à un dépôt à terme.
    07:06 Et dans le projet, sur l'onglet "Actifs", vous trouverez l'expérience AutoAI et le modèle.
    07:17 Trouvez d'autres vidéos dans la documentation de Cloud Pak for Data as a Service.

Essayer un tutoriel pour créer un modèle à l'aide d'AutoAI

Dans ce tutoriel, vous :

  • Créez un projet.
  • Associez le service Watson Machine Learning au projet.
  • Créez une expérimentation AutoAI dans le projet.
  • Générer et entraîner un modèle.
  • Sauvegarde d'un pipeline comme modèle.
  • Déployez le modèle.
  • Tester le modèle.

Ce tutoriel dure environ 30 minutes.

Données exemple

Les données exemple utilisées dans l'expérience guidée sont des données Marketing bancaire utilisées pour prédire si un client s'engage dans une promotion marketing. Les données sont automatiquement téléchargées et disponibles pour votre utilisation lorsque vous sélectionnez Exemple de galerie comme base de votre expérience.

Etape 1 : Création d'un projet et association du service Watson Machine Learning

{: #step1} Vous avez besoin d'un projet pour stocker l'expérimentation AutoAI.

  1. Si vous avez un projet existant, ouvrez-le. Si vous ne disposez pas d'un projet existant, cliquez sur Créer un projet sur la page d'accueil ou sur Nouveau projet sur votre page Projets.
  2. Sélectionnez Créer un projet vide.
  3. Dans l'écran Créer un projet, ajoutez un nom et une description facultative pour le projet.
  4. Choisissez un Instance de service de stockage d'objets existant ou en créer un nouveau.

  5. Cliquez sur Créer.

  6. Lorsque le projet s'ouvre, cliquez sur l'onglet Gérer et sélectionnez la page Services et intégrations.

  7. Dans la section Services IBM, cliquez sur Associer le service.
  8. Si vous ne disposez pas encore d'une instance de service Watson Machine Learning, cliquez sur Nouveau service, sélectionnez Machine Learning et cliquez sur Créer.
  9. Sélectionnez votre instance Watson Machine Learning et cliquez sur Associer le service.
  10. Fermez la boîte de dialogue Associer le service.

Pour plus d'informations ou pour regarder une vidéo, voir Création d'un projet.
Pour plus d'informations sur les services associés, voir Ajout de services associés.

Etape 2 : Génération et entraînement du modèle

{: #step2} Créez l'expérimentation AutoAI, consultez les pipelines modèles et sélectionnez un pipeline à enregistrer en tant que modèle.

  1. Dans l'onglet Actifs de votre projet, cliquez sur Nouvel actif > AutoAI Experiment.
  2. Dans la page qui s'ouvre, renseignez les zones de base :
    1. Cliquez sur Exemple de galerieet sélectionnez Données d'échantillon de marketing bancaire. Le nom du projet et sa description seront remplis pour vous.
    2. Confirmez que l'instance de service Learning Machine que vous avez associée à votre projet est sélectionnée dans la section service d'apprentissage automatique.
  3. Cliquez sur Créer.
  4. Dans cet exemple d'expérience AutoAI, vous verrez que le Données d'échantillon de marketing bancaire est déjà sélectionné pour votre expérience.
  5. La colonne "Y" est automatiquement sélectionnée pour le modèle. Cette colonne sera utilisée pour prévoir si un client est susceptible de souscrire à une promotion marketing. AutoAI analyse vos données et détermine que la colonne Y contient des informations True/False, ce qui rend ces données adaptées à un modèle de classification binaire. La métrique par défaut pour une classification binaire est ROC/AUC.
  6. En fonction du fichier et de la colonne sélectionnée pour la prédiction, AutoAI analyse un sous-ensemble des données et choisit un type de prédiction et une métrique à optimiser. Dans ce cas, le type de prévision est Classification binaire, la classe positive est Ouiet la mesure optimisée est AUC ROC.
  7. Cliquez sur Run experiment. Au fur et à mesure de l'entraînement du modèle, un schéma infographique présente le processus de génération des pipelines.
  8. Une fois la création de pipeline terminée, vous pouvez afficher et comparer les pipelines classés dans le tableau de classement.
  9. Sélectionnez le pipeline le plus élevé et choisissez Enregistrer le modèle dans le menu d'action. Cette action sauvegarde le pipeline en tant qu'actif Machine Learning dans votre projet.
  10. Lorsque le modèle est sauvegardé, cliquez sur le lien Vue dans le projet dans la notification pour afficher le modèle dans votre projet. Vous pouvez également accéder à l'onglet Actifs du projet et cliquer sur le nom du modèle dans la section Modèle d'apprentissage machine.

Etape 3 : Promotion du modèle dans un espace de déploiement et déploiement du modèle entraîné

Vous pouvez maintenant promouvoir le modèle dans un espace de déploiement pour déployer le modèle.

  1. Cliquez sur Promouvoir vers un espace de déploiement.
  2. Choisissez un espace de déploiement existant. Si vous n'avez pas d'espace de déploiement, vous pouvez en créer un nouveau :
    1. Indiquez un nom d'espace et une description facultative.
    2. Sélectionnez un service de stockage.
    3. Sélectionnez un service d'apprentissage automatique.
    4. Cliquez sur Créer.
    5. Cliquez sur Close.
  3. Cliquez sur Promouvoir.
  4. Lorsque le modèle est promu, cliquez sur le lien Espace de déploiement dans la notification pour afficher le modèle dans votre projet. Vous pouvez également utiliser le menu de navigation pour accéder à Déploiementset cliquer sur le nom de l'espace de déploiement.
  5. En regard du nom du modèle, cliquez sur l'icône Déployer.
    1. Sélectionnez En ligne comme Type de déploiement.
    2. Indiquez un nom pour le déploiement.
    3. Cliquez sur Créer.
  6. Cliquez sur l'onglet Déploiements et attendez que le modèle soit déployé.
  7. Une fois le déploiement terminé, cliquez sur le nom du déploiement pour afficher la page des détails de déploiement.

Etape 4 : Test du modèle déployé

{: #step4} Utilisez le déploiement pour tester le modèle avec de nouvelles données.

  1. Cliquez sur l'onglet Test. Vous pouvez tester le modèle déployé à partir de la page des détails du déploiement des deux manières suivantes : test avec un formulaire ou test avec du code JSON.
  2. Cliquez sur l'icône dans Fournir des données d'entrée au format JSON, puis copiez les données de test suivantes et collez-la dans la zone du texte JSON :

    {"input_data":[{
            "fields": ["age","job","marital","education","default","balance","housing","loan","contact","day", "month","duration","campaign","pdays","previous","poutcome"],
            "values": [[27,"unemployed", "married", "primary", "no",1787,"no", "no","cellular",19,"oct", 79, 1, -1, 0, "unknown" ]]
    }]}
    
  3. Cliquez sur Prédit pour prédire si un client avec les attributs spécifiés est susceptible de s'inscrire pour un type de compte particulier. La prédiction qui en résulte indique qu'il existe une forte probabilité pour que ce client ne souscrive pas à la promotion marketing.

Etapes suivantes

A présent, vous pouvez utiliser ce fichier pour une analyse plus approfondie. Par exemple, vous ou d'autres utilisateurs pouvez effectuer l'une des tâches suivantes :

Autres ressources

Rubrique parent : Initiation à la génération, au déploiement et à la confiance