Démarrage rapide : Génération et déploiement d'un modèle d'apprentissage automatique avec AutoAI
Vous pouvez automatiser le processus de création d'un modèle d'apprentissage automatique à l'aide de l'outil AutoAI. Lisez à propos de l'outil AutoAI, puis regardez une vidéo et prenez un tutoriel qui convient aux débutants et qui n'a pas besoin de coder.
- Services requis
- Watson Studio
- Watson Machine Learning
Votre flux de travaux de base inclut les tâches suivantes :
- Créez un projet. Les projets sont l'endroit où vous collaborez avec d'autres personnes sur les données.
- Ajoutez vos données au projet. Vous pouvez ajouter des fichiers CSV ou des données à partir d'une source de données distante via une connexion.
- Créez une expérimentation AutoAI dans le projet.
- Passez en revue les pipelines de modèle et enregistrez le pipeline souhaité sous forme de modèle à déployer ou de bloc-notes à personnaliser.
- Déployez et testez votre modèle.
En savoir plus sur AutoAI
L'outil graphique AutoAI analyse automatiquement vos données et génère des pipelines de modèle candidat personnalisés pour votre problème de modélisation prédictive. Ces pipelines de modèle sont créés de manière itérative à mesure qu'AutoAI analyse votre jeu de données et détecte les transformations de données, les algorithmes et les valeurs de paramètres qui fonctionnent le mieux pour votre problème. Les résultats s'affichent dans un tableau de classement, avec les pipelines de modèle générés automatiquement classifiés en fonction de l'objectif d'optimisation de votre problème.
En savoir plus sur les autres méthodes de génération de modèles
Regarder une vidéo sur la création d'un modèle à l'aide d'AutoAI
Regardez cette vidéo pour voir comment créer et exécuter une expérimentation AutoAI basée sur l'exemple de marketing bancaire.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Retranscription de la vidéo Heure Transcription 00:00 Cette vidéo montre comment exécuter un exemple d'expérimentation AutoAI pour créer un modèle Watson Machine Learning. 00:08 Démarrez dans un projet Watson Studio et ajoutez à ce projet une nouvelle expérimentation AutoAI. 00:16 Pour exécuter une expérimentation AutoAI, vous aurez besoin du service Watson Machine Learning. 00:22 Vous avez la possibilité d'associer un service Watson Machine Learning à ce projet. 00:29 Vous pouvez créer une instance de service ou sélectionner une instance de service existante. 00:39 Lorsque vous revenez à la page où vous créez l'expérience, rechargez la page et vous verrez la nouvelle instance de service répertoritée. 00:48 Pour cette première expérience, vous sélectionnerez un échantillon. 00:52 L'échantillon "Marketing bancaire" contient des données texto recueillies à partir d'appels téléphoniques à une banque en réponse à une campagne de marketing. 01:01 Lorsque vous sélectionnez un échantillon, le nom et la description de l'expérience sont remplis pour vous, alors vous êtes prêt à créer l'expérience. 01:11 Ensuite, le générateur d'expérimentation AutoAI s'affiche. 01:15 Comme cette expérience provient d'un échantillon, le fichier source de marketing bancaire est déjà sélectionné. 01:22 Et la colonne à prévoir est également déjà sélectionnée. 01:26 Dans ce cas, c'est la colonne "y", qui indique si un utilisateur va s'inscrire pour un dépôt à terme dans le cadre de la campagne de marketing. 01:35 En fonction du fichier et de la colonne sélectionnée pour la prédiction, AutoAI analyse un sous-ensemble des données et choisit un type de prédiction et une métrique à optimiser. 01:47 Dans ce cas, puisque la colonne à prévoir contient les valeurs "Y" ou "N" (pour oui ou non) la classification binaire a été choisie. 01:57 La classe positive est "Yes" et la mesure optimisée est ROC AUC. 02:03 La métrique ROC ROC équilibre la précision, la précision et le rappel. 02:10 Maintenant, exécutez l'expérience et attendez que le "Pipeline leaderboard" se remplit. 02:17 Pendant la formation AutoAI, votre ensemble de données est divisé en deux parties: données de formation et données de retenues. 02:24 Les données d'entraînement sont utilisées par les étapes d'entraînement AutoAI pour générer les pipelines de modèle et les scores de validation croisée sont utilisés pour les classer. 02:34 Après la formation, les données de retenues sont utilisées pour l'évaluation du modèle de pipeline qui en résulte et le calcul de l'information sur le rendement, comme les courbes ROC et les matrices de confusion. 02:48 Ensuite, AutoAI génère des pipelines à l'aide de différents estimateurs, tels que le discriminant XGBoost, ou des améliorations, telles que l'optimisation des hyperparamètres et l'ingénierie des fonctions, les pipelines étant classés en fonction de l'indicateur de précision. 03:06 L'optimisation des hyperparamètres est un mécanisme permettant d'explorer automatiquement un espace de recherche d'hyperparamètres potentiels, de construire une série de modèles et de comparer les modèles à l'aide de métriques d'intérêt. 03:20 L'ingénierie de fonctionnalité tente de transformer les données brutes dans la combinaison de fonctions qui représente le mieux le problème afin d'atteindre la prévision la plus exacte possible. 03:31 Ok, la course est terminée. 03:34 La légende explique où trouver les données, l'algorithme supérieur, les pipelines et les transformateurs de fonctions sur la carte de la relation. 03:44 Vous pouvez afficher le journal complet pour afficher les détails complets. 03:48 Par défaut, vous verrez la "mappe de relations", mais vous pouvez échanger des vues pour voir la "mappe de progression". 03:57 Faites défiler vers le bas pour jeter un coup d'oeil à la direction. 04:01 Vous pouvez commencer par comparer les pipelines. 04:05 Ce graphique fournit des métriques pour les huit pipelines, visualisés par score de validation croisée ou par score de retenue. 04:13 Vous pouvez voir les pipelines classés en fonction d'autres mesures, telles que la précision moyenne. 04:21 Dans l'onglet "Récapitulatif de l'expérimentation", développez un pipeline pour afficher les mesures d'évaluation du modèle et la courbe ROC. 04:30 Vous pouvez afficher un pipeline individuel pour afficher plus de détails en plus de la matrice de confusion, de la courbe de rappel de précision, des informations de modèle, des transformations de fonction et de l'importance de la fonction. 04:49 Ce pipeline a le classement le plus élevé, vous pouvez donc le sauvegarder en tant que modèle d'apprentissage automatique. 04:55 Il suffit d'accepter les valeurs par défaut et de sauvegarder le modèle. 05:01 Maintenant que vous avez formé le modèle, vous êtes prêt à afficher le modèle et à le déployer. 05:06 L'onglet "Présentation" affiche un récapitulatif de modèle et le schéma d'entrée. 05:12 Pour déployer le modèle, vous devez le promouvoir dans un espace de déploiement. 05:17 Étant donné que ce projet n'a pas encore d'espace de déploiement associé, vous devez d'abord configurer l'association. 05:25 Vous pouvez soit sélectionner un espace de déploiement existant, soit créer un espace de déploiement. 05:31 Lorsque vous créez un espace, fournissez un nom et une description et sélectionnez le service Cloud Object Storage et Watson Machine Learning. 05:41 Créez ensuite l'espace. 05:45 Sélectionnez maintenant ce nouvel espace, ajoutez une description pour le modèle et cliquez sur "Promouvoir". 05:53 Utilisez le lien pour accéder à l'espace de déploiement. 06:00 Voici le modèle que vous venez de créer, que vous pouvez maintenant déployer. 06:04 Dans ce cas, il s'agit d'un déploiement en ligne. 06:08 Il suffit de fournir un nom pour le déploiement et de cliquer sur "Créer". 06:12 Attendu alors que le modèle est déployé. 06:16 Une fois le déploiement du modèle terminé, affichez le déploiement. 06:20 Dans l'onglet "Référence de l'API", vous trouverez le noeud final de scoring pour référence ultérieure. 06:26 Vous trouverez également des fragments de code pour différents langages de programmation pour utiliser ce déploiement à partir de votre application. 06:35 Dans l'onglet "Test", vous pouvez tester la prévision du modèle. 06:40 Vous pouvez entrer des données d'entrée de test ou coller des données d'entrée JSON, puis cliquer sur "Prédire". 06:52 Cela montre qu'il y a une très forte probabilité que la première personne ne s'abonne pas à un dépôt à terme et qu'il y a une forte probabilité que la seconde personne s'abonne à un dépôt à terme. 07:06 Et dans le projet, sur l'onglet "Actifs", vous trouverez l'expérience AutoAI et le modèle. 07:17 Trouvez d'autres vidéos dans la documentation de Cloud Pak for Data as a Service.
Essayer un tutoriel pour créer un modèle à l'aide d'AutoAI
Ce tutoriel vous guide tout au long de la formation d'un modèle pour prédire si un client est susceptible de s'abonner à un dépôt à terme basé sur une campagne marketing.
Dans ce tutoriel, vous exécutez les tâches suivantes :
- Tâche 1: Ouvrir un projet.
- Tâche 2: Créer et entraîner le modèle.
- Tâche 3: Promouvoir le modèle dans un espace de déploiement et déployer le modèle entraîné
- Tâche 4: Tester le modèle déployé.
- Tâche 5: Créer un travail par lots pour évaluer le modèle.
Ce tutoriel dure environ 30 minutes.
Données exemple
Les exemples de données utilisés dans l'expérience guidée sont UCI: Données marketing de banque utilisées pour prévoir si un client s'inscrit à une promotion marketing promotion.The sont automatiquement téléchargées et disponibles pour votre utilisation lorsque vous sélectionnez Exemple de concentrateur de ressources comme base de votre expérimentation.
Conseils pour l'exécution de ce tutoriel
Voici quelques conseils pour réussir ce tutoriel.
Utiliser la vidéo image-in-picture
L'image animée suivante montre comment utiliser les fonctions d'image vidéo et de table des matières:
Obtenir de l'aide dans la communauté
Si vous avez besoin d'aide pour ce tutoriel, vous pouvez poser une question ou trouver une réponse dans le forum de discussion de la communautéCloud Pak for Data.
Configurez les fenêtres de votre navigateur
Pour une expérience optimale lors de l'exécution de ce tutoriel, ouvrez Cloud Pak for Data dans une fenêtre de navigateur et laissez cette page de tutoriel ouverte dans une autre fenêtre de navigateur pour basculer facilement entre les deux applications. Envisagez d'organiser les deux fenêtres du navigateur côte à côte pour faciliter le suivi.
Tâche 1: Ouvrir un projet
Vous avez besoin d'un projet pour stocker les données et l'expérimentation AutoAI . Vous pouvez utiliser un projet existant ou créer un projet.
Dans le menu de navigation , sélectionnez Projets > Afficher tous les projets .
Ouvrir un projet existant. Si vous souhaitez utiliser un nouveau projet:
Cliquez sur Nouveau projet.
Sélectionnez Créer un projet vide.
Entrez un nom et une description facultative pour le projet.
Choisissez une instance de service object storage existante ou crée en une nouvelle.
Cliquez sur Créer.
Lorsque le projet s'ouvre, cliquez sur l'onglet Gérer et sélectionnez la page Services et intégrations.
Dans l'onglet ServicesIBM , cliquez sur Associer un service.
Sélectionnez votre instance Watson Machine Learning . Si vous ne disposez pas encore d'une instance de service Watson Machine Learning mise à disposition, procédez comme suit:
Cliquez sur Nouveau service.
Sélectionnez Watson Machine Learning.
Cliquez sur Créer.
Sélectionnez la nouvelle instance de service dans la liste.
Cliquez sur Associer un service.
Si nécessaire, cliquez sur Annuler pour revenir à la page Services & Intégrations .
Pour plus d'informations ou pour regarder une vidéo, voir Création d'un projet.Pour plus d'informations sur les services associés, voir Ajout de services associés.
Vérifiez votre progression
L'image suivante montre le nouveau projet.
Tâche 2: Créer et entraîner le modèle
Pour prévisualiser cette tâche, regardez la vidéo à partir de 00:08.
Maintenant que vous disposez d'un projet, vous êtes prêt à générer et à entraîner le modèle à l'aide d' AutoAI. Procédez comme suit pour créer l'expérimentation AutoAI , examiner les pipelines de modèle et sélectionner un pipeline à enregistrer en tant que modèle:
Clique le Actifs dans votre projet, puis cliquez sur Nouvel actif > Créer automatiquement des modèles d'apprentissage automatique .
Dans la page Créer une expérimentation AutoAI , renseignez les zones de base:
Cliquez sur le panneau Exemple de concentrateur de ressources .
Sélectionnez Bank marketing sample data, puis cliquez sur Next. Le nom du projet et sa description seront remplis pour vous.
Vérifiez que l'instance de service Machine Learning que vous avez associée à votre projet est sélectionnée dans la zone Watson Machine Learning Service du service Watson Machine Learning .
Cliquez sur Créer.
Dans cet exemple d'expérimentation AutoAI , vous verrez que l' exemple de données marketing de banque est déjà sélectionné pour votre expérimentation.
Passez en revue les paramètres d'expérimentation prédéfinis. En fonction du fichier et de la colonne sélectionnée pour la prédiction, AutoAI analyse un sous-ensemble des données et choisit un type de prédiction et une métrique à optimiser. Dans ce cas, le type de prévision est Classification binaire, la classe positive est Yeset la métrique optimisée est ROC AUC & run time.
Cliquez sur Exécuter l'expérimentation. A mesure que le modèle s'entraîne, vous voyez une infographie qui montre le processus de génération des pipelines.
Pour obtenir la liste des algorithmes ou des estimateurs disponibles avec chaque technique d'apprentissage automatique dans AutoAI, voir: Détails de l'implémentation AutoAI.
Une fois l'exécution de l'expérimentation terminée, vous pouvez afficher et comparer les pipelines classés dans un tableau de classement.
Vous pouvez cliquer sur Comparaison de pipelines pour voir leur différence.
Cliquez sur le pipeline le mieux classé pour afficher les détails du pipeline.
Cliquez sur Enregistrer sous, sélectionnez Modèle, puis cliquez sur Créer. Le pipeline est alors sauvegardé en tant que modèle dans votre projet.
Lorsque le modèle est sauvegardé, cliquez sur le lien Vue dans le projet dans la notification pour afficher le modèle dans votre projet. Vous pouvez également accéder à l'onglet Actifs du projet et cliquer sur le nom du modèle dans la section Modèles .
Vérifiez votre progression
L'image suivante montre le modèle.
Tâche 3: Promouvoir le modèle dans un espace de déploiement et déployer le modèle entraîné
Pour prévisualiser cette tâche, regardez la vidéo à partir de 04:57.
Avant de pouvoir déployer le modèle, vous devez le promouvoir dans un espace de déploiement. Procédez comme suit pour promouvoir le modèle dans un espace de déploiement afin de déployer le modèle:
Cliquez sur l'icône Promouvoir dans l'espace de déploiement .
Choisissez un espace de déploiement existant. Si vous ne disposez pas d'un espace de déploiement:
Cliquez sur Créer un nouvel espace de déploiement.
Indiquez un nom d'espace et une description facultative.
Sélectionnez un service de stockage.
Sélectionnez un service d'apprentissage automatique.
Cliquez sur Créer.
Cliquez sur Fermer.
Sélectionnez votre nouvel espace de déploiement dans la liste.
Sélectionnez l'option Aller au modèle dans l'espace après l'avoir promu .
Cliquez sur Promouvoir.
Remarque: Si vous n'avez pas sélectionné l'option permettant d'accéder au modèle dans l'espace après l'avoir promu, vous pouvez utiliser le menu de navigation pour accéder à Déploiements afin de sélectionner votre espace de déploiement et votre modèle.Une fois le modèle ouvert, cliquez sur Nouveau déploiement.
Sélectionnez En ligne comme Type de déploiement.
Indiquez un nom pour le déploiement.
Cliquez sur Créer.
Une fois le déploiement terminé, cliquez sur le nom du déploiement pour afficher la page des détails de déploiement.
Vérifiez votre progression
L'image suivante montre le nouveau déploiement.
Tâche 4: Tester le modèle déployé
Pour prévisualiser cette tâche, regardez la vidéo qui commence à 06:22.
Maintenant que le modèle est déployé, vous pouvez le tester à l'aide de l'interface utilisateur ou des API Watson Machine Learning . Procédez comme suit pour utiliser l'interface utilisateur afin de tester le modèle avec de nouvelles données:
Cliquez sur l'onglet Tester. Vous pouvez tester le modèle déployé à partir de la page des détails du déploiement des deux manières suivantes : test avec un formulaire ou test avec du code JSON.
Cliquez sur l'onglet Entrée JSON , copiez les données de test suivantes et collez-les pour remplacer le texte JSON existant:
{ "input_data": [ { "fields": [ "age", "job", "marital", "education", "default", "balance", "housing", "loan", "contact", "day", "month", "duration", "campaign", "pdays", "previous", "poutcome" ], "values": [ [ 27, "unemployed", "married", "primary", "no", 1787, "no", "no", "cellular", 19, "oct", 79, 1, -1, 0, "unknown" ] ] } ] }
Cliquez sur Prédit pour prédire si un client avec les attributs spécifiés est susceptible de s'inscrire pour un type de compte particulier. La prédiction qui en résulte indique qu'il existe une forte probabilité pour que ce client ne souscrive pas à la promotion marketing.
Cliquez sur X pour fermer la fenêtre Résultats de la prévision .
Vérifiez votre progression
L'image suivante montre les résultats du test du déploiement. Les valeurs de votre prévision peuvent différer des valeurs de l'image suivante.
Tâche 5: Créer un travail par lots pour évaluer le modèle
Maintenant que vous avez testé le modèle déployé avec une seule prévision, vous pouvez créer un déploiement par lots pour évaluer simultanément plusieurs enregistrements.
Tâche 5a: Configurer le déploiement par lots
Pour prévisualiser cette tâche, regardez la vidéo à partir de 07:00.
Pour un déploiement par lots, vous fournissez des données d'entrée, également appelées données utiles du modèle, dans un fichier CSV. Les données doivent être structurées comme les données de formation, avec les mêmes en-têtes de colonne. Le travail par lots traite chaque ligne de données et crée une prévision correspondante. Procédez comme suit pour télécharger les données de contenu dans l'espace de déploiement:
Copiez et collez le texte suivant dans un éditeur de texte, puis sauvegardez le fichier en tant que
bank-payload.csv
.age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome 30,unemployed,married,primary,no,1787,no,no,cellular,19,oct,79,1,-1,0,unknown 33,services,married,secondary,no,4789,yes,yes,cellular,11,may,220,1,339,4,failure 35,management,single,tertiary,no,1350,yes,no,cellular,16,apr,185,1,330,1,failure 30,management,married,tertiary,no,1476,yes,yes,unknown,3,jun,199,4,-1,0,unknown 59,blue-collar,married,secondary,no,0,yes,no,unknown,5,may,226,1,-1,0,unknown 35,management,single,tertiary,no,747,no,no,cellular,23,feb,141,2,176,3,failure 36,self-employed,married,tertiary,no,307,yes,no,cellular,14,may,341,1,330,2,other 39,technician,married,secondary,no,147,yes,no,cellular,6,may,151,2,-1,0,unknown 41,entrepreneur,married,tertiary,no,221,yes,no,unknown,14,may,57,2,-1,0,unknown 43,services,married,primary,no,-88,yes,yes,cellular,17,apr,313,1,147,2,failure 39,services,married,secondary,no,9374,yes,no,unknown,20,may,273,1,-1,0,unknown 43,admin.,married,secondary,no,264,yes,no,cellular,17,apr,113,2,-1,0,unknown 36,technician,married,tertiary,no,1109,no,no,cellular,13,aug,328,2,-1,0,unknown 20,student,single,secondary,no,502,no,no,cellular,30,apr,261,1,-1,0,unknown 31,blue-collar,married,secondary,no,360,yes,yes,cellular,29,jan,89,1,241,1,failure 40,management,married,tertiary,no,194,no,yes,cellular,29,aug,189,2,-1,0,unknown 56,technician,married,secondary,no,4073,no,no,cellular,27,aug,239,5,-1,0,unknown 37,admin.,single,tertiary,no,2317,yes,no,cellular,20,apr,114,1,152,2,failure 25,blue-collar,single,primary,no,-221,yes,no,unknown,23,may,250,1,-1,0,unknown 31,services,married,secondary,no,132,no,no,cellular,7,jul,148,1,152,1,other
Cliquez sur votre espace de déploiement dans la trace de navigation.
Cliquez sur l'onglet Actifs.
Faites glisser le fichier bank-payload.csv dans le panneau latéral et attendez que le fichier soit téléchargé.
Vérifiez votre progression
L'image suivante montre l'onglet Actifs dans l'espace de déploiement.
Tâche 5b: Créer le déploiement par lots
Pour prévisualiser cette tâche, regardez la vidéo à partir de 07:30.
Pour traiter un lot d'entrées et pour que la sortie soit écrite dans un fichier au lieu d'être affichées en temps réel, créez un travail de déploiement par lots.
Accédez à l'onglet Actifs dans l'espace de déploiement.
Cliquez sur le menu Dépassement de votre modèle et choisissez Déployer.
Pour Type de déploiement, sélectionnez Batch.
Entrez un nom pour le déploiement.
Choisissez la plus petite spécification de matériel.
Cliquez sur Créer.
Vérifiez votre progression
L'image suivante illustre le déploiement par lots.
Tâche 5c: Créer le travail par lots
Pour prévisualiser cette tâche, regardez la vidéo qui commence à 07:44.
Le travail par lots exécute le déploiement. Pour créer le travail, indiquez les données d'entrée et le nom du fichier de sortie. Vous pouvez configurer un travail pour qu'il s'exécute immédiatement ou selon une planification. Pour créer un travail par lots, procédez comme suit:
Sur la page de déploiement, cliquez sur Nouveau travail.
Indiquez un nom pour le travail et cliquez sur Suivant.
Sélectionnez la plus petite spécification matérielle, puis cliquez sur Suivant.
Facultatif: définissez un planning, puis cliquez sur Suivant.
Facultatif: choisissez de recevoir des notifications, puis cliquez sur Suivant.
Dans l'écran Choisir des données , sélectionnez les données Entrée :
Cliquez sur Sélectionner une source de données.
Sélectionnez Actif de données > bank-payload.csv.
Cliquez sur Confirmer.
Dans l'écran Choisir des données , indiquez le fichier Sortie :
Cliquez sur Ajouter.
Cliquez sur Sélectionner une source de données.
Vérifiez que l'onglet Créer est sélectionné.
Pour le nom, entrez
bank-output.csv
.Cliquez sur Confirmer.
Cliquez sur Suivant pour l'étape finale.
Passez en revue les paramètres, puis cliquez sur Créer et exécuter pour exécuter le travail immédiatement.
Vérifiez votre progression
L'image suivante présente les détails du travail pour le déploiement par lots.
Tâche 5d: Afficher la sortie
Pour prévisualiser cette tâche, regardez la vidéo qui commence à 08:42.
Procédez comme suit pour vérifier le fichier de sortie du travail par lots.
Cliquez sur le nom du travail pour afficher le statut.
Lorsque le statut passe à Terminé, cliquez sur le nom de votre espace de déploiement dans la trace de navigation.
Cliquez sur l'onglet Actifs.
Cliquez sur le fichier bank-output.csv pour passer en revue les résultats de prévision des informations client soumises pour le traitement par lots. Pour chaque cas, la prédiction a retourné ces clients peu susceptibles de s'abonner à la promotion bancaire.
Vérifiez votre progression
L'image suivante présente les résultats du travail de déploiement par lots.
Etapes suivantes
A présent, vous pouvez utiliser ce fichier pour une analyse plus approfondie. Par exemple, vous ou d'autres utilisateurs pouvez effectuer l'une des tâches suivantes :
Autres ressources
Essayez ces didacticiels supplémentaires pour acquérir une expérience plus pratique de la création de modèles à l'aide deAutoAI:
Essayez ces autres méthodes pour créer des modèles:
Voir plus de vidéos
Recherchez des exemples de jeux de données pour acquérir une expérience pratique de la génération de modèles dans le concentrateur de ressources
Rubrique parent: Tutoriels de démarrage rapide