Cas d'utilisation Data Science and MLOps
Pour opérationnaliser l'analyse de données et la création de modèles, votre entreprise a besoin de systèmes et de processus intégrés. Cloud Pak for Data as a Service fournit les processus et les technologies permettant à votre entreprise de développer et de déployer des modèles d'apprentissage automatique et d'autres applications de science des données.
Regardez cette vidéo pour voir le cas d'utilisation de l'implémentation d'une solution Data Science and MLOps.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Défis
Vous pouvez résoudre les problèmes suivants pour votre entreprise en implémentant un scénario d'utilisation Data Science and MLOps:
- Accès à des données de haute qualité
- Les organisations doivent fournir un accès facile à des données de haute qualité et gouvernées pour les équipes de science des données qui utilisent les données pour créer des modèles.
- opérationnalisation de la génération et du déploiement de modèles
- Les organisations doivent implémenter des processus reproductibles pour générer et déployer rapidement et efficacement des modèles dans des environnements de production.
- Surveillance et nouvel entraînement des modèles
- Les organisations doivent automatiser la surveillance et le recyclage des modèles en fonction des commentaires en retour sur la production.
Exemple: Les défis de la Golden Bank
Suivez l'histoire de Golden Bank en mettant en œuvre un processus de Data Science et de MLOps pour étendre son activité en offrant des renouvellements d'hypothèques à taux réduit pour les applications en ligne. Les spécialistes des données de la Golden Bank doivent créer un modèle d'approbation des prêts hypothécaires qui évite les risques et traite tous les demandeurs de manière équitable. Ils doivent également automatiser le réentraînement du modèle pour optimiser les performances du modèle.
Processus
Pour implémenter Data Science et MLOps pour votre entreprise, votre organisation peut suivre ce processus:
- Préparation et partage des données
- Génération et entraînement de modèles
- Déployer des modèles
- Modèles déployés de contrôle
- Automatiser le cycle de vie de l'IA
Les services Watson Studio, Watson Machine Learning, Watson OpenScaleet IBM Knowledge Catalog dans Cloud Pak for Data as a Service fournissent les outils et les processus dont votre organisation a besoin pour implémenter une solution Data Science and MLOps.
2. Génération et entraînement de modèles
Pour obtenir des informations prédictives basées sur vos données, les spécialistes des données, les analystes métier et les ingénieurs d'apprentissage automatique peuvent créer et entraîner des modèles. Les spécialistes des données utilisent les services Cloud Pak for Data as a Service pour générer les modèles d'IA, en s'assurant que les algorithmes et les optimisations appropriés sont utilisés pour faire des prévisions qui aident à résoudre les problèmes métier.
Ce que vous pouvez utiliser | Fonction | A utiliser de préférence lorsque |
---|---|---|
AutoAI | Utilisez AutoAI dans Watson Studio pour sélectionner automatiquement des algorithmes, concevoir des fonctions, générer des candidats de pipeline et entraîner des candidats de pipeline de modèle. Ensuite, évaluez les pipelines classés et enregistrez les meilleurs modèles en tant que modèles. Déployez les modèles entraînés dans un espace ou exportez le pipeline d'entraînement de modèle que vous aimez depuis AutoAI dans un bloc-notes pour l'affiner. |
Vous voulez un moyen avancé et automatisé de générer rapidement un ensemble de pipelines et de modèles d'entraînement. Vous voulez pouvoir exporter les pipelines générés pour les affiner. |
Blocs-notes et scripts | Utilisez des blocs-notes et des scripts dans Watson Studio pour écrire votre propre code d'apprentissage et d'évaluation de modèle d'ingénierie de fonction dans Python ou R. Utilisez les jeux de données de formation disponibles dans le projet ou les connexions aux sources de données telles que les bases de données, les lacs de données ou le stockage d'objets. Codez avec vos infrastructures et bibliothèques open source favorites. |
Vous souhaitez utiliser des compétences de codage Python ou R pour avoir un contrôle total sur le code utilisé pour créer, entraîner et évaluer les modèles. |
Flux SPSS Modeler | Utilisez les flux SPSS Modeler dans Watson Studio pour créer vos propres flux d'entraînement, d'évaluation et d'évaluation de modèle. Utilisez des ensembles de données d'entraînement disponibles dans le projet ou des connexions à des sources de données telles que des bases de données, des lacs de données ou un stockage d'objets. | Vous voulez un moyen simple d'explorer les données et de définir des flux d'entraînement, d'évaluation et d'évaluation de modèle. |
RStudio | Analysez les données et générez et testez des modèles en utilisant R dans RStudio. | Vous souhaitez utiliser un environnement de développement pour travailler dans R. |
Decision Optimization | Préparez des données, importez des modèles, résolvez des problèmes et comparez des scénarios, visualisez des données, trouvez des solutions, générez des rapports et sauvegardez des modèles à déployer avec Watson Machine Learning. | Vous devez évaluer des millions de possibilités pour trouver la meilleure solution à un problème d'analyse prescriptive. |
Apprentissage fédéré | Entraînez un modèle commun qui utilise des données réparties. | Vous devez entraîner un modèle sans déplacer, combiner ou partager des données réparties sur plusieurs emplacements. |
Exemple: Création de modèles et formation de Golden Bank
Les spécialistes des données de la Golden Bank créent un modèle, le "modèle d'approbation des prêts hypothécaires", qui évite les risques imprévus et traite tous les candidats de manière équitable. Ils souhaitent suivre l'historique et les performances du modèle depuis le début, de sorte qu'ils ajoutent un cas d'utilisation de modèle au "Catalogue d'approbation hypothécaire". Ils exécutent un bloc-notes pour construire le modèle et prédire quels candidats sont éligibles pour des prêts hypothécaires. Les détails de l'entraînement du modèle sont automatiquement capturés en tant que métadonnées dans le cas d'utilisation du modèle.
3. Déploiement de modèles
Lorsque les membres de l'équipe chargée des opérations déploient vos modèles d'intelligence artificielle, les modèles deviennent disponibles pour les applications qui les utilisent pour les évaluations et les prévisions afin de faciliter les actions.
Ce que vous pouvez utiliser | Fonction | A utiliser de préférence lorsque |
---|---|---|
Interface utilisateur Espaces | Utilisez l'interface utilisateur Espaces pour déployer des modèles et d'autres actifs depuis des projets vers des espaces. | Vous souhaitez déployer des modèles et afficher des informations de déploiement dans un espace de travail collaboratif. |
Exemple: Déploiement de modèle de Golden Bank
Les membres de l'équipe des opérations de Golden Bank promeuvent le "modèle d'approbation hypothécaire" du projet vers un espace de déploiement, puis créent un déploiement de modèle en ligne.
4. Surveillance des modèles déployés
Une fois les modèles déployés, il est important de les surveiller pour s'assurer qu'ils fonctionnent correctement. Les spécialistes des données doivent surveiller les problèmes de performances des modèles et de cohérence des données.
Ce que vous pouvez utiliser | Fonction | A utiliser de préférence lorsque |
---|---|---|
Watson OpenScale | Problèmes d'équité du modèle de contrôle sur plusieurs fonctions. Performances du modèle de contrôle et cohérence des données dans le temps. Expliquez comment le modèle est arrivé à certaines prévisions avec des facteurs pondérés. Gestion de la gouvernance et du cycle de vie du modèle et génération de rapports sur la gouvernance et le cycle de vie du modèle dans votre organisation. |
Vous disposez de fonctions qui sont protégées ou qui peuvent contribuer à l'équité des prévisions. Vous souhaitez tracer les performances du modèle et la cohérence des données dans le temps. Vous voulez savoir pourquoi le modèle fournit certaines prévisions. |
Exemple: surveillance du modèle de Golden Bank
Les spécialistes des données de Golden Bank utilisent Watson OpenScale pour surveiller le "modèle d'approbation d'hypothèque" déployé afin de s'assurer qu'il est exact et de traiter tous les demandeurs d'hypothèque Golden Bank de manière équitable. Ils exécutent un bloc-notes afin de configurer des moniteurs pour le modèle, puis de modifier la configuration à l'aide de l'interface utilisateur Watson OpenScale . A l'aide des métriques du moniteur de qualité et du moniteur d'équité Watson OpenScale , les spécialistes des données déterminent la façon dont le modèle prévoit les résultats et s'il produit des résultats biaisés. Ils obtiennent également des informations sur la façon dont le modèle prend des décisions afin que les décisions puissent être expliquées aux demandeurs de prêts hypothécaires.
5. Automatisation du cycle de vie de l'IA
Votre équipe peut automatiser et simplifier les MLOps et le cycle de vie de l'IA avec les pipelines d'orchestration.
Ce que vous pouvez utiliser | Fonction | A utiliser de préférence lorsque |
---|---|---|
Pipelines d'orchestration | Utilisez des pipelines pour créer des flux reproductibles et planifiés qui automatisent les blocs-notes, Data Refineryet les pipelines d'apprentissage automatique, de l'ingestion de données à l'entraînement, au test et au déploiement de modèles. | Vous souhaitez automatiser certaines ou toutes les étapes d'un flux MLOps. |
Exemple: cycle de vie ML automatisé de Golden Bank
Les spécialistes des données de Golden Bank peuvent utiliser des pipelines pour automatiser leur cycle de vie et leurs processus complets Data Science et MLOps afin de simplifier le processus de réentraînement du modèle.
Tutoriels pour Data Science et MLOps
Tutoriel | Descriptif | Expertise pour le tutoriel |
---|---|---|
Orchestration d'un pipeline d'intelligence artificielle avec la surveillance de modèle | Formez un modèle, promouvez le dans un espace de déploiement et déployez le modèle. | Exécutez un bloc-notes. |
Orchestrez un pipeline d'IA avec l'intégration de données | Créez un pipeline de bout en bout qui prépare les données et entraîne un modèle. | Utilisez l'interface de glisser-déposer des pipelines d'orchestration pour créer un pipeline. |
En savoir plus
Rubrique parent: Cas d'utilisation