Pour opérationnaliser l'analyse de données et la création de modèles, votre entreprise a besoin de systèmes et de processus intégrés. Cloud Pak for Data as a Service fournit les processus et les technologies permettant à votre entreprise de développer et de déployer des modèles d'apprentissage automatique et d'autres applications de science des données.
Regardez cette vidéo pour voir le cas d'utilisation de l'implémentation d'une solution Data Science and MLOps.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Défis
Vous pouvez résoudre les problèmes suivants pour votre entreprise en implémentant un scénario d'utilisation Data Science and MLOps:
- Accès à des données de haute qualité
- Les organisations doivent fournir un accès facile à des données de haute qualité et gouvernées pour les équipes de science des données qui utilisent les données pour créer des modèles.
- opérationnalisation de la génération et du déploiement de modèles
- Les organisations doivent implémenter des processus reproductibles pour générer et déployer rapidement et efficacement des modèles dans des environnements de production.
- Surveillance et nouvel entraînement des modèles
- Les organisations doivent automatiser la surveillance et le recyclage des modèles en fonction des commentaires en retour sur la production.
Exemple: Les défis de la Golden Bank
Suivez l'histoire de Golden Bank en mettant en œuvre un processus de Data Science et de MLOps pour étendre son activité en offrant des renouvellements d'hypothèques à taux réduit pour les applications en ligne. Les spécialistes des données de la Golden Bank doivent créer un modèle d'approbation des prêts hypothécaires qui évite les risques et traite tous les demandeurs de manière équitable. Ils doivent également automatiser le réentraînement du modèle pour optimiser les performances du modèle.
Processus
Pour implémenter Data Science et MLOps pour votre entreprise, votre organisation peut suivre ce processus:
- Préparation et partage des données
- Génération et entraînement de modèles
- Déployer des modèles
- Modèles déployés de contrôle
- Automatiser le cycle de vie de l'IA
Les services watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale et IBM Knowledge Catalog dans Cloud Pak for Data as a Service fournissent les outils et les processus dont votre organisation a besoin pour mettre en œuvre une solution Data Science et MLOps.
2. Génération et entraînement de modèles
Pour obtenir des informations prédictives basées sur vos données, les spécialistes des données, les analystes métier et les ingénieurs d'apprentissage automatique peuvent créer et entraîner des modèles. Les spécialistes des données utilisent les services Cloud Pak for Data as a Service pour générer les modèles d'IA, en s'assurant que les algorithmes et les optimisations appropriés sont utilisés pour faire des prévisions qui aident à résoudre les problèmes métier.
Ce que vous pouvez utiliser | Fonction | A utiliser de préférence lorsque |
---|---|---|
AutoAI | Utilisez AutoAI dans watsonx.ai Studio pour sélectionner automatiquement des algorithmes, concevoir des caractéristiques, générer des pipelines candidats et former des modèles de pipelines candidats. ' Ensuite, évaluez les pipelines classés et enregistrez les meilleurs en tant que modèles. Déployer les modèles formés dans un espace, ou exporter le pipeline de formation de modèle que vous aimez à partir d'AutoAI dans un carnet de notes pour l'affiner. |
Vous voulez un moyen avancé et automatisé de générer rapidement un ensemble de pipelines et de modèles d'entraînement. Vous voulez pouvoir exporter les pipelines générés pour les affiner. |
Blocs-notes et scripts | Utilisez les carnets et les scripts de watsonx.ai Studio pour écrire votre propre code d'entraînement et d'évaluation de modèles d'ingénierie des fonctionnalités en Python ou R. Utilisez les jeux de données de formation disponibles dans le projet ou les connexions aux sources de données telles que les bases de données, les lacs de données ou le stockage d'objets. Codez avec vos infrastructures et bibliothèques open source favorites. |
Vous souhaitez utiliser des compétences de codage Python ou R pour avoir un contrôle total sur le code utilisé pour créer, entraîner et évaluer les modèles. |
Flux SPSS Modeler | Utilisez les flux SPSS Modeler dans watsonx.ai Studio pour créer vos propres flux de formation, d'évaluation et de notation de modèles. Utilisez des ensembles de données d'entraînement disponibles dans le projet ou des connexions à des sources de données telles que des bases de données, des lacs de données ou un stockage d'objets. | Vous voulez un moyen simple d'explorer les données et de définir des flux d'entraînement, d'évaluation et d'évaluation de modèle. |
RStudio | Analysez les données et générez et testez des modèles en utilisant R dans RStudio. | Vous souhaitez utiliser un environnement de développement pour travailler dans R. |
Decision Optimization | Préparez les données, importez les modèles, résolvez les problèmes et comparez les scénarios, visualisez les données, trouvez des solutions, produisez des rapports et enregistrez les modèles à déployer avec watsonx.ai Runtime. | Vous devez évaluer des millions de possibilités pour trouver la meilleure solution à un problème d'analyse prescriptive. |
Apprentissage fédéré | Entraînez un modèle commun qui utilise des données réparties. | Vous devez entraîner un modèle sans déplacer, combiner ou partager des données réparties sur plusieurs emplacements. |
Exemple: Création de modèles et formation de Golden Bank
Les spécialistes des données de la Golden Bank créent un modèle, le "modèle d'approbation des prêts hypothécaires", qui évite les risques imprévus et traite tous les candidats de manière équitable. Ils souhaitent suivre l'historique et les performances du modèle depuis le début, de sorte qu'ils ajoutent un cas d'utilisation de modèle au "Catalogue d'approbation hypothécaire". Ils exécutent un bloc-notes pour construire le modèle et prédire quels candidats sont éligibles pour des prêts hypothécaires. Les détails de l'entraînement du modèle sont automatiquement capturés en tant que métadonnées dans le cas d'utilisation du modèle.
3. Déploiement de modèles
Lorsque les membres de l'équipe chargée des opérations déploient vos modèles d'intelligence artificielle, les modèles deviennent disponibles pour les applications qui les utilisent pour les évaluations et les prévisions afin de faciliter les actions.
Ce que vous pouvez utiliser | Fonction | A utiliser de préférence lorsque |
---|---|---|
Interface utilisateur Espaces | Utilisez l'interface utilisateur Espaces pour déployer des modèles et d'autres actifs depuis des projets vers des espaces. | Vous souhaitez déployer des modèles et afficher des informations de déploiement dans un espace de travail collaboratif. |
Exemple: Déploiement de modèle de Golden Bank
Les membres de l'équipe des opérations de Golden Bank promeuvent le "modèle d'approbation hypothécaire" du projet vers un espace de déploiement, puis créent un déploiement de modèle en ligne.
4. Surveillance des modèles déployés
Une fois les modèles déployés, il est important de les surveiller pour s'assurer qu'ils fonctionnent correctement. Les spécialistes des données doivent surveiller les problèmes de performances des modèles et de cohérence des données.
Ce que vous pouvez utiliser | Fonction | A utiliser de préférence lorsque |
---|---|---|
Watson OpenScale | Problèmes d'équité du modèle de contrôle sur plusieurs fonctions. Performances du modèle de contrôle et cohérence des données dans le temps. Expliquez comment le modèle est arrivé à certaines prévisions avec des facteurs pondérés. Gestion de la gouvernance et du cycle de vie du modèle et génération de rapports sur la gouvernance et le cycle de vie du modèle dans votre organisation. |
Vous disposez de fonctions qui sont protégées ou qui peuvent contribuer à l'équité des prévisions. Vous souhaitez tracer les performances du modèle et la cohérence des données dans le temps. Vous voulez savoir pourquoi le modèle fournit certaines prévisions. |
Exemple: surveillance du modèle de Golden Bank
Les spécialistes des données de Golden Bank utilisent Watson OpenScale pour surveiller le "modèle d'approbation d'hypothèque" déployé afin de s'assurer qu'il est exact et de traiter tous les demandeurs d'hypothèque Golden Bank de manière équitable. Ils exécutent un bloc-notes afin de configurer des moniteurs pour le modèle, puis de modifier la configuration à l'aide de l'interface utilisateur Watson OpenScale . A l'aide des métriques du moniteur de qualité et du moniteur d'équité Watson OpenScale , les spécialistes des données déterminent la façon dont le modèle prévoit les résultats et s'il produit des résultats biaisés. Ils obtiennent également des informations sur la façon dont le modèle prend des décisions afin que les décisions puissent être expliquées aux demandeurs de prêts hypothécaires.
5. Automatisation du cycle de vie de l'IA
Votre équipe peut automatiser et simplifier les MLOps et le cycle de vie de l'IA avec les pipelines d'orchestration.
Ce que vous pouvez utiliser | Fonction | A utiliser de préférence lorsque |
---|---|---|
Pipelines d'orchestration | Utilisez des pipelines pour créer des flux reproductibles et planifiés qui automatisent les blocs-notes, Data Refineryet les pipelines d'apprentissage automatique, de l'ingestion de données à l'entraînement, au test et au déploiement de modèles. | Vous souhaitez automatiser certaines ou toutes les étapes d'un flux MLOps. |
Exemple: cycle de vie ML automatisé de Golden Bank
Les spécialistes des données de Golden Bank peuvent utiliser des pipelines pour automatiser leur cycle de vie et leurs processus complets Data Science et MLOps afin de simplifier le processus de réentraînement du modèle.
Tutoriels pour Data Science et MLOps
Tutoriel | Descriptif | Expertise pour le tutoriel |
---|---|---|
Orchestration d'un pipeline d'intelligence artificielle avec la surveillance de modèle | Formez un modèle, promouvez le dans un espace de déploiement et déployez le modèle. | Exécutez un bloc-notes. |
Orchestrez un pipeline d'IA avec l'intégration de données | Créez un pipeline de bout en bout qui prépare les données et entraîne un modèle. | Utilisez l'interface de glisser-déposer des pipelines d'orchestration pour créer un pipeline. |
En savoir plus
Rubrique parent: Cas d'utilisation