0 / 0
Retourner à la version anglaise de la documentation
Cas d'utilisation Data Science and MLOps

Cas d'utilisation Data Science and MLOps

Pour opérationnaliser l'analyse de données et la création de modèles, votre entreprise a besoin de systèmes et de processus intégrés. Cloud Pak for Data as a Service fournit les processus et les technologies permettant à votre entreprise de développer et de déployer des modèles d'apprentissage automatique et d'autres applications de science des données.

Regardez cette vidéo pour voir le cas d'utilisation de l'implémentation d'une solution Data Science and MLOps.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.

Défis

Vous pouvez résoudre les problèmes suivants pour votre entreprise en implémentant un scénario d'utilisation Data Science and MLOps:

Accès à des données de haute qualité
Les organisations doivent fournir un accès facile à des données de haute qualité et gouvernées pour les équipes de science des données qui utilisent les données pour créer des modèles.
opérationnalisation de la génération et du déploiement de modèles
Les organisations doivent implémenter des processus reproductibles pour générer et déployer rapidement et efficacement des modèles dans des environnements de production.
Surveillance et nouvel entraînement des modèles
Les organisations doivent automatiser la surveillance et le recyclage des modèles en fonction des commentaires en retour sur la production.

Exemple: Les défis de la Golden Bank

Suivez l'histoire de Golden Bank en mettant en œuvre un processus de Data Science et de MLOps pour étendre son activité en offrant des renouvellements d'hypothèques à taux réduit pour les applications en ligne. Les spécialistes des données de la Golden Bank doivent créer un modèle d'approbation des prêts hypothécaires qui évite les risques et traite tous les demandeurs de manière équitable. Ils doivent également automatiser le réentraînement du modèle pour optimiser les performances du modèle.

Processus

Pour implémenter Data Science et MLOps pour votre entreprise, votre organisation peut suivre ce processus:

  1. Préparation et partage des données
  2. Génération et entraînement de modèles
  3. Déployer des modèles
  4. Modèles déployés de contrôle
  5. Automatiser le cycle de vie de l'IA

Les services Watson Studio, Watson Machine Learning, Watson OpenScaleet IBM Knowledge Catalog dans Cloud Pak for Data as a Service fournissent les outils et les processus dont votre organisation a besoin pour implémenter une solution Data Science and MLOps.

Image illustrant le flux du cas d'utilisation de la science des données

1. Préparer et partager les données

Les spécialistes des données peuvent préparer leurs propres ensembles de données et les partager dans un catalogue. Le catalogue sert de magasin de fonctions dans lequel vos équipes de spécialistes des données peuvent trouver des actifs de données de haute qualité avec les fonctions dont elles ont besoin. Ils peuvent ajouter des actifs de données à partir d'un catalogue dans un projet, où ils collaborent pour préparer, analyser et modéliser les données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Data Refinery Accéder aux données et les affiner à partir de diverses connexions de sources de données.

Materialiser les ensembles de données résultants sous forme d'instantanés dans le temps pouvant combiner, joindre ou filtrer des données à analyser et à explorer par d'autres spécialistes des données.

Rendre les ensembles de données résultants disponibles dans les catalogues.
Vous devez visualiser les données lorsque vous souhaitez les mettre en forme ou les nettoyer.

Vous souhaitez simplifier le processus de préparation de grandes quantités de données brutes pour l'analyse.
Catalogs Utilisez les catalogues d' IBM Knowledge Catalog en tant que magasin de fonctions pour organiser vos ressources afin qu'elles soient partagées entre les collaborateurs de votre organisation.

Tirez parti de la recherche sémantique basée sur l'intelligence artificielle et des recommandations pour aider les utilisateurs à trouver ce dont ils ont besoin.
Vos utilisateurs ont besoin de comprendre, de collaborer, d'enrichir et d'accéder facilement aux données de haute qualité.

Vous souhaitez augmenter la visibilité des données et la collaboration entre les utilisateurs métier.

Vous avez besoin que les utilisateurs affichent, accèdent, manipulent et analysent les données sans comprendre leur format physique ou leur emplacement, et sans avoir à les déplacer ou à les copier.

Vous souhaitez que les utilisateurs améliorent les actifs en les notant et en les passant en revue.

Exemple: catalogue de Golden Bank

Le responsable de l'équipe de gouvernance crée un catalogue, "Mortgage Approval Catalog", et ajoute les intendants de données et les spécialistes des données en tant que collaborateurs de catalogue. Les intendants de données publient les actifs de données qu'ils ont créés dans le catalogue. Les spécialistes des données trouvent les actifs de données, organisés par les intendants de données, dans le catalogue et les copient dans un projet. Dans leur projet, les spécialistes des données peuvent affiner les données pour les préparer à l'entraînement d'un modèle.


2. Génération et entraînement de modèles

Pour obtenir des informations prédictives basées sur vos données, les spécialistes des données, les analystes métier et les ingénieurs d'apprentissage automatique peuvent créer et entraîner des modèles. Les spécialistes des données utilisent les services Cloud Pak for Data as a Service pour générer les modèles d'IA, en s'assurant que les algorithmes et les optimisations appropriés sont utilisés pour faire des prévisions qui aident à résoudre les problèmes métier.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
AutoAI Utilisez AutoAI dans Watson Studio pour sélectionner automatiquement des algorithmes, concevoir des fonctions, générer des candidats de pipeline et entraîner des candidats de pipeline de modèle.

Ensuite, évaluez les pipelines classés et enregistrez les meilleurs modèles en tant que modèles.

Déployez les modèles entraînés dans un espace ou exportez le pipeline d'entraînement de modèle que vous aimez depuis AutoAI dans un bloc-notes pour l'affiner.
Vous voulez un moyen avancé et automatisé de générer rapidement un ensemble de pipelines et de modèles d'entraînement.

Vous voulez pouvoir exporter les pipelines générés pour les affiner.
Blocs-notes et scripts Utilisez des blocs-notes et des scripts dans Watson Studio pour écrire votre propre code d'apprentissage et d'évaluation de modèle d'ingénierie de fonction dans Python ou R. Utilisez les jeux de données de formation disponibles dans le projet ou les connexions aux sources de données telles que les bases de données, les lacs de données ou le stockage d'objets.

Codez avec vos infrastructures et bibliothèques open source favorites.
Vous souhaitez utiliser des compétences de codage Python ou R pour avoir un contrôle total sur le code utilisé pour créer, entraîner et évaluer les modèles.
Flux SPSS Modeler Utilisez les flux SPSS Modeler dans Watson Studio pour créer vos propres flux d'entraînement, d'évaluation et d'évaluation de modèle. Utilisez des ensembles de données d'entraînement disponibles dans le projet ou des connexions à des sources de données telles que des bases de données, des lacs de données ou un stockage d'objets. Vous voulez un moyen simple d'explorer les données et de définir des flux d'entraînement, d'évaluation et d'évaluation de modèle.
RStudio Analysez les données et générez et testez des modèles en utilisant R dans RStudio. Vous souhaitez utiliser un environnement de développement pour travailler dans R.
Decision Optimization Préparez des données, importez des modèles, résolvez des problèmes et comparez des scénarios, visualisez des données, trouvez des solutions, générez des rapports et sauvegardez des modèles à déployer avec Watson Machine Learning. Vous devez évaluer des millions de possibilités pour trouver la meilleure solution à un problème d'analyse prescriptive.
Apprentissage fédéré Entraînez un modèle commun qui utilise des données réparties. Vous devez entraîner un modèle sans déplacer, combiner ou partager des données réparties sur plusieurs emplacements.

Exemple: Création de modèles et formation de Golden Bank

Les spécialistes des données de la Golden Bank créent un modèle, le "modèle d'approbation des prêts hypothécaires", qui évite les risques imprévus et traite tous les candidats de manière équitable. Ils souhaitent suivre l'historique et les performances du modèle depuis le début, de sorte qu'ils ajoutent un cas d'utilisation de modèle au "Catalogue d'approbation hypothécaire". Ils exécutent un bloc-notes pour construire le modèle et prédire quels candidats sont éligibles pour des prêts hypothécaires. Les détails de l'entraînement du modèle sont automatiquement capturés en tant que métadonnées dans le cas d'utilisation du modèle.


3. Déploiement de modèles

Lorsque les membres de l'équipe chargée des opérations déploient vos modèles d'intelligence artificielle, les modèles deviennent disponibles pour les applications qui les utilisent pour les évaluations et les prévisions afin de faciliter les actions.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Interface utilisateur Espaces Utilisez l'interface utilisateur Espaces pour déployer des modèles et d'autres actifs depuis des projets vers des espaces. Vous souhaitez déployer des modèles et afficher des informations de déploiement dans un espace de travail collaboratif.


Exemple: Déploiement de modèle de Golden Bank

Les membres de l'équipe des opérations de Golden Bank promeuvent le "modèle d'approbation hypothécaire" du projet vers un espace de déploiement, puis créent un déploiement de modèle en ligne.


4. Surveillance des modèles déployés

Une fois les modèles déployés, il est important de les surveiller pour s'assurer qu'ils fonctionnent correctement. Les spécialistes des données doivent surveiller les problèmes de performances des modèles et de cohérence des données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Watson OpenScale Problèmes d'équité du modèle de contrôle sur plusieurs fonctions.

Performances du modèle de contrôle et cohérence des données dans le temps.

Expliquez comment le modèle est arrivé à certaines prévisions avec des facteurs pondérés.

Gestion de la gouvernance et du cycle de vie du modèle et génération de rapports sur la gouvernance et le cycle de vie du modèle dans votre organisation.
Vous disposez de fonctions qui sont protégées ou qui peuvent contribuer à l'équité des prévisions.

Vous souhaitez tracer les performances du modèle et la cohérence des données dans le temps.

Vous voulez savoir pourquoi le modèle fournit certaines prévisions.

Exemple: surveillance du modèle de Golden Bank

Les spécialistes des données de Golden Bank utilisent Watson OpenScale pour surveiller le "modèle d'approbation d'hypothèque" déployé afin de s'assurer qu'il est exact et de traiter tous les demandeurs d'hypothèque Golden Bank de manière équitable. Ils exécutent un bloc-notes afin de configurer des moniteurs pour le modèle, puis de modifier la configuration à l'aide de l'interface utilisateur Watson OpenScale . A l'aide des métriques du moniteur de qualité et du moniteur d'équité Watson OpenScale , les spécialistes des données déterminent la façon dont le modèle prévoit les résultats et s'il produit des résultats biaisés. Ils obtiennent également des informations sur la façon dont le modèle prend des décisions afin que les décisions puissent être expliquées aux demandeurs de prêts hypothécaires.


5. Automatisation du cycle de vie de l'IA

Votre équipe peut automatiser et simplifier les MLOps et le cycle de vie de l'IA avec les pipelines d'orchestration.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Pipelines d'orchestration Utilisez des pipelines pour créer des flux reproductibles et planifiés qui automatisent les blocs-notes, Data Refineryet les pipelines d'apprentissage automatique, de l'ingestion de données à l'entraînement, au test et au déploiement de modèles. Vous souhaitez automatiser certaines ou toutes les étapes d'un flux MLOps.

Exemple: cycle de vie ML automatisé de Golden Bank

Les spécialistes des données de Golden Bank peuvent utiliser des pipelines pour automatiser leur cycle de vie et leurs processus complets Data Science et MLOps afin de simplifier le processus de réentraînement du modèle.


Tutoriels pour Data Science et MLOps

Tutoriel Descriptif Expertise pour le tutoriel
Orchestration d'un pipeline d'intelligence artificielle avec la surveillance de modèle Formez un modèle, promouvez le dans un espace de déploiement et déployez le modèle. Exécutez un bloc-notes.
Orchestrez un pipeline d'IA avec l'intégration de données Créez un pipeline de bout en bout qui prépare les données et entraîne un modèle. Utilisez l'interface de glisser-déposer des pipelines d'orchestration pour créer un pipeline.

En savoir plus

Rubrique parent: Cas d'utilisation

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus