Vous pouvez utiliser Cloud Pak for Data avec différents services pour implémenter des cas d'utilisation qui vous aident à créer une base de données sécurisée pour vos opérations d'intelligence artificielle.
- Cas d'utilisation
- Cas d'utilisation de matrice de données
- Génération et gouvernance de cas d'utilisation de l'IA
Présentation de la solution de matrice de données
Lorsque vous implémentez la solution de matrice de données sur Cloud Pak for Data, vous pouvez résoudre les problèmes liés à l'accès aux données, à la qualité des données, à la gouvernance des données et à la gestion de vos cycles de vie de données.
La solution de matrice de données sur Cloud Pak for Data fournit les principales fonctionnalités suivantes pour la gestion et l'automatisation de vos cycles de vie de données:
- Accès aux données
- Accédez à vos données sur plusieurs clouds et sur site dans votre architecture de données existante.
- Consommation en libre-service
- Partagez et utilisez des données et d'autres actifs de l'entreprise dans des catalogues.
- Connaissances accumulées
- Comprenez vos données à l'aide d'un vocabulaire métier commun. Faites confiance à vos données via l'historique, la lignée et l'analyse de la qualité.
- Innovation collaborative
- Collaborez avec d'autres personnes pour découvrir des connaissances. Préparez et analysez les données avec un ensemble d'outils intégrés pour tous les niveaux d'expérience.
- Gouvernance et conformité
- Définissez des règles pour appliquer la confidentialité des données.
- Cycle de vie unifié
- Automatisez la génération, le test, le déploiement et la surveillance des pipelines de données.
L'illustration suivante montre comment la matrice de données prend en charge les cas d'utilisation sur la plateforme Cloud Pak for Data (cloud et sur site) en intégrant l'accès à des sources de données hybrides (par exemple, lakehouse de données, entrepôt de données, lac de données, base de données ou application métier) avec des fonctionnalités dans une seule expérience d'interface utilisateur.
La valeur des actifs
Avec la matrice de données, vous pouvez transformer des données en actifs qui accumulent de la signification et de la valeur. Les actifs ne sont pas seulement des données. Lorsque vous créez une connexion à une source de données pour la première fois, vous disposez d'informations de base sur la façon d'accéder aux données, aux tables, aux schémas et aux valeurs de données. Vous commencez à ajouter de la valeur en ingérant des données en les virtualisant, en les transformant ou en les répliquant dans des espaces de travail appelés projets.
Lorsque vous curez les données, vous ajoutez des métadonnées à vos actifs de données. Vous profilez les données pour les classer et compiler des statistiques sur les valeurs. Vous enrichissez les actifs avec un vocabulaire métier qui décrit la signification sémantique des données de votre organisation. Vous analysez la qualité des données. Les métadonnées que vous ajoutez lors de la curation sont considérées comme des métadonnées actives car elles sont générées automatiquement via des processus d'apprentissage automatique. Lorsque vous réexécutez la curation après la modification de vos données, les métadonnées sont mises à jour en fonction de l'analyse automatisée des données.
Lorsque les utilisateurs utilisent les actifs dans des projets, ils créent le troisième niveau de signification qui décrit l'historique de l'utilisation de l'actif et les relations entre les actifs. Les utilisateurs peuvent analyser les données dans des blocs-notes ou des tableaux de bord ou entraîner des modèles d'apprentissage automatique.
Les utilisateurs peuvent également ajouter des informations à des actifs, tels que des évaluations et des revues, des visualisations des données, des étiquettes et d'autres relations.
L'image suivante montre comment les actifs de données accumulent de la valeur dans une matrice de données en ajoutant des informations descriptives (profil de données, qualité de données et vocabulaire métier), des informations d'utilisation (actions sur les données et les relations) et des informations ajoutées par l'utilisateur (évaluations et révisions, visualisations et relations) aux informations de base (type de données, format et schéma et emplacement des données) sur l'actif de données.
Cas d'utilisation de matrice de données
Cloud Pak for Data fournit plusieurs cas d'utilisation dans le cadre de la solution de matrice de données. Vous implémentez la matrice de données comme représenté dans chaque cas d'utilisation en installant un ou plusieurs services qui fournissent des fonctions et des outils. Certains services sont inclus dans de nombreux cas d'utilisation.
Les cas d'utilisation représentent des moyens d'implémenter une partie de la solution de matrice de données afin que votre équipe puisse commencer à travailler pendant que vous construisez d'autres parties. Vous pouvez commencer avec n'importe quel cas d'utilisation et ajouter les autres au fur et à mesure que vous en avez besoin:
- Si vous disposez d'un modèle de gouvernance des données plus mature, commencez par établir votre vocabulaire métier, comme décrit dans le cas d'utilisation de gouvernance des données.
- Si vous souhaitez un délai de rentabilisation plus rapide, commencez par la virtualisation des données ou la réplication des données, comme décrit dans le cas d'utilisation de l'intégration des données.
- Si vous devez vous assurer que vos utilisateurs et vos systèmes disposent d'une vue totale, fiable et unifiée de vos données client, commencez par mettre en correspondance et consolider vos données d'enregistrement dans des entités discrètes, comme décrit dans le cas d'utilisation de la gestion des données maître.
Explorez chaque cas d'utilisation pour découvrir ce que vous pouvez accomplir et les outils que vous pouvez utiliser.
Gouvernance des données
Implémentez une gouvernance basée sur des métadonnées qui fournissent des connaissances métier et définissent la protection des données. Fournissez des actifs de données de haute qualité dans les catalogues en libre-service. Automatisez l'application de la gouvernance des données pour la conformité réglementaire.
Service pour ce cas d'utilisation: IBM Knowledge Catalog.
Intégration de données
Simplifiez et automatisez l'accès à toutes vos données, sans les déplacer. Orchestre les données dans un paysage distribué afin de créer un réseau d'informations instantanément disponibles pour les consommateurs de données.
Services pour ce cas d'utilisation : Data Virtualization, DataStage, et IBM Knowledge Catalog.
Master Data Management
Générez une vue consolidée des clients et enregistrez les données en connectant les données entre les domaines et en les mettant en correspondance pour créer des entités de données maître.
Service pour ce cas d'utilisation: IBM Match 360 with Watson.
Construire et gouverner des cas d'utilisation de l'IA
Lorsque vous implémentez des cas d'utilisation de génération et de gouvernance d'IA, vous pouvez résoudre les défis liés à la génération de modèles, à la gouvernance d'IA et à la gestion de vos cycles de vie d'IA.
Les cas d'utilisation de génération et de gouvernance de l'intelligence artificielle dans Cloud Pak for Data fournissent les principales fonctionnalités suivantes pour la gestion et l'automatisation de vos cycles de vie de l'intelligence artificielle:
- Innovation collaborative
- Collaborez avec d'autres personnes pour découvrir des connaissances. Préparez les données, analysez les données et générez des modèles avec un ensemble d'outils intégrés pour tous les niveaux d'expérience.
- Gouvernance et conformité
- Suivez et documentez l'historique détaillé des modèles d'IA pour garantir la conformité.
- Cycle de vie unifié
- Automatisez la génération, le test, le déploiement et la surveillance des modèles d'IA.
Cloud Pak for Data propose deux cas d'utilisation de l'IA pour la construction et la gouvernance. Vous implémentez chaque cas d'utilisation en créant une ou plusieurs instances de service qui fournissent des fonctions et des outils. Certains services sont inclus dans de nombreux cas d'utilisation.
Vous pouvez commencer par l'un ou l'autre des cas d'utilisation et en ajouter un autre en fonction de vos besoins:
- Si vous souhaitez un délai de rentabilisation plus rapide, commencez par la science des données, comme décrit dans le cas d'utilisation de Data Science et de MLOps.
- Si vous devez vous assurer que vos modèles sont conformes aux objectifs et aux réglementations de votre organisation, commencez à suivre vos modèles, comme décrit dans le cas d'utilisation de la gouvernance de l'IA.
Explorez chaque cas d'utilisation pour découvrir ce que vous pouvez accomplir et les outils que vous pouvez utiliser.
Data Science and MLOps
Opérationnalisez l'analyse de données et la création de modèles à l'aide d'un flux de travaux automatisé qui prépare les données, génère, déploie, surveille et réentraîne les modèles.
Services pour ce cas d'utilisation : watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale et IBM Knowledge Catalog.
Gouvernance de l'IA
Opérationnalisez la gouvernance de l'IA avec un flux de travaux automatisé qui applique l'équité, la qualité et l'explicabilité dans vos modèles.
Services pour ce cas d'utilisation : watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale et IBM Knowledge Catalog.
En savoir plus
- Qu'est-ce qu'un tissu de données ?
- Inscription pour les essais de matrice de données
- Cas d'utilisation de la gouvernance des données
- Cas d'utilisation de l'intégration de données
- Cas d'utilisation deMaster Data Management
- Cas d'utilisation de la gouvernance de l'IA
- Cas d'utilisation Data Science and MLOps
- Qu'est-ce que l'observabilité des données ?
- Tutoriels de cas d'utilisation
Rubrique parent: Présentation d' Cloud Pak for Data as a Service