Présentation de la solution de matrice de données
Lorsque vous implémentez la solution de matrice de données sur Cloud Pak for Data, vous pouvez résoudre les problèmes liés à l'accès aux données, à la qualité des données, à la gouvernance des données et à la gestion de vos données et de vos cycles de vie d'intelligence artificielle.
La solution de matrice de données sur Cloud Pak for Data fournit les principales fonctionnalités suivantes pour la gestion et l'automatisation de vos données et de vos cycles de vie d'intelligence artificielle:
- Accès aux données
- Accédez à vos données sur plusieurs clouds et sur site dans votre architecture de données existante.
- Consommation en libre-service
- Partagez et utilisez des données et d'autres actifs de l'entreprise dans des catalogues.
- Connaissances accumulées
- Comprenez vos données à l'aide d'un vocabulaire métier commun. Faites confiance à vos données via l'historique, la lignée et l'analyse de la qualité.
- Innovation collaborative
- Collaborez avec d'autres personnes pour découvrir des connaissances. Préparez les données, analysez les données et générez des modèles avec un ensemble d'outils intégrés pour tous les niveaux d'expérience.
- Gouvernance et conformité
- Définissez des règles pour appliquer la confidentialité des données. Suivez et documentez l'historique détaillé des modèles d'IA pour garantir la conformité.
- Cycle de vie unifié
- Automatisez la génération, le test, le déploiement et la surveillance des pipelines de données et des modèles d'IA.
L'illustration suivante montre comment la matrice de données prend en charge les cas d'utilisation sur la plateforme Cloud Pak for Data en intégrant l'accès aux sources de données hybrides avec des fonctions dans une interface utilisateur unique.
La valeur des actifs
Avec la matrice de données, vous pouvez transformer des données en actifs qui accumulent de la signification et de la valeur. Les actifs ne sont pas seulement des données. Lorsque vous créez une connexion à une source de données pour la première fois, vous disposez d'informations de base sur la façon d'accéder aux données, aux tables, aux schémas et aux valeurs de données. Vous commencez à ajouter de la valeur en ingérant des données en les virtualisant, en les transformant ou en les répliquant dans des espaces de travail appelés projets.
Lorsque vous curez les données, vous ajoutez des métadonnées à vos actifs de données. Vous profilez les données pour les classer et compiler des statistiques sur les valeurs. Vous enrichissez les actifs avec un vocabulaire métier qui décrit la signification sémantique des données de votre organisation. Vous analysez la qualité des données. Les métadonnées que vous ajoutez lors de la curation sont considérées comme des métadonnées actives, car elles sont générées automatiquement via des processus d'apprentissage automatique. Lorsque vous réexécutez la curation après la modification de vos données, les métadonnées sont mises à jour en fonction de l'analyse automatisée des données.
Lorsque les utilisateurs utilisent les actifs dans des projets, ils créent le troisième niveau de signification qui décrit l'historique de l'utilisation de l'actif et les relations entre les actifs. Les utilisateurs peuvent analyser les données dans des blocs-notes ou des tableaux de bord ou entraîner des modèles d'apprentissage automatique.
Les utilisateurs peuvent également ajouter des informations à des actifs, tels que des évaluations et des revues, des visualisations des données, des étiquettes et d'autres relations.
L'image suivante montre comment les actifs de données accumulent de la valeur dans une matrice de données.
Les modèles sont également des actifs. Vous pouvez suivre les déploiements et les données d'entrée pour le modèle, les comparaisons entre les modèles, la conformité avec les protocoles d'entreprise et d'autres métriques de performance.
Cas d'utilisation
Cloud Pak for Data as a Service fournit quatre cas d'utilisation dans le cadre de la solution de matrice de données. Vous implémentez la matrice de données comme représenté dans chaque cas d'utilisation en créant une ou plusieurs instances de service qui fournissent des fonctions et des outils. Certains services sont inclus dans de nombreux cas d'utilisation.
Les cas d'utilisation représentent des moyens d'implémenter une partie de la solution de matrice de données afin que vos équipes puissent commencer à travailler pendant que vous construisez d'autres parties. Vous pouvez commencer avec n'importe quel cas d'utilisation et ajouter les autres au fur et à mesure que vous en avez besoin:
- Si vous disposez d'un modèle de gouvernance des données plus mature, commencez par établir votre vocabulaire métier, comme décrit dans le cas d'utilisation de gouvernance des données.
- Si vous souhaitez une rentabilisation plus rapide, commencez par la virtualisation des données ou la science des données, comme décrit dans les cas d'utilisation de l'intégration des données et de la science des données et des objets MLOB.
- Si vous devez vous assurer que vos modèles sont conformes aux objectifs et aux réglementations de votre organisation, commencez à suivre vos modèles, comme décrit dans le cas d'utilisation de la gouvernance de l'IA.
Explorez chaque cas d'utilisation pour découvrir ce que vous pouvez accomplir et les outils que vous pouvez utiliser.
Gouvernance des données
Implémentez une gouvernance basée sur des métadonnées qui fournissent des connaissances métier et définissent la protection des données. Fournissez des actifs de données de haute qualité dans les catalogues en libre-service. Automatisez l'application de la gouvernance des données pour la conformité réglementaire.
Services pour ce cas d'utilisation: Watson Knowledge Catalog et IBM Match 360 with Watson.
Intégration de données
Simplifiez et automatisez l'accès à toutes vos données, sans les déplacer. Orchestre les données dans un paysage distribué afin de créer un réseau d'informations instantanément disponibles pour les consommateurs de données.
Services pour ce cas d'utilisation: Watson Query, DataStageet Watson Knowledge Catalog.
Data Science and MLOps
Opérationnalisez l'analyse de données et la création de modèles à l'aide d'un flux de travaux automatisé qui prépare les données, génère, déploie, surveille et réentraîne les modèles.
Services pour ce cas d'utilisation: Watson Studio, Watson Machine Learning, Watson OpenScaleet Watson Knowledge Catalog.
Gouvernance de l’IA
Opérationnalisez la gouvernance de l'IA avec un flux de travaux automatisé qui applique l'équité, la qualité et l'explicabilité dans vos modèles.
Services pour ce cas d'utilisation: Watson Studio, Watson Machine Learning, Watson OpenScaleet Watson Knowledge Catalog.
En savoir plus
- Inscription pour les essais de matrice de données
- Cas d'utilisation de la gouvernance des données
- Cas d'utilisation de l'intégration de données
- Cas d'utilisation de la gouvernance de l'IA
- Cas d'utilisation Data Science and MLOps
- Tutoriels sur les matrices de données
- Qu'est-ce qu'une matrice de données?