0 / 0
Retourner à la version anglaise de la documentation
Présentation de la solution de matrice de données
Présentation de la solution de matrice de données

Présentation de la solution de matrice de données

Lorsque vous implémentez la solution de matrice de données sur Cloud Pak for Data, vous pouvez résoudre les problèmes liés à l'accès aux données, à la qualité des données, à la gouvernance des données et à la gestion de vos données et de vos cycles de vie d'intelligence artificielle.

La solution de matrice de données sur Cloud Pak for Data fournit les principales fonctionnalités suivantes pour la gestion et l'automatisation de vos données et de vos cycles de vie d'intelligence artificielle:

Accès aux données
Accédez à vos données sur plusieurs clouds et sur site dans votre architecture de données existante.

Consommation en libre-service
Partagez et utilisez des données et d'autres actifs de l'entreprise dans des catalogues.

Connaissances accumulées
Comprenez vos données à l'aide d'un vocabulaire métier commun. Faites confiance à vos données via l'historique, la lignée et l'analyse de la qualité.

Innovation collaborative
Collaborer avec d'autres pour découvrir des connaissances. Préparez les données, analysez les données et générez des modèles avec un ensemble d'outils intégrés pour tous les niveaux d'expérience.

Gouvernance et conformité
Définissez des règles pour appliquer la confidentialité des données. Suivez et documentez l'historique détaillé des modèles d'IA pour garantir la conformité.

Cycle de vie unifié
Automatisez la génération, le test, le déploiement et la surveillance des pipelines de données et des modèles d'intelligence artificielle.

La valeur des actifs

Avec la matrice de données, vous pouvez transformer des données en actifs qui accumulent de la signification et de la valeur. Les actifs ne sont pas seulement des données. Lorsque vous créez une connexion à une source de données pour la première fois, vous disposez d'informations de base sur la façon d'accéder aux données, aux tables, aux schémas et aux valeurs de données. Vous commencez à ajouter de la valeur en ingérant des données en les virtualisant, en les transformant ou en les répliquant dans des espaces de travail appelés projets.

Lorsque vous curez les données, vous ajoutez des métadonnées à vos actifs de données. Vous profilez les données pour les classer et compiler des statistiques sur les valeurs. Vous enrichissez les actifs avec un vocabulaire métier qui décrit la signification sémantique des données de votre organisation. Vous analysez la qualité des données.

Lorsque les utilisateurs utilisent les actifs dans des projets, ils créent le troisième niveau de signification qui décrit l'historique de l'utilisation de l'actif et les relations entre les actifs. Les utilisateurs peuvent analyser les données dans des blocs-notes ou des tableaux de bord ou entraîner des modèles d'apprentissage automatique.

Les utilisateurs peuvent également ajouter des informations à des actifs, tels que des évaluations et des revues, des visualisations des données, des étiquettes et d'autres relations.

L'image suivante montre comment les actifs de données accumulent de la valeur dans une matrice de données.

Image montrant comment un actif de données accumule de la valeur

Les modèles sont également des actifs. Vous pouvez suivre les déploiements et les données d'entrée pour le modèle, les comparaisons entre les modèles, la conformité avec les protocoles d'entreprise et d'autres métriques de performance.

Cas d'utilisation

Cloud Pak for Data as a Service fournit quatre cas d'utilisation dans le cadre de la solution de matrice de données. Vous implémentez la matrice de données comme représenté dans chaque cas d'utilisation en créant une ou plusieurs instances de service qui fournissent des fonctions et des outils. Certains services sont inclus dans de nombreux cas d'utilisation.

Image illustrant les quatre cas d'utilisation de matrice de données

Les cas d'utilisation représentent des moyens d'implémenter une partie de la solution de matrice de données afin que vos équipes puissent commencer à travailler pendant que vous construisez d'autres parties. Vous pouvez commencer avec n'importe quel cas d'utilisation et ajouter les autres au fur et à mesure que vous en avez besoin:

  • Si vous disposez d'un modèle de gouvernance des données plus mature, commencez par établir votre vocabulaire métier, comme décrit dans le cas d'utilisation de gouvernance des données.
  • Si vous souhaitez une rentabilisation plus rapide, commencez par la virtualisation des données ou la science des données, comme décrit dans les cas d'utilisation de l'intégration des données et de la science des données et des objets MLOB.
  • Si vous devez vous assurer que vos modèles sont conformes aux objectifs et aux réglementations de votre organisation, commencez à suivre vos modèles, comme décrit dans le cas d'utilisation de la gouvernance de l'IA.

Explorez chaque cas d'utilisation pour découvrir ce que vous pouvez accomplir et les outils que vous pouvez utiliser.

Gouvernance des données

Implémentez une gouvernance basée sur des métadonnées qui fournissent des connaissances métier et définissent la protection des données. Fournissez des actifs de données de haute qualité dans les catalogues en libre-service. Automatisez l'application de la gouvernance des données pour la conformité réglementaire.

Services pour ce cas d'utilisation: Watson Knowledge Catalog et IBM Match 360 with Watson.

Voir Gouvernance des données.

Intégration de données

Simplifiez et automatisez l'accès à toutes vos données, sans les déplacer. Orchestre les données dans un paysage distribué afin de créer un réseau d'informations instantanément disponibles pour les consommateurs de données.

Services pour ce cas d'utilisation: Watson Query, DataStageet Watson Knowledge Catalog.

Voir Intégration de données.

Gouvernance de l'IA

Opérationnalisez la gouvernance de l'IA avec un flux de travaux automatisé qui applique l'équité, la qualité et l'explicabilité dans vos modèles.

Services pour ce cas d'utilisation: Watson Studio, Watson Machine Learning, Watson OpenScaleet Watson Knowledge Catalog.

Voir Gouvernance de l'IA.

Data Science et MLOps

Opérationnalisez l'analyse de données et la création de modèles à l'aide d'un flux de travaux automatisé qui prépare les données, génère, déploie, surveille et réentraîne les modèles.

Services pour ce cas d'utilisation: Watson Studio, Watson Machine Learning, Watson OpenScaleet Watson Knowledge Catalog.

Voir Data Science and MLOps use case.

En savoir plus