La plateforme fournit des espaces de travail et des outils collaboratifs, et vous fournissez le contenu à la plateforme, sous la forme d'actifs. Un actif est un élément qui contient des informations sur les données, d'autres informations utiles ou du code qui fonctionne avec les données.
Vous ajoutez des actifs en les important ou en les créant à l'aide d'outils. Vous travaillez avec des actifs dans des espaces de travail collaboratifs. L'espace de travail que vous utilisez dépend de vos tâches.
Projets Lorsque vous collaborez avec d'autres personnes pour utiliser des données et créer des actifs. La plupart des outils se trouvent dans des projets et vous exécutez des actifs qui contiennent du code dans des projets. Par exemple, vous pouvez importer des données, préparer des données, analyser des données ou créer des modèles dans des projets. Consultez Projets.
Catalogues Emplacement où vous stockez les ressources à partager avec votre organisation ou accédez à la recherche des ressources avec lesquelles vous devez travailler. Vous pouvez copier des actifs à partir de catalogues dans des projets ou publier des actifs à partir de projets dans le catalogue. Vous pouvez éditer des propriétés d'actif et des métadonnées dans un catalogue, mais vous ne pouvez pas exécuter d'actifs. Consultez Catalogues.
Espaces de déploiement Lorsque vous déployez et exécutez des actifs prêts pour le test ou la production. Vous déplacez des actifs de projets vers des espaces de déploiement, puis vous créez des déploiements à partir de ces actifs. Vous surveillez et mettez à jour les déploiements si nécessaire. Consultez Espaces de déploiement.
Vous pouvez trouver n'importe quel actif dans l'un des espaces de travail dont vous êtes un collaborateur en le recherchant dans la barre de recherche globale. Consultez Recherche d'actifs dans l'ensemble de la plateforme.
Vous pouvez créer de nombreux types d'actifs différents, mais tous les actifs ont des propriétés communes:
Types d'actif
Pour créer la plupart des types d'actifs, vous devez utiliser un outil spécifique. La plupart des outils sont fournis par un ou plusieurs services. Les outils permettant de créer des actifs de données et des actifs de connexion sont fournis par la plateforme et ne nécessitent pas de services spécifiques.
Pour voir les services dont vous avez besoin pour quels outils, ouvrez la carte des outils et des services.
Le tableau suivant répertorie les types d'actifs que vous pouvez créer, les outils dont vous avez besoin pour les créer et les espaces de travail dans lesquels vous pouvez les ajouter.
Type d'actif | Descriptif | Outils pour le créer | Espaces de travail |
---|---|---|---|
expérimentation AutoAI | Génère automatiquement des pipelines de modèle prédictif candidat. | AutoAI | Projets |
Fichier de stockage COBOL | Affiche les métadonnées de mappe pour les actifs de données connectés à partir des grands systèmes z/OS . | Outil d' Metadata import | Projets, catalogues |
Actif de données connecté | Représente les données accessibles via une connexion à une source de données distante. | Outil de données connectées, outil d' Metadata import | Projets, catalogues, espaces |
connexion | Contient les informations permettant de se connecter à une source de données. | Outil de connexion | Projets, catalogues, espaces |
Actif de données à partir d'un fichier | Représente un fichier que vous avez téléchargé à partir de votre système local. | Sous-fenêtre de téléchargement | Projets, catalogues, espaces |
Flux Data Refinery | Prépare les données. | Data Refinery | Projets, Espaces |
FluxData Replication | Réplique les données. | Data Replication | Projets, catalogues |
Définition de qualité des données | Définit un composant de logique de règle réutilisable pour les règles de qualité de données. | Editeur de définition de qualité de données | Projets, catalogues |
Règle de qualité des données | Évalue la qualité des données pour des conditions spécifiques. | Editeur de règles de qualité de données | Projets |
Définition de données DataStage | Définit un composant de métadonnées de colonne réutilisable pour les travaux de flux DataStage . | Editeur de composant DataStage | Projets, Espaces |
Flux DataStage | Transforme et intègre des données. | Editeur de flux DataStage | Projets, Espaces |
Bibliothèque de schémas DataStage | Importe un ensemble réutilisable de ressources pour les flux DataStage . | Editeur de composant DataStage | Projets, Espaces |
Règle de normalisation DataStage | Définit un composant de règle réutilisable pour formater des données dans des flux DataStage . | Editeur de composant DataStage | Projets, Espaces |
Flux secondaire DataStage | Définit un ensemble réutilisable d'étapes et de connecteurs pour les flux DataStage . | Editeur de composant DataStage | Projets, Espaces |
expérimentation Decision Optimization | Résout les problèmes d'optimisation. | Decision Optimization | Projets |
Vue dynamique | Représente les données accessibles via une connexion à une source de données distante et filtrées par une requête SQL. | Outil de requête | Projets |
Expérimentation d'apprentissage fédéré | Entraîne un modèle commun sur un ensemble de sources de données distantes. | Apprentissage fédéré | Projets |
Actif de dossier | Représente un dossier dans IBM Cloud Object Storage. | Outil de données connecté | Projets, catalogues, espaces |
Bloc-notes Jupyter | Exécute du code Python ou R pour analyser des données ou générer des modèles. | Jupyter éditeur de notes, AutoAI, Prompt Lab | Projets, catalogues |
Flux de masquage | Crée des copies masquées des actifs de données. | Flux de masquage | Projets |
Configuration des données de base | Configure Match 360. | Match 360 | Projets |
Enrichissement des métadonnées | Enrichit les métadonnées d'actif importées. | Outil d'enrichissement des métadonnées | Projets |
Metadata import | Importe des métadonnées d'actif à partir d'une connexion. | Outil d' Metadata import | Projets |
Modèle | Contient des informations sur un modèle sauvegardé ou importé. | Divers outils qui exécutent des expérimentations ou entraînent des modèles | Projets, catalogues, espaces |
Contrainte physique | Représente les contraintes de clé principale ou externe pour les actifs de données. | Sont créés automatiquement lorsque des résultats d'enrichissement de métadonnées contenant des relations de clé sont publiés | Catalogues |
Pipeline | Automatise le cycle de vie du modèle. | Pipelines d'orchestration | Projets |
Fonction Python | Contient du code Python pour la prise en charge d'un modèle en production. | Editeur de bloc-notes Jupyter | Projets, Espaces |
script | Contient un script Python ou R pour prendre en charge un modèle en production. | Jupyter éditeur de notes, RStudio | Projets, Espaces |
Flux SPSS Modeler | Exécute un flux pour préparer les données et générer un modèle. | SPSS Modeler | Projets |
Visualisation | Affiche les visualisations d'un actif de données. | Page Visualisation dans les actifs de données | Projets |
Propriétés communes pour les actifs
Les actifs accumulent des informations dans les propriétés lorsque vous les créez, les utilisez ou lorsqu'ils sont mis à jour par des processus automatisés. Certaines propriétés sont fournies par les utilisateurs et peuvent être éditées par les utilisateurs. D'autres propriétés sont automatiquement fournies par le système. La plupart des propriétés fournies par le système ne peuvent pas être éditées par les utilisateurs.
La zone Dernière modification d'un actif permet de suivre à la fois les actions utilisateur et les actions système. Les actions système se produisent souvent en arrière-plan et peuvent impliquer uniquement des modifications des métadonnées internes de l'actif.
Propriétés communes pour les actifs partout
La plupart des types d'actifs possèdent les propriétés répertoriées dans le tableau suivant dans tous les espaces de travail où ces types d'actifs existent.
Propriété | Descriptif | Modifiable? |
---|---|---|
Nom | Nom de l'actif. Peut contenir jusqu'à 255 caractères. Les caractères multi-octets sont acceptés. Ne peut pas être vide ni contenir des caractères de contrôle Unicode ou seulement des espaces. Les noms d'actif n'ont pas besoin d'être uniques dans un projet ou un espace de déploiement. La question de savoir si les noms d'actifs doivent être uniques dans un catalogue dépend de la méthode de gestion des doublons définie pour le catalogue. | Oui |
Descriptif | Facultatif. Les caractères multi-octets et les hyperliens sont acceptés. | Oui |
Date de création | Horodatage de la création ou de l'importation de l'actif. | Non |
Créateur ou propriétaire | Nom d'utilisateur ou adresse électronique de la personne qui a créé ou importé l'actif. | Non |
Date de dernière modification | Horodatage de la dernière modification de l'actif. | Non |
Dernier éditeur | Nom d'utilisateur ou adresse électronique de la personne qui a modifié l'actif pour la dernière fois. | Non |
Propriétés communes des actifs dans les catalogues
Outre les propriétés communes de tous les actifs, les actifs des catalogues possèdent les propriétés et les pages répertoriées dans le tableau suivant.
Propriété ou page | Descriptif | Modifiable? |
---|---|---|
Page Actif | Vue du contenu de l'actif. Voir Contenu de l'actif ou aperçus. | Non |
Confidentialité | Réglé sur public par défaut. Ce paramètre peut restreindre l'accès à un actif dans un catalogue lorsqu'il est défini sur privé. Seuls le propriétaire et les membres d'un actif privé peuvent voir et utiliser celui-ci. | Oui |
Page Accès | Propriétaire et membres de l'actif. Par défaut, le propriétaire de l'actif est l'utilisateur qui l'a ajouté au catalogue. Les membres de l'actif peuvent afficher et utiliser l'actif lorsqu'il est marqué comme privé. Voir Contrôle de l'accès à un actif. | Oui |
Page Notations | Facultatif. Les collaborateurs de catalogue peuvent évaluer et réviser les actifs. | Oui |
Balises | Facultatif. Libellés de texte créés par les collaborateurs de catalogue pour simplifier la recherche. Une balise est composée d'une chaîne pouvant comporter jusqu'à 255 caractères. Elles peut contenir des espaces, des lettres, des chiffres, des traits de soulignement, des tirets et les symboles # et @. | Oui |
Relations | Facultatif. Les relations qui apparaissent dans la section Articles connexes de la page Présentation de l'actif sont informatives et n'ont pas d'autres effets sur l'actif. Peut être entre des actifs dans le même espace de travail ou dans des espaces de travail différents. Par exemple, vous pouvez ajouter une relation entre un actif dans un catalogue et un actif dans un projet. Peut se trouver entre un actif et un artefact. Par exemple, vous pouvez ajouter une relation entre un actif et une stratégie. Les administrateurs peuvent créer des relations personnalisées pour les actifs. Voir Ajout de relations d'actif. | Oui |
Artefacts de gouvernance | Facultatif. Termes métier et classification que les utilisateurs ont affectés à l'actif. Ces affectations peuvent affecter l'actif. Par exemple, un terme métier affecté peut déclencher l'application d'une règle de protection des données. | Oui |
Vous pouvez créer des propriétés personnalisées pour les types d'actif. Les propriétés personnalisées sont affichées dans la section Détails de l'onglet Présentation de l'actif dans le catalogue. Voir Propriétés et relations personnalisées.
Pour éditer des propriétés d'actif, vous devez disposer des droits requis. Voir Edition d'actifs dans un catalogue.
Propriétés communes pour les actifs qui s'exécutent dans des outils
Certains actifs sont associés à l'exécution d'un outil. Par exemple, un actif d'expérimentation AutoAI s'exécute dans l'outil AutoAI . Les actifs qui s'exécutent dans des outils sont également appelés actifs opérationnels. Chaque fois que vous exécutez des actifs dans des outils, vous démarrez un travail. Vous pouvez surveiller les travaux et programmer leur exécution. Les travaux utilisent des ressources de calcul. Les ressources de calcul sont mesurées en unités de capacité-heures (CUH, Capacity Units-Hours). En fonction de vos plans de service, vous pouvez avoir une quantité limitée de CUH par mois ou payer la CUH que vous utilisez chaque mois.
Pour de nombreux actifs qui s'exécutent dans des outils, vous avez le choix entre la configuration de l'environnement de calcul à utiliser. Généralement, plus la configuration d'environnement est grosse, plus il y a de ressources et plus rapides sont les calculs.
Outre les propriétés de base, la plupart des actifs qui s'exécutent dans des outils contiennent les types d'informations suivants dans les projets:
Propriétés | Descriptif | Modifiable? | Espaces de travail |
---|---|---|---|
Définition d'environnement | Modèle d'environnement, spécification matérielle et spécification logicielle pour l'exécution de l'actif. Voir Environnements. | Oui | Projets, Espaces |
Paramètres | Informations qui définissent le mode d'exécution de l'actif. Spécifique à chaque type d'actif. | Oui | Projets |
Actifs de données associés | Données sur lesquelles l'actif travaille. | Oui | Projets |
Travaux | Informations sur l'exécution de l'actif, y compris la définition de l'environnement, la planification et les options de notification. Voir Travaux. | Oui | Projets, Espaces |
Types d'actif de données et leurs propriétés
Les types d'actifs de données contiennent des métadonnées et d'autres informations sur les données, y compris la manière d'accéder aux données.
La façon de créer un actif de données dépend de l'endroit où se trouvent les données en question :
Si vos données sont dans un fichier, vous transférez (remontez) celui-ci de votre système local vers un projet, un catalogue ou un espace de déploiement.
Si vos données se trouve dans une source de données distante, vous devez d'abord créer un Actif de connexion qui définit la connexion à cette source de données. Ensuite, vous créez un actif de données en sélectionnant la connexion, le chemin ou une autre structure, ainsi que la table ou le fichier contenant les données. Ce type d'actif de données est appelé Actif de données connecté.
Pour les sources de données qui prennent en charge les requêtes SQL, vous pouvez également créer des vues dynamiques, qui sont des actifs de données de type Requête. Pour créer un tel actif, sélectionnez la connexion et fournissez une requête SQL qui extrait uniquement les données dont vous avez besoin.
Le graphique suivant montre comment les actifs de données des fichiers pointent vers les fichiers téléchargés dans Cloud Object Storage. Les actifs de données connectés requièrent un actif de connexion et pointent vers des données dans une source de données distante.
Vous pouvez créer les types d'actifs de données suivants dans un projet, un catalogue ou un espace de déploiement:
Data asset from a file Représente un fichier que vous avez téléchargé à partir de votre système local. Le fichier est stocké dans le conteneur de stockage d'objets sur l'instance IBM Cloud Object Storage associée à l'espace de travail. Le contenu du fichier peut être constitué de données structurées, de textes non structurés, d'images et d'autres types de données. Vous pouvez créer un actif de données avec un fichier de n'importe quel format. Toutefois, vous pouvez effectuer plus d'actions sur les fichiers CSV que les autres types de fichier. Voir Propriétés des actifs de données.
Vous pouvez créer un actif de données à partir d'un fichier en téléchargeant un fichier dans un espace de travail. Vous pouvez également créer des fichiers de données avec des outils et les convertir en actifs. Par exemple, vous pouvez créer des ressources de données à partir de fichiers avec les outils Data Refinery, Jupyter notebook et RStudio.
Actif de données connecté Représente une table, un fichier ou un dossier accessible via une connexion à une source de données distante. La connexion est définie dans l'actif de connexion associé à l'actif de données connecté. Vous pouvez créer un actif de données connecté pour chaque connexion prise en charge. Lorsque vous accédez à un actif de données connecté, les données sont extraites dynamiquement de la source de données. Voir Propriétés des actifs de données.
Vous pouvez importer des actifs de données connectés à partir d'une source de données à l'aide de l'outil de données connectées dans un espace de travail. Si vous souhaitez importer des ensembles d'actifs de données connectés, par exemple un schéma de base de données complet, utilisez l'outil d'importation de métadonnées dans les projets. Vous pouvez créer des tables virtuelles qui compilent des données à partir de plusieurs sources de données avec Data Virtualization dans l'espace de travail Data virtualization .
Dans les projets, vous pouvez créer des vues dynamiques contenant des données filtrées provenant d'une ou de plusieurs tables d'une source de données à l'aide de l'outil d'accès aux données de requête.
Attribut de dossier Représente un dossier dans IBM Cloud Object Storage. Un actif de données de dossier est un cas particulier d'un actif de données connecté. Vous le créez en spécifiant le chemin menant au dossier et l'actif de connexion IBM Cloud Object Storage. Vous pouvez voir les fichiers et les sous-dossiers qui partagent le chemin avec l'actif de données de dossier. Les fichiers que vous pouvez voir dans l'actif de données de dossier ne sont pas eux-mêmes des actifs de données. Par exemple, vous pouvez créer un actif de données de dossier pour un chemin contenant des flux d'actualités sans cesse mis à jour. Voir Propriétés des actifs de données.
Vous pouvez importer des actifs de dossiers depuis IBM Cloud Object Storage avec l'outil de données connectées dans un espace de travail.
Actif de connexion Contient les informations nécessaires à la création d'une connexion à une source de données. Voir Propriétés des actifs de connexion.
Vous pouvez créer des connexions à l'aide de l'outil de connexion dans un espace de travail.
En savoir plus sur la création et l'importation d'actifs de données:
- Ajout de données à un projet
- Ajout d'actifs à un catalogue
- Ajout d'actifs de données à un espace de déploiement
- Virtualisation des données
Propriétés des actifs de données à partir de fichiers et d'actifs de données connectés
Outre les propriétés de base et les propriétés de catalogue communes, les actifs de données des fichiers et les actifs de données connectés possèdent les propriétés ou les pages répertoriées dans le tableau ci-dessous.
Propriété ou page | Descriptif | Modifiable? | Espaces de travail |
---|---|---|---|
Colonnes | Récapitulatif des propriétés des colonnes de l'actif de données. Inclut le score de qualité, la description, les classes de données affectées et les termes métier affectés pour chaque colonne. Les classes de données et les termes métier affectés peuvent affecter l'actif. Par exemple, un terme commercial attribué peut déclencher l'application d'une règle de protection des données. Informations sur la clé primaire et la relation de clé : - Une colonne définie comme clé primaire est identifiée par une icône de clé (. Une clé primaire est également affichée dans le panneau latéral de l'actif. - S'il existe des relations de clé pour l'actif, vous pouvez cliquer sur le lien Afficher les relations de clé . Dans l'onglet Parent de , vous voyez toutes les relations de la clé primaire. Dans l'onglet Enfant de , vous voyez toutes les relations pour lesquelles l'actif contient une clé externe. |
Non | Catalogues |
Balises | Facultatif. Libellés que les utilisateurs créent pour simplifier la recherche. Une balise est composée d'une chaîne pouvant comporter jusqu'à 255 caractères. Elles peut contenir des espaces, des lettres, des chiffres, des traits de soulignement, des tirets et les symboles # et @. | Oui | Projets, catalogues |
Format | Type MIME d'un fichier. Détecté automatiquement. | Oui | Projets, catalogues, espaces |
Détails de l'actif | Informations sur la taille des données, le nombre de colonnes et de lignes et la version de l'actif. Dans les projets, le type de table des données relationnelles est également affiché. |
Non | Projets, catalogues, espaces |
Rechercher | Informations sur le fichier de données dans le stockage ou sur la source de données et la connexion. | Non | Catalogues, espaces |
Requête | Requête SQL qui génère l'actif. Vues dynamiques uniquement. |
Oui | Projets |
Informations de connexion | Pour les actifs de données connectés, le chemin, le nom de connexion, le type de connecteur et le propriétaire de connexion. Pour les vues dynamiques, seuls le nom de connexion et le type de connecteur sont affichés. |
Non | Projets |
Sous-fenêtre Activités | Historique des actions effectuées sur l'actif dans tous les espaces de travail. Voir Activités. | Non | Projets, catalogues |
Page Aperçu de l'actif ou Actif | Un aperçu des données qui inclut un ensemble limité de colonnes et de lignes de la source de données d'origine. Voir Contenu de l'actif ou aperçus. | Non | Projets, catalogues, espaces |
Page Profil | Métadonnées et statistiques sur le contenu des données. Par exemple, lorsqu'un bien enrichi sémantiquement est publié dans un catalogue, les métadonnées étendues sont également publiées et Nom d'affichage et Description, qui sont soit le nom généré par l'IA, soit une version modifiée, s'affichent sur cette page. Ces informations figurent également sur la page Overview. Voir Profil. | Oui | Projets, catalogues |
Page Qualité des données | Informations sur la qualité des données d'un actif et de ses colonnes, ainsi que sur les contrôles de qualité des données appliqués. Voir Qualité des données. | Oui [ 1 ] | Projets, catalogues |
Page Visualisations | Diagrammes et graphiques créés par les utilisateurs pour comprendre les données. Voir Visualisations. | Oui | Projets |
Page Groupe de fonctions | Informations sur les colonnes de l'actif de données qui sont utilisées en tant que fonctions dans les modèles. Voir Gestion des groupes de fonctions. | Oui | Projets, catalogues, espaces |
Propriétés des actifs de connexion
Les propriétés des actifs de connexion dépendent de la source de données que vous sélectionnez lorsque vous créez une connexion. Voir Types de connexion. Les actifs de connexion de la plupart des sources de données possèdent les propriétés répertoriées dans le tableau ci-dessous.
Propriétés | Descriptif | Modifiable? | Espaces de travail |
---|---|---|---|
Informations de connexion | Informations qui identifient la source de données. Par exemple, le nom de la base de données, le nom d'hôte, l'adresse IP, le port, l'ID d'instance, le compartiment, l'URL de noeud final, etc. | Oui | Projets, catalogues, espaces |
Paramétrage des données d'identification | Indique si les données d'identification sont partagées sur la plateforme (par défaut) ou si chaque utilisateur doit entrer ses données d'identification personnelles. Toutes les sources de données ne prennent pas en charge les données d'identification personnelles. | Oui | Projets, catalogues, espaces |
Méthode d'authentification | Format des données d'identification. Par exemple, une clé d'API ou un nom d'utilisateur et un mot de passe. | Oui | Projets, catalogues, espaces |
Données d'identification | Nom d'utilisateur et mot de passe, clé d'API ou autres données d'identification, comme requis par la source de données et la méthode d'authentification spécifiée. | Oui | Projets, catalogues, espaces |
Certificats | Indique si le port de la source de données est configuré pour accepter les connexions SSL et d'autres informations sur le certificat SSL. | Oui | Projets, catalogues, espaces |
Connectivité privée | Méthode de connexion à une base de données qui n'est pas externalisée sur Internet. Voir Connexion à des données derrière un pare-feu. | Oui | Projets, catalogues, espaces |
Emplacement et souveraineté | Emplacement physique du centre de données dans lequel les données sont stockées et entité souveraine ayant juridiction sur les données. | Oui | Projets, catalogues, espaces |
En savoir plus
- Valeur des actifs
- Recherche d'actifs dans l'ensemble de la plateforme
- Profils
- Contenu de l'actif ou aperçus
- Qualité des données
- Activités
- Visualisations
- Initiation
- Types de connexion
Sujet parent : Vue d'ensemble de IBM Cloud Pak for Data as a Service
Projets uniquement ↩︎