0 / 0
Retourner à la version anglaise de la documentation
Types d'actif et propriétés
Dernière mise à jour : 21 nov. 2024
Types d'actif et propriétés

La plateforme fournit des espaces de travail et des outils collaboratifs, et vous fournissez le contenu à la plateforme, sous la forme d'actifs. Un actif est un élément qui contient des informations sur les données, d'autres informations utiles ou du code qui fonctionne avec les données.

Vous ajoutez des actifs en les important ou en les créant à l'aide d'outils. Vous travaillez avec des actifs dans des espaces de travail collaboratifs. L'espace de travail que vous utilisez dépend de vos tâches.

  • Projets Lorsque vous collaborez avec d'autres personnes pour utiliser des données et créer des actifs. La plupart des outils se trouvent dans des projets et vous exécutez des actifs qui contiennent du code dans des projets. Par exemple, vous pouvez importer des données, préparer des données, analyser des données ou créer des modèles dans des projets. Consultez Projets.

  • Catalogues Emplacement où vous stockez les ressources à partager avec votre organisation ou accédez à la recherche des ressources avec lesquelles vous devez travailler. Vous pouvez copier des actifs à partir de catalogues dans des projets ou publier des actifs à partir de projets dans le catalogue. Vous pouvez éditer des propriétés d'actif et des métadonnées dans un catalogue, mais vous ne pouvez pas exécuter d'actifs. Consultez Catalogues.

  • Espaces de déploiement Lorsque vous déployez et exécutez des actifs prêts pour le test ou la production. Vous déplacez des actifs de projets vers des espaces de déploiement, puis vous créez des déploiements à partir de ces actifs. Vous surveillez et mettez à jour les déploiements si nécessaire. Consultez Espaces de déploiement.

Vous pouvez trouver n'importe quel actif dans l'un des espaces de travail dont vous êtes un collaborateur en le recherchant dans la barre de recherche globale. Consultez Recherche d'actifs dans l'ensemble de la plateforme.

Vous pouvez créer de nombreux types d'actifs différents, mais tous les actifs ont des propriétés communes:

Types d'actif

Pour créer la plupart des types d'actifs, vous devez utiliser un outil spécifique. La plupart des outils sont fournis par un ou plusieurs services. Les outils permettant de créer des actifs de données et des actifs de connexion sont fournis par la plateforme et ne nécessitent pas de services spécifiques.

Pour voir les services dont vous avez besoin pour quels outils, ouvrez la carte des outils et des services.

Le tableau suivant répertorie les types d'actifs que vous pouvez créer, les outils dont vous avez besoin pour les créer et les espaces de travail dans lesquels vous pouvez les ajouter.

Types d'actif
Type d'actif Descriptif Outils pour le créer Espaces de travail
expérimentation AutoAI Génère automatiquement des pipelines de modèle prédictif candidat. AutoAI Projets
Fichier de stockage COBOL Affiche les métadonnées de mappe pour les actifs de données connectés à partir des grands systèmes z/OS . Outil d' Metadata import Projets, catalogues
Actif de données connecté Représente les données accessibles via une connexion à une source de données distante. Outil de données connectées, outil d' Metadata import Projets, catalogues, espaces
connexion Contient les informations permettant de se connecter à une source de données. Outil de connexion Projets, catalogues, espaces
Actif de données à partir d'un fichier Représente un fichier que vous avez téléchargé à partir de votre système local. Sous-fenêtre de téléchargement Projets, catalogues, espaces
Flux Data Refinery Prépare les données. Data Refinery Projets, Espaces
FluxData Replication Réplique les données. Data Replication Projets, catalogues
Définition de qualité des données Définit un composant de logique de règle réutilisable pour les règles de qualité de données. Editeur de définition de qualité de données Projets, catalogues
Règle de qualité des données Évalue la qualité des données pour des conditions spécifiques. Editeur de règles de qualité de données Projets
Définition de données DataStage Définit un composant de métadonnées de colonne réutilisable pour les travaux de flux DataStage . Editeur de composant DataStage Projets, Espaces
Flux DataStage Transforme et intègre des données. Editeur de flux DataStage Projets, Espaces
Bibliothèque de schémas DataStage Importe un ensemble réutilisable de ressources pour les flux DataStage . Editeur de composant DataStage Projets, Espaces
Règle de normalisation DataStage Définit un composant de règle réutilisable pour formater des données dans des flux DataStage . Editeur de composant DataStage Projets, Espaces
Flux secondaire DataStage Définit un ensemble réutilisable d'étapes et de connecteurs pour les flux DataStage . Editeur de composant DataStage Projets, Espaces
expérimentation Decision Optimization Résout les problèmes d'optimisation. Decision Optimization Projets
Vue dynamique Représente les données accessibles via une connexion à une source de données distante et filtrées par une requête SQL. Outil de requête Projets
Expérimentation d'apprentissage fédéré Entraîne un modèle commun sur un ensemble de sources de données distantes. Apprentissage fédéré Projets
Actif de dossier Représente un dossier dans IBM Cloud Object Storage. Outil de données connecté Projets, catalogues, espaces
Bloc-notes Jupyter Exécute du code Python ou R pour analyser des données ou générer des modèles. Jupyter éditeur de notes, AutoAI, Prompt Lab Projets, catalogues
Flux de masquage Crée des copies masquées des actifs de données. Flux de masquage Projets
Configuration des données de base Configure Match 360. Match 360 Projets
Enrichissement des métadonnées Enrichit les métadonnées d'actif importées. Outil d'enrichissement des métadonnées Projets
Metadata import Importe des métadonnées d'actif à partir d'une connexion. Outil d' Metadata import Projets
Modèle Contient des informations sur un modèle sauvegardé ou importé. Divers outils qui exécutent des expérimentations ou entraînent des modèles Projets, catalogues, espaces
Contrainte physique Représente les contraintes de clé principale ou externe pour les actifs de données. Sont créés automatiquement lorsque des résultats d'enrichissement de métadonnées contenant des relations de clé sont publiés Catalogues
Pipeline Automatise le cycle de vie du modèle. Pipelines d'orchestration Projets
Fonction Python Contient du code Python pour la prise en charge d'un modèle en production. Editeur de bloc-notes Jupyter Projets, Espaces
script Contient un script Python ou R pour prendre en charge un modèle en production. Jupyter éditeur de notes, RStudio Projets, Espaces
Flux SPSS Modeler Exécute un flux pour préparer les données et générer un modèle. SPSS Modeler Projets
Visualisation Affiche les visualisations d'un actif de données. Page Visualisation dans les actifs de données Projets

Propriétés communes pour les actifs

Les actifs accumulent des informations dans les propriétés lorsque vous les créez, les utilisez ou lorsqu'ils sont mis à jour par des processus automatisés. Certaines propriétés sont fournies par les utilisateurs et peuvent être éditées par les utilisateurs. D'autres propriétés sont automatiquement fournies par le système. La plupart des propriétés fournies par le système ne peuvent pas être éditées par les utilisateurs.

La zone Dernière modification d'un actif permet de suivre à la fois les actions utilisateur et les actions système. Les actions système se produisent souvent en arrière-plan et peuvent impliquer uniquement des modifications des métadonnées internes de l'actif.

Propriétés communes pour les actifs partout

La plupart des types d'actifs possèdent les propriétés répertoriées dans le tableau suivant dans tous les espaces de travail où ces types d'actifs existent.

Propriétés communes pour les actifs
Propriété Descriptif Modifiable?
Nom Nom de l'actif. Peut contenir jusqu'à 255 caractères. Les caractères multi-octets sont acceptés. Ne peut pas être vide ni contenir des caractères de contrôle Unicode ou seulement des espaces. Les noms d'actif n'ont pas besoin d'être uniques dans un projet ou un espace de déploiement. La question de savoir si les noms d'actifs doivent être uniques dans un catalogue dépend de la méthode de gestion des doublons définie pour le catalogue. Oui
Descriptif Facultatif. Les caractères multi-octets et les hyperliens sont acceptés. Oui
Date de création Horodatage de la création ou de l'importation de l'actif. Non
Créateur ou propriétaire Nom d'utilisateur ou adresse électronique de la personne qui a créé ou importé l'actif. Non
Date de dernière modification Horodatage de la dernière modification de l'actif. Non
Dernier éditeur Nom d'utilisateur ou adresse électronique de la personne qui a modifié l'actif pour la dernière fois. Non

Propriétés communes des actifs dans les catalogues

Outre les propriétés communes de tous les actifs, les actifs des catalogues possèdent les propriétés et les pages répertoriées dans le tableau suivant.

Propriétés communes des actifs dans les catalogues
Propriété ou page Descriptif Modifiable?
Page Actif Vue du contenu de l'actif. Voir Contenu de l'actif ou aperçus. Non
Confidentialité Réglé sur public par défaut. Ce paramètre peut restreindre l'accès à un actif dans un catalogue lorsqu'il est défini sur privé. Seuls le propriétaire et les membres d'un actif privé peuvent voir et utiliser celui-ci. Oui
Page Accès Propriétaire et membres de l'actif. Par défaut, le propriétaire de l'actif est l'utilisateur qui l'a ajouté au catalogue. Les membres de l'actif peuvent afficher et utiliser l'actif lorsqu'il est marqué comme privé. Voir Contrôle de l'accès à un actif. Oui
Page Notations Facultatif. Les collaborateurs de catalogue peuvent évaluer et réviser les actifs. Oui
Balises Facultatif. Libellés de texte créés par les collaborateurs de catalogue pour simplifier la recherche. Une balise est composée d'une chaîne pouvant comporter jusqu'à 255 caractères. Elles peut contenir des espaces, des lettres, des chiffres, des traits de soulignement, des tirets et les symboles # et @. Oui
Relations Facultatif. Les relations qui apparaissent dans la section Articles connexes de la page Présentation de l'actif sont informatives et n'ont pas d'autres effets sur l'actif. Peut être entre des actifs dans le même espace de travail ou dans des espaces de travail différents. Par exemple, vous pouvez ajouter une relation entre un actif dans un catalogue et un actif dans un projet. Peut se trouver entre un actif et un artefact. Par exemple, vous pouvez ajouter une relation entre un actif et une stratégie. Les administrateurs peuvent créer des relations personnalisées pour les actifs. Voir Ajout de relations d'actif. Oui
Artefacts de gouvernance Facultatif. Termes métier et classification que les utilisateurs ont affectés à l'actif. Ces affectations peuvent affecter l'actif. Par exemple, un terme métier affecté peut déclencher l'application d'une règle de protection des données. Oui

Vous pouvez créer des propriétés personnalisées pour les types d'actif. Les propriétés personnalisées sont affichées dans la section Détails de l'onglet Présentation de l'actif dans le catalogue. Voir Propriétés et relations personnalisées.

Pour éditer des propriétés d'actif, vous devez disposer des droits requis. Voir Edition d'actifs dans un catalogue.

Propriétés communes pour les actifs qui s'exécutent dans des outils

Certains actifs sont associés à l'exécution d'un outil. Par exemple, un actif d'expérimentation AutoAI s'exécute dans l'outil AutoAI . Les actifs qui s'exécutent dans des outils sont également appelés actifs opérationnels. Chaque fois que vous exécutez des actifs dans des outils, vous démarrez un travail. Vous pouvez surveiller les travaux et programmer leur exécution. Les travaux utilisent des ressources de calcul. Les ressources de calcul sont mesurées en unités de capacité-heures (CUH, Capacity Units-Hours). En fonction de vos plans de service, vous pouvez avoir une quantité limitée de CUH par mois ou payer la CUH que vous utilisez chaque mois.

Pour de nombreux actifs qui s'exécutent dans des outils, vous avez le choix entre la configuration de l'environnement de calcul à utiliser. Généralement, plus la configuration d'environnement est grosse, plus il y a de ressources et plus rapides sont les calculs.

Outre les propriétés de base, la plupart des actifs qui s'exécutent dans des outils contiennent les types d'informations suivants dans les projets:

Propriétés des actifs dans les projets
Propriétés Descriptif Modifiable? Espaces de travail
Définition d'environnement Modèle d'environnement, spécification matérielle et spécification logicielle pour l'exécution de l'actif. Voir Environnements. Oui Projets, Espaces
Paramètres Informations qui définissent le mode d'exécution de l'actif. Spécifique à chaque type d'actif. Oui Projets
Actifs de données associés Données sur lesquelles l'actif travaille. Oui Projets
Travaux Informations sur l'exécution de l'actif, y compris la définition de l'environnement, la planification et les options de notification. Voir Travaux. Oui Projets, Espaces

Types d'actif de données et leurs propriétés

Les types d'actifs de données contiennent des métadonnées et d'autres informations sur les données, y compris la manière d'accéder aux données.

La façon de créer un actif de données dépend de l'endroit où se trouvent les données en question :

  • Si vos données sont dans un fichier, vous transférez (remontez) celui-ci de votre système local vers un projet, un catalogue ou un espace de déploiement.

  • Si vos données se trouve dans une source de données distante, vous devez d'abord créer un Actif de connexion qui définit la connexion à cette source de données. Ensuite, vous créez un actif de données en sélectionnant la connexion, le chemin ou une autre structure, ainsi que la table ou le fichier contenant les données. Ce type d'actif de données est appelé Actif de données connecté.

    Pour les sources de données qui prennent en charge les requêtes SQL, vous pouvez également créer des vues dynamiques, qui sont des actifs de données de type Requête. Pour créer un tel actif, sélectionnez la connexion et fournissez une requête SQL qui extrait uniquement les données dont vous avez besoin.

Le graphique suivant montre comment les actifs de données des fichiers pointent vers les fichiers téléchargés dans Cloud Object Storage. Les actifs de données connectés requièrent un actif de connexion et pointent vers des données dans une source de données distante.

Ce graphique montre que les actifs de données des fichiers pointent vers des fichiers téléchargés et que les actifs de données connectés nécessitent un actif de connexion et pointent vers des données dans une source de données distante.

Vous pouvez créer les types d'actifs de données suivants dans un projet, un catalogue ou un espace de déploiement:

  • Data asset from a file Représente un fichier que vous avez téléchargé à partir de votre système local. Le fichier est stocké dans le conteneur de stockage d'objets sur l'instance IBM Cloud Object Storage associée à l'espace de travail. Le contenu du fichier peut être constitué de données structurées, de textes non structurés, d'images et d'autres types de données. Vous pouvez créer un actif de données avec un fichier de n'importe quel format. Toutefois, vous pouvez effectuer plus d'actions sur les fichiers CSV que les autres types de fichier. Voir Propriétés des actifs de données.

    Vous pouvez créer un actif de données à partir d'un fichier en téléchargeant un fichier dans un espace de travail. Vous pouvez également créer des fichiers de données avec des outils et les convertir en actifs. Par exemple, vous pouvez créer des ressources de données à partir de fichiers avec les outils Data Refinery, Jupyter notebook et RStudio.

  • Actif de données connecté Représente une table, un fichier ou un dossier accessible via une connexion à une source de données distante. La connexion est définie dans l'actif de connexion associé à l'actif de données connecté. Vous pouvez créer un actif de données connecté pour chaque connexion prise en charge. Lorsque vous accédez à un actif de données connecté, les données sont extraites dynamiquement de la source de données. Voir Propriétés des actifs de données.

    Vous pouvez importer des actifs de données connectés à partir d'une source de données à l'aide de l'outil de données connectées dans un espace de travail. Si vous souhaitez importer des ensembles d'actifs de données connectés, par exemple un schéma de base de données complet, utilisez l'outil d'importation de métadonnées dans les projets. Vous pouvez créer des tables virtuelles qui compilent des données à partir de plusieurs sources de données avec Data Virtualization dans l'espace de travail Data virtualization .

    Dans les projets, vous pouvez créer des vues dynamiques contenant des données filtrées provenant d'une ou de plusieurs tables d'une source de données à l'aide de l'outil d'accès aux données de requête.

  • Attribut de dossier Représente un dossier dans IBM Cloud Object Storage. Un actif de données de dossier est un cas particulier d'un actif de données connecté. Vous le créez en spécifiant le chemin menant au dossier et l'actif de connexion IBM Cloud Object Storage. Vous pouvez voir les fichiers et les sous-dossiers qui partagent le chemin avec l'actif de données de dossier. Les fichiers que vous pouvez voir dans l'actif de données de dossier ne sont pas eux-mêmes des actifs de données. Par exemple, vous pouvez créer un actif de données de dossier pour un chemin contenant des flux d'actualités sans cesse mis à jour. Voir Propriétés des actifs de données.

    Vous pouvez importer des actifs de dossiers depuis IBM Cloud Object Storage avec l'outil de données connectées dans un espace de travail.

  • Actif de connexion Contient les informations nécessaires à la création d'une connexion à une source de données. Voir Propriétés des actifs de connexion.

    Vous pouvez créer des connexions à l'aide de l'outil de connexion dans un espace de travail.

En savoir plus sur la création et l'importation d'actifs de données:

Propriétés des actifs de données à partir de fichiers et d'actifs de données connectés

Outre les propriétés de base et les propriétés de catalogue communes, les actifs de données des fichiers et les actifs de données connectés possèdent les propriétés ou les pages répertoriées dans le tableau ci-dessous.

Propriétés des actifs de données à partir de fichiers et d'actifs de données connectés
Propriété ou page Descriptif Modifiable? Espaces de travail
Colonnes Récapitulatif des propriétés des colonnes de l'actif de données. Inclut le score de qualité, la description, les classes de données affectées et les termes métier affectés pour chaque colonne. Les classes de données et les termes métier affectés peuvent affecter l'actif. Par exemple, un terme commercial attribué peut déclencher l'application d'une règle de protection des données.

Informations sur la clé primaire et la relation de clé :
- Une colonne définie comme clé primaire est identifiée par une icône de clé (Icône de clé. Une clé primaire est également affichée dans le panneau latéral de l'actif.
- S'il existe des relations de clé pour l'actif, vous pouvez cliquer sur le lien Afficher les relations de clé . Dans l'onglet Parent de , vous voyez toutes les relations de la clé primaire. Dans l'onglet Enfant de , vous voyez toutes les relations pour lesquelles l'actif contient une clé externe.
Non Catalogues
Balises Facultatif. Libellés que les utilisateurs créent pour simplifier la recherche. Une balise est composée d'une chaîne pouvant comporter jusqu'à 255 caractères. Elles peut contenir des espaces, des lettres, des chiffres, des traits de soulignement, des tirets et les symboles # et @. Oui Projets, catalogues
Format Type MIME d'un fichier. Détecté automatiquement. Oui Projets, catalogues, espaces
Détails de l'actif Informations sur la taille des données, le nombre de colonnes et de lignes et la version de l'actif.
Dans les projets, le type de table des données relationnelles est également affiché.
Non Projets, catalogues, espaces
Rechercher Informations sur le fichier de données dans le stockage ou sur la source de données et la connexion. Non Catalogues, espaces
Requête Requête SQL qui génère l'actif.
Vues dynamiques uniquement.
Oui Projets
Informations de connexion Pour les actifs de données connectés, le chemin, le nom de connexion, le type de connecteur et le propriétaire de connexion.
Pour les vues dynamiques, seuls le nom de connexion et le type de connecteur sont affichés.
Non Projets
Sous-fenêtre Activités Historique des actions effectuées sur l'actif dans tous les espaces de travail. Voir Activités. Non Projets, catalogues
Page Aperçu de l'actif ou Actif Un aperçu des données qui inclut un ensemble limité de colonnes et de lignes de la source de données d'origine. Voir Contenu de l'actif ou aperçus. Non Projets, catalogues, espaces
Page Profil Métadonnées et statistiques sur le contenu des données. Par exemple, lorsqu'un bien enrichi sémantiquement est publié dans un catalogue, les métadonnées étendues sont également publiées et Nom d'affichage et Description, qui sont soit le nom généré par l'IA, soit une version modifiée, s'affichent sur cette page. Ces informations figurent également sur la page Overview. Voir Profil. Oui Projets, catalogues
Page Qualité des données Informations sur la qualité des données d'un actif et de ses colonnes, ainsi que sur les contrôles de qualité des données appliqués. Voir Qualité des données. Oui [ 1 ] Projets, catalogues
Page Visualisations Diagrammes et graphiques créés par les utilisateurs pour comprendre les données. Voir Visualisations. Oui Projets
Page Groupe de fonctions Informations sur les colonnes de l'actif de données qui sont utilisées en tant que fonctions dans les modèles. Voir Gestion des groupes de fonctions. Oui Projets, catalogues, espaces

Propriétés des actifs de connexion

Les propriétés des actifs de connexion dépendent de la source de données que vous sélectionnez lorsque vous créez une connexion. Voir Types de connexion. Les actifs de connexion de la plupart des sources de données possèdent les propriétés répertoriées dans le tableau ci-dessous.

Propriétés des actifs de connexion
Propriétés Descriptif Modifiable? Espaces de travail
Informations de connexion Informations qui identifient la source de données. Par exemple, le nom de la base de données, le nom d'hôte, l'adresse IP, le port, l'ID d'instance, le compartiment, l'URL de noeud final, etc. Oui Projets, catalogues, espaces
Paramétrage des données d'identification Indique si les données d'identification sont partagées sur la plateforme (par défaut) ou si chaque utilisateur doit entrer ses données d'identification personnelles. Toutes les sources de données ne prennent pas en charge les données d'identification personnelles. Oui Projets, catalogues, espaces
Méthode d'authentification Format des données d'identification. Par exemple, une clé d'API ou un nom d'utilisateur et un mot de passe. Oui Projets, catalogues, espaces
Données d'identification Nom d'utilisateur et mot de passe, clé d'API ou autres données d'identification, comme requis par la source de données et la méthode d'authentification spécifiée. Oui Projets, catalogues, espaces
Certificats Indique si le port de la source de données est configuré pour accepter les connexions SSL et d'autres informations sur le certificat SSL. Oui Projets, catalogues, espaces
Connectivité privée Méthode de connexion à une base de données qui n'est pas externalisée sur Internet. Voir Connexion à des données derrière un pare-feu. Oui Projets, catalogues, espaces
Emplacement et souveraineté Emplacement physique du centre de données dans lequel les données sont stockées et entité souveraine ayant juridiction sur les données. Oui Projets, catalogues, espaces

En savoir plus

Sujet parent : Vue d'ensemble de IBM Cloud Pak for Data as a Service


  1. Projets uniquement ↩︎

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus