Types d'actif et propriétés | IBM Cloud Pak for Data as a Service

Retourner à la version anglaise de la documentation

Types d'actif et propriétés

La plateforme fournit des espaces de travail et des outils collaboratifs, et vous fournissez le contenu à la plateforme, sous la forme d'actifs. Un actif est un élément qui contient des informations sur les données, d'autres informations utiles ou du code qui fonctionne avec les données.

Vous ajoutez des actifs en les important ou en les créant à l'aide d'outils. Vous travaillez avec des actifs dans des espaces de travail collaboratifs. L'espace de travail que vous utilisez dépend de vos tâches.

Projets Lorsque vous collaborez avec d'autres personnes pour utiliser des données et créer des actifs. La plupart des outils se trouvent dans des projets et vous exécutez des actifs qui contiennent du code dans des projets. Par exemple, vous pouvez importer des données, préparer des données, analyser des données ou créer des modèles dans des projets. Consultez Projets.
Catalogues Emplacement où vous stockez les ressources à partager avec votre organisation ou accédez à la recherche des ressources avec lesquelles vous devez travailler. Vous pouvez copier des actifs à partir de catalogues dans des projets ou publier des actifs à partir de projets dans le catalogue. Vous pouvez éditer des propriétés d'actif et des métadonnées dans un catalogue, mais vous ne pouvez pas exécuter d'actifs. Consultez Catalogues.
Espaces de déploiement Lorsque vous déployez et exécutez des actifs prêts pour le test ou la production. Vous déplacez des actifs de projets vers des espaces de déploiement, puis vous créez des déploiements à partir de ces actifs. Vous surveillez et mettez à jour les déploiements si nécessaire. Consultez Espaces de déploiement.

Vous pouvez trouver n'importe quel actif dans l'un des espaces de travail dont vous êtes un collaborateur en le recherchant dans la barre de recherche globale. Consultez Recherche d'actifs dans l'ensemble de la plateforme.

Vous pouvez créer de nombreux types d'actifs différents, mais tous les actifs ont des propriétés communes:

Types d'actif
Propriétés communes des actifs
Types d'actif de données et leurs propriétés

Types d'actif

Pour créer la plupart des types d'actifs, vous devez utiliser un outil spécifique. La plupart des outils sont fournis par un ou plusieurs services. Les outils permettant de créer des actifs de données et des actifs de connexion sont fournis par la plateforme et ne nécessitent pas de services spécifiques.

Pour voir les services dont vous avez besoin pour quels outils, ouvrez la carte des outils et des services.

Le tableau suivant répertorie les types d'actifs que vous pouvez créer, les outils dont vous avez besoin pour les créer et les espaces de travail dans lesquels vous pouvez les ajouter.

Types d'actif
Type d'actif	Descriptif	Outils pour le créer	Espaces de travail
expérimentation AutoAI	Génère automatiquement des pipelines de modèle prédictif candidat.	AutoAI	Projets
Fichier de stockage COBOL	Affiche les métadonnées de mappe pour les actifs de données connectés à partir des grands systèmes z/OS .	Outil d' Metadata import	Projets, catalogues
Actif de données connecté	Représente les données accessibles via une connexion à une source de données distante.	Outil de données connectées, outil d' Metadata import	Projets, catalogues, espaces
connexion	Contient les informations permettant de se connecter à une source de données.	Outil de connexion	Projets, catalogues, espaces
Dashboard	Visualise les données dans des graphiques interactifs sans code.	Editeur de tableau de bord	Projets, catalogues
Actif de données à partir d'un fichier	Représente un fichier que vous avez téléchargé à partir de votre système local.	Sous-fenêtre de téléchargement	Projets, catalogues, espaces
Flux Data Refinery	Prépare les données.	Data Refinery	Projets, Espaces
FluxData Replication	Réplique les données.	Data Replication	Projets, catalogues
Définition de qualité des données	Définit un composant de logique de règle réutilisable pour les règles de qualité de données.	Editeur de définition de qualité de données	Projets, catalogues
Règle de qualité des données	Évalue la qualité des données pour des conditions spécifiques.	Editeur de règles de qualité de données	Projets
Définition de données DataStage	Définit un composant de métadonnées de colonne réutilisable pour les travaux de flux DataStage .	Editeur de composant DataStage	Projets, Espaces
Flux DataStage	Transforme et intègre des données.	Editeur de flux DataStage	Projets, Espaces
Bibliothèque de schémas DataStage	Importe un ensemble réutilisable de ressources pour les flux DataStage .	Editeur de composant DataStage	Projets, Espaces
Règle de normalisation DataStage	Définit un composant de règle réutilisable pour formater des données dans des flux DataStage .	Editeur de composant DataStage	Projets, Espaces
Flux secondaire DataStage	Définit un ensemble réutilisable d'étapes et de connecteurs pour les flux DataStage .	Editeur de composant DataStage	Projets, Espaces
expérimentation Decision Optimization	Résout les problèmes d'optimisation.	Decision Optimization	Projets
Vue dynamique	Représente les données accessibles via une connexion à une source de données distante et filtrées par une requête SQL.	Outil de requête	Projets
Expérimentation d'apprentissage fédéré	Entraîne un modèle commun sur un ensemble de sources de données distantes.	Apprentissage fédéré	Projets
Actif de dossier	Représente un dossier dans IBM Cloud Object Storage.	Outil de données connecté	Projets, catalogues, espaces
Bloc-notes Jupyter	Exécute du code Python ou R pour analyser des données ou générer des modèles.	Editeur de bloc-notes Jupyter, AutoAI, Prompt Lab	Projets, catalogues
Flux de masquage	Crée des copies masquées des actifs de données.	Flux de masquage	Projets
Configuration des données de base	Configure Match 360.	Match 360	Projets
Enrichissement des métadonnées	Enrichit les métadonnées d'actif importées.	Outil d'enrichissement des métadonnées	Projets
Metadata import	Importe des métadonnées d'actif à partir d'une connexion.	Outil d' Metadata import	Projets
Modèle	Contient des informations sur un modèle sauvegardé ou importé.	Divers outils qui exécutent des expérimentations ou entraînent des modèles	Projets, catalogues, espaces
Cas d'utilisation du modèle	Suit le cycle de vie d'un modèle de la demande à la production.	AI Factsheets	Catalogues
Ensemble de paramètres	Collecte un ensemble réutilisable de paramètres de travail pour les travaux DataStage .	Editeur d'ensemble de paramètres	Projets
Contrainte physique	Représente les contraintes de clé principale ou externe pour les actifs de données.	Sont créés automatiquement lorsque des résultats d'enrichissement de métadonnées contenant des relations de clé sont publiés	Catalogues
Pipeline	Automatise le cycle de vie du modèle.	Watson Pipelines	Projets
Fonction Python	Contient du code Python pour la prise en charge d'un modèle en production.	Editeur de bloc-notes Jupyter	Projets, Espaces
script	Contient un script Python ou R pour prendre en charge un modèle en production.	Editeur de bloc-notes Jupyter, RStudio	Projets, Espaces
Flux SPSS Modeler	Exécute un flux pour préparer les données et générer un modèle.	SPSS Modeler	Projets
Visualisation	Affiche les visualisations d'un actif de données.	Page Visualisation dans les actifs de données	Projets

Propriétés communes pour les actifs

Les actifs accumulent des informations dans les propriétés lorsque vous les créez, les utilisez ou lorsqu'ils sont mis à jour par des processus automatisés. Certaines propriétés sont fournies par les utilisateurs et peuvent être éditées par les utilisateurs. D'autres propriétés sont automatiquement fournies par le système. La plupart des propriétés fournies par le système ne peuvent pas être éditées par les utilisateurs.

Propriétés communes pour les actifs partout

La plupart des types d'actifs possèdent les propriétés répertoriées dans le tableau suivant dans tous les espaces de travail où ces types d'actifs existent.

Propriétés communes pour les actifs
Propriété	Descriptif	Modifiable?
Nom	Nom de l'actif. Peut contenir jusqu'à 255 caractères. Les caractères multi-octets sont acceptés. Ne peut pas être vide ni contenir des caractères de contrôle Unicode ou seulement des espaces. Les noms d'actif n'ont pas besoin d'être uniques dans un projet ou un espace de déploiement. La question de savoir si les noms d'actifs doivent être uniques dans un catalogue dépend de la méthode de gestion des doublons définie pour le catalogue.	Oui
Descriptif	Facultatif. Les caractères multi-octets et les hyperliens sont acceptés.	Oui
Date de création	Horodatage de la création ou de l'importation de l'actif.	Non
Créateur ou propriétaire	Nom d'utilisateur ou adresse électronique de la personne qui a créé ou importé l'actif.	Non
Date de dernière modification	Horodatage de la dernière modification de l'actif.	Non
Dernier éditeur	Nom d'utilisateur ou adresse électronique de la personne qui a modifié l'actif pour la dernière fois.	Non

Propriétés communes des actifs dans les catalogues

Outre les propriétés communes de tous les actifs, les actifs des catalogues possèdent les propriétés et les pages répertoriées dans le tableau suivant.

Propriétés communes des actifs dans les catalogues
Propriété ou page	Descriptif	Modifiable?
Page Actif	Vue du contenu de l'actif. Voir Contenu de l'actif ou aperçus.	Non
Confidentialité	Réglé sur public par défaut. Ce paramètre peut restreindre l'accès à un actif dans un catalogue lorsqu'il est défini sur privé. Seuls le propriétaire et les membres d'un actif privé peuvent voir et utiliser celui-ci.	Oui
Page Accès	Propriétaire et membres de l'actif. Par défaut, le propriétaire de l'actif est l'utilisateur qui l'a ajouté au catalogue. Les membres de l'actif peuvent afficher et utiliser l'actif lorsqu'il est marqué comme privé. Voir Contrôle de l'accès à un actif.	Oui
Page Notations	Facultatif. Les collaborateurs de catalogue peuvent évaluer et réviser les actifs.	Oui
Balises	Facultatif. Libellés de texte créés par les collaborateurs de catalogue pour simplifier la recherche. Une balise est composée d'une chaîne pouvant comporter jusqu'à 255 caractères. Elles peut contenir des espaces, des lettres, des chiffres, des traits de soulignement, des tirets et les symboles # et @.	Oui
Relations	Facultatif. Les relations qui apparaissent dans la section Articles connexes de la page Présentation de l'actif sont informatives et n'ont pas d'autres effets sur l'actif. Peut être entre des actifs dans le même espace de travail ou dans des espaces de travail différents. Par exemple, vous pouvez ajouter une relation entre un actif dans un catalogue et un actif dans un projet. Peut se trouver entre un actif et un artefact. Par exemple, vous pouvez ajouter une relation entre un actif et une stratégie. Les administrateurs peuvent créer des relations personnalisées pour les actifs. Voir Ajout de relations d'actif.	Oui
Artefacts de gouvernance	Facultatif. Termes métier et classification que les utilisateurs ont affectés à l'actif. Ces affectations peuvent affecter l'actif. Par exemple, un terme métier affecté peut déclencher l'application d'une règle de protection des données.	Oui

Vous pouvez créer des propriétés personnalisées pour les types d'actif. Les propriétés personnalisées sont affichées dans la section Détails de l'onglet Présentation de l'actif dans le catalogue. Voir Propriétés et relations personnalisées.

Pour éditer des propriétés d'actif, vous devez disposer des droits requis. Voir Edition d'actifs dans un catalogue.

Propriétés communes pour les actifs qui s'exécutent dans des outils

Certains actifs sont associés à l'exécution d'un outil. Par exemple, un actif d'expérimentation AutoAI s'exécute dans l'outil AutoAI . Les actifs qui s'exécutent dans des outils sont également appelés actifs opérationnels. Chaque fois que vous exécutez des actifs dans des outils, vous démarrez un travail. Vous pouvez surveiller les travaux et programmer leur exécution. Les travaux utilisent des ressources de calcul. Les ressources de calcul sont mesurées en unités de capacité-heures (CUH, Capacity Units-Hours). En fonction de vos plans de service, vous pouvez avoir une quantité limitée de CUH par mois ou payer la CUH que vous utilisez chaque mois.

Pour de nombreux actifs qui s'exécutent dans des outils, vous avez le choix entre la configuration de l'environnement de calcul à utiliser. Généralement, plus la configuration d'environnement est grosse, plus il y a de ressources et plus rapides sont les calculs.

Outre les propriétés de base, la plupart des actifs qui s'exécutent dans des outils contiennent les types d'informations suivants dans les projets:

Propriétés des actifs dans les projets
Propriétés	Descriptif	Modifiable?	Espaces de travail
Définition d'environnement	Modèle d'environnement, spécification matérielle et spécification logicielle pour l'exécution de l'actif. Voir Environnements.	Oui	Projets, Espaces
Paramètres	Informations qui définissent le mode d'exécution de l'actif. Spécifique à chaque type d'actif.	Oui	Projets
Actifs de données associés	Données sur lesquelles l'actif travaille.	Oui	Projets
Travaux	Informations sur l'exécution de l'actif, y compris la définition de l'environnement, la planification et les options de notification. Voir Travaux.	Oui	Projets, Espaces

Types d'actif de données et leurs propriétés

Les types d'actifs de données contiennent des métadonnées et d'autres informations sur les données, y compris la manière d'accéder aux données.

La façon de créer un actif de données dépend de l'endroit où se trouvent les données en question :

Si vos données sont dans un fichier, vous transférez (remontez) celui-ci de votre système local vers un projet, un catalogue ou un espace de déploiement.
Si vos données se trouve dans une source de données distante, vous devez d'abord créer un Actif de connexion qui définit la connexion à cette source de données. Ensuite, vous créez un actif de données en sélectionnant la connexion, le chemin ou une autre structure, ainsi que la table ou le fichier contenant les données. Ce type d'actif de données est appelé Actif de données connecté.

Pour les sources de données qui prennent en charge les requêtes SQL, vous pouvez également créer des vues dynamiques, qui sont des actifs de données de type Requête. Pour créer un tel actif, sélectionnez la connexion et fournissez une requête SQL qui extrait uniquement les données dont vous avez besoin.

Le graphique suivant montre comment les actifs de données des fichiers pointent vers les fichiers téléchargés dans Cloud Object Storage. Les actifs de données connectés requièrent un actif de connexion et pointent vers des données dans une source de données distante.

Ce graphique montre que les actifs de données des fichiers pointent vers des fichiers téléchargés et que les actifs de données connectés nécessitent un actif de connexion et pointent vers des données dans une source de données distante.

Vous pouvez créer les types d'actifs de données suivants dans un projet, un catalogue ou un espace de déploiement:

Data asset from a file Représente un fichier que vous avez téléchargé à partir de votre système local. Le fichier est stocké dans le conteneur de stockage d'objets sur l'instance IBM Cloud Object Storage associée à l'espace de travail. Le contenu du fichier peut être constitué de données structurées, de textes non structurés, d'images et d'autres types de données. Vous pouvez créer un actif de données avec un fichier de n'importe quel format. Toutefois, vous pouvez effectuer plus d'actions sur les fichiers CSV que les autres types de fichier. Voir Propriétés des actifs de données.

Vous pouvez créer un actif de données à partir d'un fichier en téléchargeant un fichier dans un espace de travail. Vous pouvez également créer des fichiers de données avec des outils et les convertir en actifs. Par exemple, vous pouvez créer des actifs de données à partir de fichiers avec Data Refinery, le bloc-notes Jupyter et les outils RStudio.
Actif de données connecté Représente une table, un fichier ou un dossier accessible via une connexion à une source de données distante. La connexion est définie dans l'actif de connexion associé à l'actif de données connecté. Vous pouvez créer un actif de données connecté pour chaque connexion prise en charge. Lorsque vous accédez à un actif de données connecté, les données sont extraites dynamiquement de la source de données. Voir Propriétés des actifs de données.

Vous pouvez importer des actifs de données connectés à partir d'une source de données à l'aide de l'outil de données connectées dans un espace de travail. Si vous souhaitez importer des ensembles d'actifs de données connectés, par exemple un schéma de base de données complet, utilisez l'outil d'importation de métadonnées dans les projets. Vous pouvez créer des tables virtuelles qui compilent des données à partir de plusieurs sources de données avec Watson Query dans l'espace de travail Data virtualization .

Dans les projets, vous pouvez créer des vues dynamiques contenant des données filtrées provenant d'une ou de plusieurs tables d'une source de données à l'aide de l'outil d'accès aux données de requête.
Folder asset Représente un dossier dans IBM Cloud Object Storage. Un actif de données de dossier est un cas particulier d'un actif de données connecté. Vous le créez en spécifiant le chemin menant au dossier et l'actif de connexion IBM Cloud Object Storage. Vous pouvez voir les fichiers et les sous-dossiers qui partagent le chemin avec l'actif de données de dossier. Les fichiers que vous pouvez voir dans l'actif de données de dossier ne sont pas eux-mêmes des actifs de données. Par exemple, vous pouvez créer un actif de données de dossier pour un chemin contenant des flux d'actualités sans cesse mis à jour. Voir Propriétés des actifs de données.

Vous pouvez importer des actifs de dossier depuis IBM Cloud Object Storage à l'aide de l'outil de données connecté dans un espace de travail.
Actif de connexion Contient les informations nécessaires à la création d'une connexion à une source de données. Voir Propriétés des actifs de connexion.

Vous pouvez créer des connexions à l'aide de l'outil de connexion dans un espace de travail.

En savoir plus sur la création et l'importation d'actifs de données:

Propriétés des actifs de données à partir de fichiers et d'actifs de données connectés

Outre les propriétés de base et les propriétés de catalogue communes, les actifs de données des fichiers et les actifs de données connectés possèdent les propriétés ou les pages répertoriées dans le tableau ci-dessous.

Propriétés des actifs de données à partir de fichiers et d'actifs de données connectés
Propriété ou page	Descriptif	Modifiable?	Espaces de travail
Colonnes	Récapitulatif des propriétés des colonnes de l'actif de données. Inclut le score de qualité, la description, les classes de données affectées et les termes métier affectés pour chaque colonne. Les classes de données et les termes métier affectés peuvent affecter l'actif. Par exemple, un terme métier affecté peut déclencher l'application d'une règle de protection des données. Informations de clé primaire et de relation de clé: Une colonne définie comme clé primaire est identifiée par une icône de clé (. Une clé primaire est également affichée dans le panneau latéral de l'actif. S'il existe des relations de clé pour l'actif, vous pouvez cliquer sur le lien Afficher les relations de clé . Dans l'onglet Parent de , vous voyez toutes les relations de la clé primaire. Dans l'onglet Enfant de , vous voyez toutes les relations pour lesquelles l'actif contient une clé externe.	Non	Catalogues
Balises	Facultatif. Libellés que les utilisateurs créent pour simplifier la recherche. Une balise est composée d'une chaîne pouvant comporter jusqu'à 255 caractères. Elles peut contenir des espaces, des lettres, des chiffres, des traits de soulignement, des tirets et les symboles # et @.	Oui	Projets, catalogues
Format	Type MIME d'un fichier. Détecté automatiquement.	Oui	Projets, catalogues, espaces
Détails de l'actif	Informations sur la taille des données, le nombre de colonnes et de lignes et la version de l'actif. Dans les projets, le type de table des données relationnelles est également affiché.	Non	Projets, catalogues, espaces
Rechercher	Informations sur le fichier de données dans le stockage ou sur la source de données et la connexion.	Non	Catalogues, espaces
Requête	Requête SQL qui génère l'actif. Vues dynamiques uniquement.	Oui	Projets
Informations de connexion	Pour les actifs de données connectés, le chemin, le nom de connexion, le type de connecteur et le propriétaire de connexion. Pour les vues dynamiques, seuls le nom de connexion et le type de connecteur sont affichés.	Non	Projets
Sous-fenêtre Activités	Historique des actions effectuées sur l'actif dans tous les espaces de travail. Voir Activités.	Non	Projets, catalogues
Page Aperçu de l'actif ou Actif	Un aperçu des données qui inclut un ensemble limité de colonnes et de lignes de la source de données d'origine. Voir Contenu de l'actif ou aperçus.	Non	Projets, catalogues, espaces
Page Profil	Métadonnées et statistiques sur le contenu des données. Voir Profil.	Oui	Projets, catalogues
Page Qualité des données	Informations sur la qualité des données d'un actif et de ses colonnes, ainsi que sur les contrôles de qualité des données appliqués. Voir Qualité des données.	Oui ^{[ 1 ]}	Projets, catalogues
Page Visualisations	Diagrammes et graphiques créés par les utilisateurs pour comprendre les données. Voir Visualisations.	Oui	Projets
Page Groupe de fonctions	Informations sur les colonnes de l'actif de données qui sont utilisées en tant que fonctions dans les modèles. Voir Gestion des groupes de fonctions.	Oui	Projets, catalogues, espaces

Propriétés des actifs de connexion

Les propriétés des actifs de connexion dépendent de la source de données que vous sélectionnez lorsque vous créez une connexion. Voir Types de connexion. Les actifs de connexion de la plupart des sources de données possèdent les propriétés répertoriées dans le tableau ci-dessous.

Propriétés des actifs de connexion
Propriétés	Descriptif	Modifiable?	Espaces de travail
Informations de connexion	Informations qui identifient la source de données. Par exemple, le nom de la base de données, le nom d'hôte, l'adresse IP, le port, l'ID d'instance, le compartiment, l'URL de noeud final, etc.	Oui	Projets, catalogues, espaces
Paramétrage des données d'identification	Indique si les données d'identification sont partagées sur la plateforme (par défaut) ou si chaque utilisateur doit entrer ses données d'identification personnelles. Toutes les sources de données ne prennent pas en charge les données d'identification personnelles.	Oui	Projets, catalogues, espaces
Méthode d'authentification	Format des données d'identification. Par exemple, une clé d'API ou un nom d'utilisateur et un mot de passe.	Oui	Projets, catalogues, espaces
Données d'identification	Nom d'utilisateur et mot de passe, clé d'API ou autres données d'identification, comme requis par la source de données et la méthode d'authentification spécifiée.	Oui	Projets, catalogues, espaces
Certificats	Indique si le port de la source de données est configuré pour accepter les connexions SSL et d'autres informations sur le certificat SSL.	Oui	Projets, catalogues, espaces
Connectivité privée	Méthode de connexion à une base de données qui n'est pas externalisée sur Internet. Voir Connexion à des données derrière un pare-feu.	Oui	Projets, catalogues, espaces
Emplacement et souveraineté	Emplacement physique du centre de données dans lequel les données sont stockées et entité souveraine ayant juridiction sur les données.	Oui	Projets, catalogues, espaces

En savoir plus

Rubrique parent: Présentation d' IBM Cloud Pak for Data as a Service

Projets uniquement ↩︎