0 / 0
Retourner à la version anglaise de la documentation
Types et propriétés des actifs
Types et propriétés des actifs

Types et propriétés des actifs

Un Actif est un élément qui contient des métadonnées relatives aux données, à d'autres types d'informations ou au code opérationnel. Vous travaillez avec des actifs partout dans la plateforme Cloud Pak for Data, y compris dans les espaces de travail principaux : projets, catalogues et espaces de déploiement.

Pour comprendre ce que sont les actifs, vous devez connaître leurs différents types, leurs propriétés et où il se trouvent :

Espaces de travail pour les actifs

Vous pouvez trouver n'importe quel actif dans l'un des espaces de travail dont vous êtes un collaborateur en le recherchant dans la barre de recherche globale. Consultez Recherche d'actifs dans l'ensemble de la plateforme.

Ce que vous pouvez faire avec les actifs dépend de leur type et du type d'espace de travail.

Projets Lorsque vous collaborez avec d'autres pour travailler avec des données. Par exemple, dans les projets, vous pouvez préparer les données, les analyser ou créer des modèles. Vous pouvez créer tous les types d'actifs dans les projets et vous pouvez exécuter des actifs opérationnels. Consultez Projets.

Catalogues Lorsque vous stockez des actifs à partager avec votre organisation. Vous pouvez copier des actifs de catalogues dans des projets pour les utiliser dans votre travail ou publier des actifs de projets dans le catalogue. Vous pouvez publier tous les types d'actifs de données et certains types d'actifs opérationnels dans un catalogue. Vous pouvez éditer des métadonnées d'actif dans un catalogue, mais vous ne pouvez pas exécuter d'actifs opérationnels. Consultez Catalogues.

Espaces de déploiement Lorsque vous déployez des modèles ou d'autres actifs dans la production. Vous copiez des actifs déployables de projets dans les espaces de déploiement, puis vous créez des déploiements à partir de ces actifs. Consultez Espaces de déploiement.

Virtualisation des données Lorsque vous créez des tables virtuelles en combinant ou segmentant une ou plusieurs tables. Vous publiez des tables virtuelles sous forme d'actifs de données dans un catalogue. Voir Virtualisation des données.

Actifs de données

Les actifs de données contiennent des métadonnées sur les données, y compris le mode d'accès aux données.

La façon de créer un actif de données dépend de l'endroit où se trouvent les données en question :

  • Si vos données sont dans un fichier, vous transférez (remontez) celui-ci de votre système local vers un projet, un catalogue ou un espace de déploiement.
  • Si vos données se trouve dans une source de données distante, vous devez d'abord créer un Actif de connexion qui définit la connexion à cette source de données. Vous créez ensuite un actif de données en sélectionnant la connexion, le chemin ou toute autre structure, ainsi que la table ou le fichier qui contient les données. Ce type d'actif de données est appelé Actif de données connecté.

Types d'actifs de données

L'actif de données d'un fichier Un actif de données d'un fichier pointe vers un fichier que vous avez téléchargé à partir de votre système local. Le fichier est stocké dans le conteneur de stockage d'objets de l'instance IBM Cloud Object Storage associée au projet, au catalogue ou à l'espace de déploiement. Le contenu du fichier peut être constitué de données structurées, de textes non structurés, d'images et d'autres types de données. Vous pouvez créer un actif de données avec un fichier de n'importe quel format. Les fichiers CSV se prêtent cependant à davantage d'actions que d'autres types de fichiers.

Actif de données connecté Un actif de données connecté pointe vers une table, un fichier ou un dossier accessible via une connexion à une source de données distante. La connexion est définie dans l'actif de connexion associé à l'actif de données connecté. Lorsque vous accédez à un actif de données connecté, les données sont extraites dynamiquement de la source de données.

Un Actif de données de dossier est un cas particulier d'un actif de données connecté. Il pointe sur un dossier dans IBM Cloud Object Storage. Vous le créez en spécifiant le chemin menant au dossier et l'actif de connexion IBM Cloud Object Storage. Vous pouvez voir les fichiers et les sous-dossiers qui partagent le chemin avec l'actif de données de dossier. Les fichiers que vous pouvez voir dans l'actif de données de dossier ne sont pas eux-mêmes des actifs de données. Par exemple, vous pouvez créer un actif de données de dossier pour un chemin contenant des flux d'actualités sans cesse mis à jour.

Actif de connexion Un actif de connexion est considéré comme un type d'actif de données. Il contient les informations nécessaires à la création d'une connexion à une source de données. Vous pouvez soit fournir un jeu de données d'identification commun à tous les utilisateurs qui ont accès à l'actif de connexion à utiliser, soit spécifier que chaque utilisateur devra entrer ses propres identifiants au moment d'utiliser la connexion. Les projets et les catalogues prennent en charge de nombreux types de connexion aux sources de données IBM et tierces.

Voir Ajout de données à un projet, Ajout d'actifs à un catalogueet Ajout d'actifs de données à un espace de déploiement.

Actifs opérationnels

Les actifs opérationnels déterminent la façon de travailler sur les données des projets à l'aide d'outils qui préparent et analysent les données ou génèrent des modèles. Vous créez des actifs opérationnels avec les outils dans les projets. Par exemple, un bloc-notes (notebook) Jupyter est un actif opérationnel que vous pouvez créer avec l'outil éditeur de bloc-notes pour analyser les données.

Exécution d'actifs opérationnels

Lorsque vous exécutez des actifs opérationnels, vous utilisez des ressources de calcul. Les ressources de calcul sont mesurées en unités de capacité-heures (CUH, Capacity Units-Hours). En fonction des plans de vos services, vous pouvez avoir une quantité limitée de CUH par mois, ou payer des frais supplémentaires si vous dépassez un nombre fixe de CUH par mois.

Pour de nombreux actifs opérationnels, vous avez le choix de la configuration d'environnement de calcul à utiliser. Généralement, plus la configuration d'environnement est grosse, plus il y a de ressources et plus rapides sont les calculs. Consultez Environnements.

Chaque fois que vous exécutez un actif opérationnel, il est considéré comme un travail. Vous pouvez surveiller les travaux et programmer leur exécution. Voir Travaux.

Types d'actifs opérationnels

Nombre d'actifs opérationnels sont fournis par les services de base. Certains ne sont en revanche fournis que par d'autres services.

Vous pouvez créer ces types d'actifs opérationnels sans services supplémentaires:

  • Des flux Data Refinery, pour affiner des données avec l'outil Data Refinery.
  • Des blocs-notes Jupyter, pour analyser des données ou générer des modèles. Utilisez l'éditeur de bloc-notes Jupyter.
  • Des flux de modélisateur, qui permettent d'automatiser le flux de données via un modèle avec des algorithmes SPSS dans SPSS Modeler.
  • Des modèles Decision Optimization, qui permettent de résoudre des scénarios dans le générateur de modèle Decision Optimization.
  • Des expérimentations AutoAI, qui permettent de générer un modèle sans effectuer de codage dans l'outil AutoAI.

  • Des importations de métadonnées pour importer des métadonnées d'actif dans un projet ou un catalogue.

  • Enrichissements des métadonnées pour enrichir les actifs de données d'un projet avec des résultats de profilage et d'analyse de la qualité des données et avec des termes métier.

Ces actifs opérationnels requièrent d'autres services. Vous pouvez les provisionner au moment où vous créez le premier actif qui les requiert :

  • Des flux DataStage pour créer des travaux de transformation de données à l'aide de l'outil DataStage. Nécessite le service DataStage.
  • Des tableaux de bord, qui permettent de visualiser des données sans code dans l'éditeur de tableau de bord. Le service Cognos Dashboards est requis.

Si vous disposez du service Watson Knowledge Catalog sans Watson Studio, vous pouvez créer des flux Data Refinery , des actifs d'importation de métadonnées et des actifs d'enrichissement de métadonnées.

Actifs de configuration

Les actifs de configuration sont des modèles réutilisables dans des projets pour configurer d'autres actifs ou travaux.

Avec le service DataStage, vous pouvez créer ces types d'actifs de configuration :

  • Sous-flux DataStage pour collecter un ensemble d'étapes et de connecteurs à réutiliser dans les flux DataStage.
  • Définitions de données pour spécifier les métadonnées de colonne d'un actif de données à réutiliser dans les travaux de flux DataStage.
  • Ensembles de paramètres pour collecter plusieurs paramètres de travail avec des valeurs spécifiées à réutiliser dans les travaux.

Propriétés, métadonnées et relations des actifs

Tous les actifs ont en commun des métadonnées visibles partout. Ils ont également des propriétés spécifiques, c'est-à-dire qui varient d'un type d'actif à un autre et selon l'endroit où se trouve l'actif.

Propriétés communes

Tous les actifs ont des propriétés communes qui sont visibles et éditables dans les projets, les catalogues et les espaces de déploiement.

Nom peut contenir jusqu'à 100 caractères. Les caractères multi-octets sont acceptés. Ne peut pas être vide ni contenir des caractères de contrôle Unicode ou seulement des espaces. Les noms d'actif n'ont pas besoin d'être uniques dans un projet ou un espace de déploiement. La question de savoir si les noms d'actifs doivent être uniques dans un catalogue dépend de la méthode de gestion des doublons définie pour le catalogue.

Description Facultatif. Peut contenir jusqu'à 245 caractères, espaces non compris. Les caractères multi-octets et les hyperliens sont acceptés.

Les métadonnées générées ou détectées automatiquement peuvent inclure d'autres informations, selon le type d'actif, telles que la date d'ajout, la taille, l'auteur de la création, le dernier éditeur, la date de la dernière modification, la programmation, le partage, la langue, le type de modèle et l'état.

Certains types d'actif peuvent comporter des balises, qui sont des métadonnées non gouvernées qui facilitent la recherche de l'actif. Les étiquettes ne peuvent contenir que des espaces, des lettres, des caractères multi-octets, des chiffres, des traits de soulignement, des tirets et les symboles # et @. Les collaborateurs de projet, de catalogue ou d'espace de déploiement avec le rôle Administrateur ou Editeur peuvent créer des étiquettes et les ajouter à des actifs.

Plus d'informations sur les actifs

Les actifs peuvent avoir plus de propriétés, de relations et de métadonnées.

La confidentialité des actifs défini sur public par défaut. Ce paramètre peut restreindre l'accès à un actif dans un catalogue lorsqu'il est défini sur privé. Seuls le propriétaire et les membres d'un actif privé peuvent voir et utiliser celui-ci.

Propriétaire de l'actif et membres de l'actif Par défaut, le propriétaire de l'actif est l'utilisateur qui a ajouté l'actif au catalogue. Les membres de l'actif peuvent afficher et utiliser l'actif lorsqu'il est marqué comme privé.

Artefacts de gouvernance peut être affecté automatiquement, par le propriétaire de l'actif ou par les responsables de données. Les artefacts de gouvernance peuvent ajouter des métadonnées et des relations aux actifs. Ils peuvent aussi masquer les données sensibles dans les actifs de données. En général, ces informations sont disponibles dans les catalogues. Pour certains types d'actif, ces informations sont également disponibles dans les projets.

Attributs personnalisés Facultatif. Les attributs personnalisés sont affichés dans la section Détails de l'onglet Présentation de l'actif dans le catalogue. A l'aide des API, vous pouvez créer des attributs personnalisés pour les actifs.

Aperçu de l'actif Un aperçu d'un actif. Le contenu que vous voyez dans un aperçu dépend du type d'actif, de fichier ou de données.

Examens et évaluations Tous les collaborateurs de catalogue peuvent évaluer et réviser les actifs.

Autres informations pour les actifs de données

Selon le format des données dans les actifs de données, vous pouvez voir davantage d'informations lorsque vous ouvrez ceux-ci.

Chemin d'accès aux données Informations nécessaires pour accéder aux données. Un actif de données connecté, pointant sur une table d'une base de données, comporte une référence à l'actif de connexion pour cette base de données, le schéma ou d'autres informations de chemin, ainsi que le nom de la table proprement dite. Un actif de données pointant sur un fichier remonté comporte une référence à l'emplacement de ce fichier dans le conteneur de stockage d'objets utilisé pour le projet, le catalogue ou l'espace de déploiement.

Format de fichier Type MIME d'un fichier. Détecté automatiquement.

Profil de données Profil des données, pour les données provenant de sources de données relationnelles ainsi que pour les fichiers CSV, TSV, Avro, Parquet, Microsoft Word, Microsoft Excel (uniquement la première feuille d'un classeur), PDF, texte et HTML.

Activités L'historique de activités exécuté sur l'actif dans les projets et les catalogues. La possibilité d'afficher les activités dépend de votre Plan d'offre Watson Knowledge Catalog.

En savoir plus

Rubrique parent: Présentation d' IBM Cloud Pak for Data as a Service