0 / 0
Retourner à la version anglaise de la documentation
Profils des actifs de données

Profils des actifs de données

Un profil d'actif inclut des informations et des statistiques générées sur le contenu de l'actif. Vous pouvez voir le profil sur la page Profil d'un actif.

Exigences et restrictions

Vous pouvez afficher le profil des actifs dans les circonstances suivantes.

Autorisations requises

Pour afficher la page Profil d'un actif de données, vous pouvez avoir n'importe quel rôle dans un projet.

Pour créer ou mettre à jour un profil, vous devez disposer du rôle Admin ou Editeur dans le projet.

Espaces de travail

Vous pouvez afficher le profil d'actif dans les projets.

Types d'actif

Ces types d'actifs ont un profil:

  • Actifs de données provenant de bases de données relationnelles ou non relationnelles à partir d'une connexion aux sources de données, à l'exception de Cloudant

  • Actifs de données à partir de fichiers partitionnés, dans lesquels un fichier partitionné est constitué de plusieurs fichiers et est représenté par un dossier unique téléchargé à partir du système de fichiers local ou à partir de connexions basées sur des fichiers aux sources de données

  • Les ressources de données des fichiers téléchargés à partir du système de fichiers local ou à partir de connexions basées sur des fichiers vers les sources de données, avec ces formats :

    • format CSV
    • XLS, XLSM, XLSX (Seule la première feuille d'un classeur est profilée.)
    • TSV
    • Avro
    • Parquet

    Toutefois, les fichiers de données structurées ne sont pas profilés lorsque les actifs de données n'y font pas explicitement référence, comme dans les cas suivants :

    • Les fichiers se trouvent dans un actif de dossier connecté. Les fichiers accessibles à partir d'un actif de dossier connecté ne sont pas traités comme des actifs et ne sont pas profilés.
    • Les fichiers se trouvent dans un fichier archive. Le fichier archive est référencé par l'actif de données et les fichiers compressés ne sont pas profilés.

Création d'un profil

Dans les projets, vous pouvez créer un profil pour un actif de données en cliquant sur Créer un profil. Vous pouvez mettre à jour un profil existant lorsque les données sont modifiées.

Résultats du profilage

Lorsque vous créez ou mettez à jour un profil d'actif, les colonnes de l'actif de données sont analysées. Par défaut, le profil est créé en fonction des 5000 premières lignes de données. Si l'actif de données comporte plus de 250 colonnes, le profil est créé en fonction des 1 000 premières lignes de données.

Le profil d'un actif de données affiche des informations sur chaque colonne du jeu de données:

  • Date de création ou de dernière mise à jour du profil.
  • Nombre de colonnes et de lignes analysées.
  • Les types de données pour les colonnes et la distribution des types de données.
  • Les formats de données pour les colonnes et la distribution des formats.
  • Pourcentage de correspondance, de non-concordance ou de données manquantes pour chaque colonne.
  • La distribution de fréquences pour toutes les valeurs identifiées dans une colonne.
  • Statistiques sur les données de chaque colonne:
    • Le nombre de valeurs distinctes indique le nombre de valeurs différentes existant dans les données échantillonnées pour la colonne.
    • Le pourcentage de valeurs uniques indique le pourcentage de valeurs distinctes qui apparaissent une seule fois dans la colonne.
    • Minimum, maximum ou moyenne, et parfois l'écart type dans cette colonne. En fonction du format de données d'une colonne, les statistiques varient légèrement. Par exemple, les statistiques d'une colonne de type entier de données ont des valeurs minimale, maximale et moyenne et une valeur d'écart type, tandis que les statistiques d'une colonne de type chaîne de données ont des valeurs de longueur minimale, maximale et moyenne.

Rubrique parent: Types d'actif et propriétés

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus