La plateforme fournit des espaces de travail et des outils collaboratifs, et vous fournissez le contenu à la plateforme, sous la forme d'actifs. Un actif est un élément qui contient des informations sur les données, d'autres informations utiles ou du code qui fonctionne avec les données.
Vous ajoutez des actifs en les important ou en les créant à l'aide d'outils. Vous travaillez avec des actifs dans des espaces de travail collaboratifs. L'espace de travail que vous utilisez dépend de vos tâches.
Projets Lorsque vous collaborez avec d'autres personnes pour utiliser des données et créer des actifs. La plupart des outils se trouvent dans des projets et vous exécutez des actifs qui contiennent du code dans des projets. Par exemple, vous pouvez importer des données, préparer des données, analyser des données ou créer des modèles dans des projets. Consultez Projets.
Catalogues Emplacement où vous stockez les ressources à partager avec votre organisation ou accédez à la recherche des ressources avec lesquelles vous devez travailler. Vous pouvez copier des actifs à partir de catalogues dans des projets ou publier des actifs à partir de projets dans le catalogue. Vous pouvez éditer des propriétés d'actif et des métadonnées dans un catalogue, mais vous ne pouvez pas exécuter d'actifs. Consultez Catalogues.
Espaces de déploiement Lorsque vous déployez et exécutez des actifs prêts pour le test ou la production. Vous déplacez des actifs de projets vers des espaces de déploiement, puis vous créez des déploiements à partir de ces actifs. Vous surveillez et mettez à jour les déploiements si nécessaire. Consultez Espaces de déploiement.
Vous pouvez trouver n'importe quel actif dans l'un des espaces de travail dont vous êtes un collaborateur en le
recherchant dans la barre de recherche globale. Consultez Recherche d'actifs dans l'ensemble de la plateforme.
Vous pouvez créer de nombreux types d'actifs différents.
Pour créer la plupart des types d'actifs, vous devez utiliser un outil spécifique. La plupart des outils sont fournis par un ou plusieurs services. Les outils permettant de créer des actifs de données et des actifs de connexion sont fournis par la plateforme et ne nécessitent pas de services spécifiques.
Pour voir les services dont vous avez besoin pour quels outils, ouvrez la carte des outils et des services.
Le tableau suivant répertorie les types d'actifs que vous pouvez créer, les outils dont vous avez besoin pour les créer et les espaces de travail dans lesquels vous pouvez les ajouter.
Les actifs accumulent des informations dans les propriétés lorsque vous les créez, les utilisez ou lorsqu'ils sont mis à jour par des processus automatisés. Certaines propriétés sont fournies par les utilisateurs et peuvent être éditées par les utilisateurs. D'autres propriétés sont automatiquement fournies par le système. La plupart des propriétés fournies par le système ne peuvent pas être éditées par les utilisateurs.
La zone Dernière modification d'un actif permet de suivre à la fois les actions utilisateur et les actions système. Les actions système se produisent souvent en arrière-plan et peuvent impliquer uniquement des modifications des métadonnées internes de l'actif.
Propriétés communes pour les actifs partout
Copy link to section
La plupart des types d'actifs possèdent les propriétés répertoriées dans le tableau suivant dans tous les espaces de travail où ces types d'actifs existent.
Propriétés communes pour les actifs
Propriété
Descriptif
Modifiable?
Nom
Nom de l'actif. Peut contenir jusqu'à 255 caractères. Les caractères multi-octets sont acceptés. Ne peut pas être vide ni contenir des caractères de contrôle Unicode ou seulement des espaces. Les noms d'actif n'ont pas besoin d'être uniques dans un projet ou un espace de déploiement. La question de savoir si les noms d'actifs doivent être uniques dans un catalogue dépend de la méthode de gestion des doublons définie pour le catalogue.
Oui
Descriptif
Facultatif. Les caractères multi-octets et les hyperliens sont acceptés.
Oui
Date de création
Horodatage de la création ou de l'importation de l'actif.
Non
Créateur ou propriétaire
Nom d'utilisateur ou adresse électronique de la personne qui a créé ou importé l'actif.
Non
Date de dernière modification
Horodatage de la dernière modification de l'actif.
Non
Dernier éditeur
Nom d'utilisateur ou adresse électronique de la personne qui a modifié l'actif pour la dernière fois.
Non
Propriétés communes des actifs dans les catalogues
Copy link to section
Outre les propriétés communes de tous les actifs, les actifs des catalogues possèdent les propriétés et les pages répertoriées dans le tableau suivant.
Propriétés communes des actifs dans les catalogues
Réglé sur public par défaut. Ce paramètre peut restreindre l'accès à un actif dans un catalogue lorsqu'il est défini sur privé. Seuls le propriétaire et les membres d'un actif privé peuvent voir et utiliser celui-ci.
Oui
Page Accès
Propriétaire et membres de l'actif. Par défaut, le propriétaire de l'actif est l'utilisateur qui l'a ajouté au catalogue. Les membres de l'actif peuvent afficher et utiliser l'actif lorsqu'il est marqué comme privé. Voir Contrôle de l'accès à un actif.
Oui
Page Notations
Facultatif. Les collaborateurs de catalogue peuvent évaluer et réviser les actifs.
Oui
Balises
Facultatif. Libellés de texte créés par les collaborateurs de catalogue pour simplifier la recherche. Une balise est composée d'une chaîne pouvant comporter jusqu'à 255 caractères. Elles peut contenir des espaces, des lettres, des chiffres, des traits de soulignement, des tirets et les symboles # et @.
Oui
Relations
Facultatif. Les relations qui apparaissent dans la section Articles connexes de la page Présentation de l'actif sont informatives et n'ont pas d'autres effets sur l'actif. Peut être entre des actifs dans le même espace de travail ou dans des espaces de travail différents. Par exemple, vous pouvez ajouter une relation entre un actif dans un catalogue et un actif dans un projet. Peut se trouver entre un actif et un artefact. Par exemple, vous pouvez ajouter une relation entre un actif et une stratégie. Les administrateurs peuvent créer des relations personnalisées pour les actifs. Voir Ajout de relations d'actif.
Oui
Artefacts de gouvernance
Facultatif. Termes métier et classification que les utilisateurs ont affectés à l'actif. Ces affectations peuvent affecter l'actif. Par exemple, un terme métier affecté peut déclencher l'application d'une règle de protection des données.
Oui
Vous pouvez créer des propriétés personnalisées pour les types d'actif. Les propriétés personnalisées sont affichées dans la section Détails de l'onglet Présentation de l'actif dans le catalogue. Voir Propriétés et relations personnalisées.
Propriétés communes pour les actifs qui s'exécutent dans des outils
Copy link to section
Certains actifs sont associés à l'exécution d'un outil. Par exemple, un actif d'expérimentation AutoAI s'exécute dans l'outil AutoAI . Les actifs qui s'exécutent dans des outils sont également appelés actifs opérationnels. Chaque fois que vous exécutez des actifs dans des outils, vous démarrez un travail. Vous pouvez surveiller les travaux et programmer leur exécution. Les travaux utilisent des ressources de calcul. Les ressources de calcul sont mesurées en unités de capacité-heures (CUH, Capacity Units-Hours). En fonction de vos plans de service, vous pouvez avoir une quantité limitée de CUH par mois ou payer la CUH que vous utilisez chaque mois.
Pour de nombreux actifs qui s'exécutent dans des outils, vous avez le choix entre la configuration de l'environnement de calcul à utiliser. Généralement, plus la configuration d'environnement est grosse, plus il y a de ressources et plus rapides sont les calculs.
Outre les propriétés de base, la plupart des actifs qui s'exécutent dans des outils contiennent les types d'informations suivants dans les projets:
Propriétés des actifs dans les projets
Propriétés
Descriptif
Modifiable?
Espaces de travail
Définition d'environnement
Modèle d'environnement, spécification matérielle et spécification logicielle pour l'exécution de l'actif. Voir Environnements.
Oui
Projets, Espaces
Paramètres
Informations qui définissent le mode d'exécution de l'actif. Spécifique à chaque type d'actif.
Oui
Projets
Actifs de données associés
Données sur lesquelles l'actif travaille.
Oui
Projets
Travaux
Informations sur l'exécution de l'actif, y compris la définition de l'environnement, la planification et les options de notification. Voir Travaux.
Oui
Projets, Espaces
Types d'actif de données et leurs propriétés
Copy link to section
Les types d'actifs de données contiennent des métadonnées et d'autres informations sur les données, y compris la manière d'accéder aux données.
La façon de créer un actif de données dépend de l'endroit où se trouvent les données en question :
Si vos données sont dans un fichier, vous transférez (remontez) celui-ci de votre système local vers un projet, un catalogue ou un espace de déploiement.
Si vos données se trouve dans une source de données distante, vous devez d'abord créer un Actif de connexion qui définit la connexion à cette source de données. Ensuite, vous créez un actif de données en sélectionnant la connexion, le chemin ou une autre structure, ainsi que la table ou le fichier contenant les données. Ce type d'actif de données est appelé Actif de données connecté.
Pour les sources de données qui prennent en charge les requêtes SQL, vous pouvez également créer des vues dynamiques, qui sont des actifs de données de type Requête. Pour créer un tel actif, sélectionnez la connexion et fournissez une requête SQL qui extrait uniquement les données dont vous avez besoin.
Le graphique suivant montre comment les actifs de données des fichiers pointent vers les fichiers téléchargés dans Cloud Object Storage. Les actifs de données connectés requièrent un actif de connexion et pointent vers des données dans une source de données distante.
Vous pouvez créer les types d'actifs de données suivants dans un projet, un catalogue ou un espace de déploiement:
Data asset from a file Représente un fichier que vous avez téléchargé à partir de votre système local. Le fichier est stocké dans le conteneur de stockage d'objets sur l'instance IBM Cloud Object Storage associée à l'espace de travail. Le contenu du fichier peut être constitué de données structurées, de textes non structurés, d'images et d'autres
types de données. Vous pouvez créer un actif de données avec un fichier de n'importe quel format. Toutefois, vous pouvez effectuer plus d'actions sur les fichiers CSV que les autres types de fichier. Voir Propriétés des actifs de données.
Vous pouvez créer un actif de données à partir d'un fichier en téléchargeant un fichier dans un espace de travail. Vous pouvez également créer des fichiers de données avec des outils et les convertir en actifs. Par exemple, vous pouvez créer des ressources de données à partir de fichiers à l'aide des outils Data Refinery, Jupyter notebook et RStudio.
Actif de données connecté Représente une table, un fichier ou un dossier accessible via une connexion à une source de données distante. La connexion est définie dans l'actif de connexion associé à l'actif de données connecté. Vous pouvez créer un actif de données connecté pour chaque connexion prise en charge. Lorsque vous accédez à un actif de données connecté, les données sont extraites dynamiquement de la source de données. Voir Propriétés des actifs de données.
Vous pouvez importer des actifs de données connectés à partir d'une source de données à l'aide de l'outil de données connectées dans un espace de travail. Si vous souhaitez importer des ensembles d'actifs de données connectés, par exemple un schéma de base de données complet, utilisez l'outil d'importation de métadonnées dans les projets. Vous pouvez créer des tables virtuelles qui compilent des données à partir de plusieurs sources de données avec Data Virtualization dans l'espace de travail Data virtualization .
Dans les projets, vous pouvez créer des vues dynamiques contenant des données filtrées provenant d'une ou de plusieurs tables d'une source de données à l'aide de l'outil d'accès aux données de requête.
Attribut de dossier Représente un dossier dans IBM Cloud Object Storage. Un actif de données de dossier est un cas particulier d'un actif de données connecté. Vous le créez en spécifiant le chemin menant au dossier et l'actif de connexion IBM Cloud Object Storage. Vous pouvez voir les fichiers et les sous-dossiers qui partagent le chemin avec l'actif de données de dossier. Les fichiers que vous pouvez voir dans l'actif de données de dossier ne sont pas eux-mêmes des actifs de données. Par exemple, vous pouvez créer un actif de données de dossier pour un chemin contenant des flux d'actualités sans cesse mis à jour. Voir Propriétés des actifs de données.
Vous pouvez importer des actifs de dossiers depuis IBM Cloud Object Storage avec l'outil de données connectées dans un espace de travail.
Actif de connexion Contient les informations nécessaires à la création d'une connexion à une source de données. Voir Propriétés des actifs de connexion.
Vous pouvez créer des connexions à l'aide de l'outil de connexion dans un espace de travail.
En savoir plus sur la création et l'importation d'actifs de données:
Propriétés des actifs de données à partir de fichiers et d'actifs de données connectés
Copy link to section
Outre les propriétés de base et les propriétés de catalogue communes, les actifs de données des fichiers et les actifs de données connectés possèdent les propriétés ou les pages répertoriées dans le tableau ci-dessous.
Propriétés des actifs de données à partir de fichiers et d'actifs de données connectés
Propriété ou page
Descriptif
Modifiable?
Espaces de travail
Colonnes
Récapitulatif des propriétés des colonnes de l'actif de données. Inclut le score de qualité, la description, les classes de données affectées et les termes métier affectés pour chaque colonne. Les classes de données et les termes métier affectés peuvent affecter l'actif. Par exemple, un terme commercial attribué peut déclencher l'application d'une règle de protection des données.
Informations sur la clé primaire et la relation de clé : - Une colonne définie comme clé primaire est identifiée par une icône de clé (. Une clé primaire est également affichée dans le panneau latéral de l'actif. - S'il existe des relations de clé pour l'actif, vous pouvez cliquer sur le lien Afficher les relations de clé . Dans l'onglet Parent de , vous voyez toutes les relations de la clé primaire. Dans l'onglet Enfant de , vous voyez toutes les relations pour lesquelles l'actif contient une clé externe.
Non
Catalogues
Balises
Facultatif. Libellés que les utilisateurs créent pour simplifier la recherche. Une balise est composée d'une chaîne pouvant comporter jusqu'à 255 caractères. Elles peut contenir des espaces, des lettres, des chiffres, des traits de soulignement, des tirets et les symboles # et @.
Oui
Projets, catalogues
Format
Type MIME d'un fichier. Détecté automatiquement.
Oui
Projets, catalogues, espaces
Détails de l'actif
Informations sur la taille des données, le nombre de colonnes et de lignes et la version de l'actif. Dans les projets, le type de table des données relationnelles est également affiché.
Non
Projets, catalogues, espaces
Rechercher
Informations sur le fichier de données dans le stockage ou sur la source de données et la connexion.
Non
Catalogues, espaces
Requête
Requête SQL qui génère l'actif. Vues dynamiques uniquement.
Oui
Projets
Informations de connexion
Pour les actifs de données connectés, le chemin, le nom de connexion, le type de connecteur et le propriétaire de connexion. Pour les vues dynamiques, seuls le nom de connexion et le type de connecteur sont affichés.
Non
Projets
Sous-fenêtre Activités
Historique des actions effectuées sur l'actif dans tous les espaces de travail. Voir Activités.
Non
Projets, catalogues
Page Aperçu de l'actif ou Actif
Un aperçu des données qui inclut un ensemble limité de colonnes et de lignes de la source de données d'origine. Voir Contenu de l'actif ou aperçus.
Non
Projets, catalogues, espaces
Page Profil
Métadonnées et statistiques sur le contenu des données. Par exemple, lorsqu'un bien enrichi est publié dans un catalogue, les métadonnées étendues sont également publiées, et le nom d'affichage et la description, qui peut être une version générée par l'IA ou une version modifiée, s'affichent sur cette page. Ces informations figurent également sur la page Overview. Voir Profil.
Oui
Projets, catalogues
Page Qualité des données
Informations sur la qualité des données d'un actif et de ses colonnes, ainsi que sur les contrôles de qualité des données appliqués. Voir Qualité des données.
Diagrammes et graphiques créés par les utilisateurs pour comprendre les données. Voir Visualisations.
Oui
Projets
Page Groupe de fonctions
Informations sur les colonnes de l'actif de données qui sont utilisées en tant que fonctions dans les modèles. Voir Gestion des groupes de fonctions.
Oui
Projets, catalogues, espaces
Propriétés des actifs de connexion
Copy link to section
Les propriétés des actifs de connexion dépendent de la source de données que vous sélectionnez lorsque vous créez une connexion. Voir Types de connexion. Les actifs de connexion de la plupart des sources de données possèdent les propriétés répertoriées dans le tableau ci-dessous.
Propriétés des actifs de connexion
Propriétés
Descriptif
Modifiable?
Espaces de travail
Informations de connexion
Informations qui identifient la source de données. Par exemple, le nom de la base de données, le nom d'hôte, l'adresse IP, le port, l'ID de l'instance, le seau, le point de terminaison URL, etc.
Oui
Projets, catalogues, espaces
Paramétrage des données d'identification
Indique si les données d'identification sont partagées sur la plateforme (par défaut) ou si chaque utilisateur doit entrer ses données d'identification personnelles. Toutes les sources de données ne prennent pas en charge les données d'identification personnelles.
Oui
Projets, catalogues, espaces
Méthode d'authentification
Format des données d'identification. Par exemple, une clé d'API ou un nom d'utilisateur et un mot de passe.
Oui
Projets, catalogues, espaces
Données d'identification
Nom d'utilisateur et mot de passe, clé d'API ou autres données d'identification, comme requis par la source de données et la méthode d'authentification spécifiée.
Oui
Projets, catalogues, espaces
Certificats
Indique si le port de la source de données est configuré pour accepter les connexions SSL et d'autres informations sur le certificat SSL.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Some tools perform the same tasks but have different features and levels of automation.
Jupyter notebook editor
Prepare data
Visualize data
Build models
Deploy assets
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
AutoAI
Build models
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
SPSS Modeler
Prepare data
Visualize data
Build models
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Decision Optimization
Build models
Visualize data
Deploy assets
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Data Refinery
Prepare data
Visualize data
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Orchestration Pipelines
Prepare data
Build models
Deploy assets
Automate the model lifecycle, including preparing data, training models, and creating deployments.
RStudio
Prepare data
Build models
Deploy assets
Work with R notebooks and scripts in an integrated development environment.
Federated learning
Build models
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deployments
Deploy assets
Monitor models
Deploy and run your data science and AI solutions in a test or production environment.
Catalogs
Catalog data
Governance
Find and share your data and other assets.
Metadata import
Prepare data
Catalog data
Governance
Import asset metadata from a connection into a project or a catalog.
Metadata enrichment
Prepare data
Catalog data
Governance
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Data quality rules
Prepare data
Governance
Measure and monitor the quality of your data.
Masking flow
Prepare data
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Governance
Governance
Create your business vocabulary to enrich assets and rules to protect data.
Data lineage
Governance
Track data movement and usage for transparency and determining data accuracy.
AI factsheet
Governance
Monitor models
Track AI models from request to production.
DataStage flow
Prepare data
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Data virtualization
Prepare data
Create a virtual table to segment or combine data from one or more tables.
OpenScale
Monitor models
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Data replication
Prepare data
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Master data
Prepare data
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
watsonx.ai Studio
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
watsonx.ai Runtime
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
IBM Knowledge Catalog
Discover, profile, catalog, and share trusted data in your organization.
DataStage
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
Data Virtualization
View, access, manipulate, and analyze your data without moving it.
Watson OpenScale
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Data Replication
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Match360 with Watson
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Manta Data Lineage
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Project
Where you work with data.
> Projects > View all projects
Catalog
Where you find and share assets.
> Catalogs > View all catalogs
Space
Where you deploy and run assets that are ready for testing or production.
> Deployments
Categories
Where you manage governance artifacts.
> Governance > Categories
Data virtualization
Where you virtualize data.
> Data > Data virtualization
Master data
Where you consolidate data into a 360 degree view.