Dans les projets, vous utilisez des ressources de calcul pour exécuter vos travaux et la plupart des outils. Un choix de ressources de calcul peut vous être proposé, selon l'outil utilisé.
Les ressources de calcul sont connues sous le nom de modèles d'environnement ou de spécifications matérielles et logicielles. En général, plus la configuration matérielle est grosse, plus les ressources de calcul nécessaires sont coûteuses à l'usage. De nombreux outils dans les projets utilisent le service watsonx.ai Studio pour les ressources de calcul, mais certains outils utilisent d'autres services. Chaque service suit et facture l'utilisation de ressources de calcul séparément.
Ces outils offrent plusieurs choix de configuration de l'exécution (runtime) :
- Editeur de bloc-notes
- Data Refinery
- SPSS Modeler
- Editeur de flux DataStage
- AutoAI
- expérimentation Decision Optimization
- IDE RStudio
Ces outils n'ont qu'une seule configuration d'exécution (runtime), qui est donc affectée d'office :
Les outils suivants ne consomment pas de ressources informatiques :
- Metadata import
- Configuration des données de référence
Profilage des actifs de données
Le profilage d'un actif de données dans un projet ou un catalogue consomme 6 CUH par heure à partir d' IBM Knowledge Catalog, avec une quantité minimale de 0.96 CUH par session de profilage. Le profilage requiert le service IBM Knowledge Catalog .
L'environnement d'exécution pour le profilage n'apparaît pas sur la page Utilisation des ressources de l'onglet Gérer du projet. Vous ne pouvez pas suivre l'utilisation du calcul pour le profilage.
Enrichissement des métadonnées
L'enrichissement des métadonnées requiert le service IBM Knowledge Catalog . La quantité de CUH par heure dans IBM Knowledge Catalog que les travaux d'enrichissement de métadonnées consomment dépend des objectifs d'enrichissement que vous sélectionnez.
Objectifs d'enrichissement des métadonnées | Unités de capacité par heure (CUH) |
---|---|
Données de profil | 6 |
Données de profil et affectation de termes | 8 |
Lorsque vous exécutez l'enrichissement de métadonnées, un ou plusieurs travaux sont démarrés. Chaque travail gère un maximum de 200 tables. Lorsque vous enrichissez plus de 200 tables à la fois, vous démarrez plusieurs travaux. Par exemple, si vous exécutez l'enrichissement de métadonnées sur 500 tables, vous démarrez trois travaux. La quantité minimale de CUH facturée pour chaque travail d'enrichissement de métadonnées est de 0.96 CUH.
Les travaux d'enrichissement de métadonnées avec l'option Développer les métadonnées ou l'affectation de termes sémantiques sont limités à 10 tables par travail.
La quantité de CUH consommée par l'enrichissement de métadonnées dépend du nombre de tables, ainsi que des colonnes dans les tables. D'autres facteurs, tels que la structure des données, peuvent également affecter la quantité de CUH consommée. Par exemple :
- Les trois travaux de profilage de données pour 500 tables avec 500 colonnes peuvent consommer un total d'environ 24 CUH.
- Les trois travaux de profilage de données et d'affectation de termes pour 500 tables avec 500 colonnes peuvent consommer un total d'environ 30 CUH.
Les durées d'exécution pour l'enrichissement des métadonnées n'apparaissent pas sur la page Utilisation des ressources de l'onglet Gérer du projet. Vous ne pouvez pas suivre l'utilisation du calcul pour l'enrichissement des métadonnées.
Règles de qualité des données
Un travail de règle de qualité de données s'exécute en tant que flux DataStage avec l'environnement DataStage PX S par défaut, qui consomme 1 CUH par heure, avec un minimum de 1 minute de CUH. Les règles de qualité de données requièrent les services IBM Knowledge Catalog et DataStage .
L'environnement d'exécution des règles de qualité de données apparaît en tant que flux DataStage sur la page Utilisation des ressources de l'onglet Gérer du projet.
En savoir plus
Rubrique parent : Projets