Définition de définitions de données dans DataStage
Lors de la transformation ou du nettoyage des données, vous devez définir les données avec lesquelles vous travaillez.
Vous définissez les données en important ou en définissant des définitions de données. Vous pouvez sauvegarder les définitions de données à utiliser dans vos conceptions de flux.
Les définitions de données spécifient les données à utiliser à chaque étape d'un flux. Les définitions de données sont partagées par tous les flux d'un projet.
Lorsque vous développez un flux, vous chargez généralement vos étapes avec des définitions de données. Vous le faites dans la section Colonnes appropriée lorsque vous éditez les propriétés de l'étape.
Création de définitions de données
- Ouvrez un projet existant ou créez un projet. Ensuite, ouvrez ou créez un flux DataStage.
- Ouvrez un connecteur ou une étape dans le flux DataStage . Dans l'onglet Sortie, accédez à la section Colonnes et cliquez sur Éditer.
- Cliquez sur l'icône Sauvegarder les colonnes en tant que nouvelle définition de données
. Entrez un nom pour votre définition de données et cliquez sur Suivant.
- Sélectionnez toutes les colonnes à inclure dans la définition de données. Cliquez ensuite sur Créer.
- Cliquez sur Appliquer et renvoyer.
Importation de définitions de données
- Ouvrez un projet existant ou créez un projet. Ensuite, ouvrez ou créez un flux DataStage.
- Ouvrez un connecteur ou une étape dans le flux DataStage . Dans l'onglet Sortie, accédez à la section Colonnes et cliquez sur Éditer.
- Cliquez sur l'icône Importer une définition de données existante
.
- Cliquez sur la section Définition de données, sélectionnez la définition de données à importer, puis cliquez sur Suivant.
- Sélectionnez les colonnes à importer, cliquez sur Importer, puis sur Appliquer et renvoyer.
Création d'un composant DataStage de définition de données
Vous pouvez créer une définition de données en tant que composant réutilisable à utiliser dans les flux DataStage .
- Ouvrez un projet existant ou créez un projet.
- Cliquez sur New Asset + et sélectionnez Create reusable DataStage components.
- Sélectionnez définition de données comme type composant DataStage.
- Entrez un nom pour la définition de données, puis cliquez sur Créer.
- Fournissez des informations pour les colonnes et les propriétés étendues. Cliquez ensuite sur Sauvegarder.
Vous pouvez gérer tous vos composants DataStage à partir de l'onglet Actifs .
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.