0 / 0
Retourner à la version anglaise de la documentation
Configuration des noeuds de pipeline
Dernière mise à jour : 28 nov. 2024
Configuration des noeuds de pipeline

Configurez les noeuds de votre pipeline pour spécifier des entrées et créer des sorties dans le cadre de votre pipeline.

Spécification de la portée de l'espace de travail

Par défaut, la portée d'un pipeline est le projet qui contient le pipeline. Vous pouvez spécifier explicitement une portée autre que la portée par défaut pour localiser un actif utilisé dans le pipeline. La portée est le projet, le catalogue ou l'espace qui contient l'actif. A partir de l'interface utilisateur, vous pouvez rechercher la portée.

Changement du mode d'entrée

Lorsque vous configurez un noeud, vous pouvez spécifier les ressources qui incluent des données et des blocs-notes de différentes manières. Par exemple, entrer directement un nom ou un ID, rechercher un actif ou utiliser la sortie d'un noeud précédent dans le pipeline pour remplir un champ. Pour voir les options disponibles pour un champ, cliquez sur l'icône d'entrée de celui-ci. Selon le contexte, les options sont les suivantes :

  • Sélectionner une ressource : utilisez le navigateur d'actifs pour rechercher un actif tel qu'un fichier de données.
  • Paramètre d'affectation de pipeline: affectez une valeur à l'aide d'une variable configurée avec un paramètre de pipeline. Pour plus d'informations, voir Configuration d'objets globaux.
  • Sélectionnez à partir d'un autre noeud : utilisez la sortie d'un noeud précédent dans le pipeline comme valeur pour ce champ.
  • Entrez l'expression: entrez le code pour affecter des valeurs ou identifier des ressources. Pour plus d'informations, voir Eléments de codage.

Noeuds de pipeline et paramètres

Configurez les types de noeud de pipeline suivants:

Copier les nœuds

Utilisez les noeuds de copie pour ajouter des actifs à votre pipeline ou pour exporter des actifs de pipeline.

Copier les actifs sélectionnés d'un projet ou d'un espace dans un espace non vide. Vous pouvez copier les actifs suivants dans un espace :

  • expérimentation AutoAI

  • Travail de package de code

  • Connexion

  • Flux Data Refinery

  • Travail Data Refinery

  • Actif de données

  • Travail DataStage

  • Travail de déploiement

  • Environnement

  • Fonction

  • Travail

  • Modèle

  • Bloc-notes

  • Travail de bloc-notes

  • Travail de pipelines

  • Script

  • Travail de script

  • Travail SPSS Modeler

Copier des actifs

Paramètres d'entrée

Paramètre Descriptif
Actifs source Parcourez ou recherchez l'actif source à ajouter dans la liste. Vous pouvez également spécifier un actif avec un paramètre de pipeline, avec la sortie d'un autre noeud ou en entrant l'ID d'actif
cible Parcourez ou recherchez l'espace cible.
Mode copie Choisissez le mode de traitement d'un cas où le flux tente de copier un actif et qu'un actif du même nom existe déjà. L'un des éléments suivants : ignore, fail, overwrite

Paramètres de sortie

Paramètre Descriptif
Actifs de sortie Liste des actifs copiés

Exporter des actifs

Exportez des actifs sélectionnés de la portée, par exemple, un projet ou un espace de déploiement. L'opération exporte tous les actifs par défaut. Vous pouvez limiter la sélection d'actifs en générant une liste de ressources à exporter.

Paramètres d'entrée

Paramètre Descriptif
Actifs Choisissez Portée pour exporter tous les éléments exportables ou choisissez Liste pour créer une liste d'éléments spécifiques à exporter.
Projet ou espace source Nom du projet ou de l'espace contenant les actifs à exporter
Fichier exporté Emplacement de fichier pour le stockage du fichier d'exportation
Mode de création (facultatif) Choisissez le mode de traitement d'un cas où le flux tente de créer un actif et qu'un actif du même nom existe déjà. L'un des éléments suivants : ignore, fail, overwrite

Paramètres de sortie

Paramètre Descriptif
Fichier exporté Chemin d'accès au fichier exporté

Remarques :

  • Si vous exportez des actifs de projet qui contiennent un bloc-notes, la version la plus récente du bloc-notes est incluse dans le fichier d'exportation. Si le pipeline avec le noeud Exécuter le travail de bloc-notes a été configuré pour utiliser une version de bloc-notes différente de la version la plus récente, le pipeline exporté est automatiquement reconfiguré pour utiliser la version la plus récente lors de l'importation. Cela peut produire des résultats inattendus ou nécessiter une reconfiguration après l'importation.
  • Si les actifs sont autonomes dans le projet exporté, ils sont conservés lorsque vous importez un nouveau projet. Sinon, une configuration peut être requise après une importation d'actifs exportés.

Importer des actifs

Importez des actifs à partir d'un fichier ZIP contenant des actifs exportés.

Paramètres d'entrée

Paramètre Descriptif
Chemin de la cible d'importation Parcourez ou recherchez les actifs à importer
Fichier archive à importer Indiquez le chemin d'accès à un fichier ZIP ou à une archive

Remarques: Après l'importation d'un fichier, les chemins et les références aux actifs importés sont mis à jour, conformément aux règles suivantes:

  • Les références aux actifs du projet ou de l'espace exporté sont mises à jour dans le nouveau projet ou espace après l'importation.
  • Si les actifs du projet exporté font référence à des actifs externes (inclus dans un autre projet), la référence à l'actif externe est conservée après l'importation.
  • Si l'actif externe n'existe plus, le paramètre est remplacé par une valeur vide et vous devez reconfigurer la zone pour qu'elle pointe vers un actif valide.

Création de noeuds

Configurez les noeuds pour créer des actifs dans votre pipeline.

Créer une expérimentation AutoAI

Utilisez ce noeud pour entraîner une classificationAutoAI ou une expérimentation de régression et générer des pipelines de candidat modèle.

Paramètres d'entrée

Paramètre Descriptif
Nom de l'expérimentation AutoAI Nom de la nouvelle expérimentation
Portée Un projet ou un espace dans lequel l'expérimentation va être créée
Type de prévision Type de modèle pour les données suivantes: binaire, classification ou régression
Colonne de prévision (libellé) Nom de la colonne de prédiction
Classe positive (facultatif) Spécifier une classe positive pour une expérimentation de classification binaire
Rapport de division des données d'apprentissage (facultatif) Pourcentage de données à retirer de l'entraînement et à utiliser pour tester les pipelines (variable flottante : 0,0 - 1,0)
Algorithmes à inclure (facultatif) Limiter la liste des estimateurs à utiliser (la liste dépend du type d'apprentissage)
Algorithmes à utiliser Indiquez la liste des estimateurs à utiliser (la liste dépend du type d'apprentissage)
Métrique d'optimisation (facultatif) Métrique utilisée pour classer les modèles
Spécification matérielle (facultatif) Spécification d'une spécification matérielle pour l'expérimentation
Description de l'expérimentation AutoAI Description de l'expérience
Balises d'expérimentation AutoAI (facultatif) Balises permettant d'identifier l'expérimentation
Mode de création (facultatif) Choisissez le mode de traitement d'un cas où le pipeline tente de créer une expérimentation et qu'il existe un nom identique. L'un des éléments suivants : ignore, fail, overwrite

Paramètres de sortie

Paramètre Descriptif
expérimentation AutoAI Chemin d'accès au modèle sauvegardé

Créer une expérimentation de série temporelle AutoAI

Utilisez ce noeud pour entraîner une expérimentation de série temporelleAutoAI et générer des pipelines de candidat modèle.

Paramètres d'entrée

Paramètre Descriptif
Nom de l'expérimentation de série temporelle AutoAI Nom de la nouvelle expérimentation
Portée Projet, catalogue ou espace dans lequel le pipeline va être créé
Colonnes de prévision (libellé) Nom d'une ou de plusieurs colonnes de prévision
Colonne de date/heure (facultatif) Nom de la colonne de date / heure
Tirer parti des futures valeurs des fonctions de support Choisissez "True" pour activer la prise en charge des fonctions (exogènes) afin d'améliorer la prévision. Par exemple, incluez une fonction de température pour prédire les ventes de crème glacée.
Fonctions de prise en charge (facultatif) Choisir les fonctions de prise en charge et les ajouter à la liste
Méthode d'imputation (facultatif) Choisissez une technique d'imputation des valeurs manquantes dans un jeu de données
Seuil d'imputation (facultatif) Indiquez un seuil plus élevé pour le pourcentage de valeurs manquantes à fournir avec la méthode d'imputation spécifiée. Si le seuil est dépassé, l'expérimentation échoue. Par exemple, si vous indiquez que 10% des valeurs peuvent être imputées et que 15% des valeurs sont manquantes dans le jeu de données, l'expérimentation échoue.
Type de remplissage Indiquez comment la méthode d'imputation spécifiée remplit les valeurs nulles. Choisissez de fournir une moyenne de toutes les valeurs et une médiane de toutes les valeurs, ou spécifiez une valeur de remplissage.
Valeur de remplissage (facultatif) Si vous avez choisi de spécifier une valeur pour remplacer les valeurs nulles, entrez la valeur dans cette zone.
Jeu de données d'entraînement final Choisissez d'entraîner les pipelines finaux uniquement avec les données d'entraînement ou avec les données d'entraînement et les données de rétention. Si vous choisissez des données d'entraînement, le bloc-notes généré inclut une cellule pour l'extraction des données restantes
Taille des éléments restants (facultatif) Si vous divisez les données d'entraînement en données d'entraînement et de rétention, spécifiez un pourcentage des données d'entraînement à réserver en tant que données de rétention pour la validation des pipelines. Les données restantes ne dépassent pas un tiers des données.
Nombre d'essais en amont (facultatif) Personnalisez les backtests pour effectuer une validation croisée de votre expérimentation de séries temporelles
Longueur de l'écart (facultatif) Ajustez le nombre de points temporels entre le jeu de données d'apprentissage et le jeu de données de validation pour chaque test dorsal. Lorsque la valeur du paramètre est différente de zéro, les valeurs de séries temporelles de l'écart ne sont pas utilisées pour entraîner l'expérimentation ou évaluer le test en cours.
Fenêtre de récupération des consultations (facultatif) Paramètre indiquant le nombre de valeurs de série temporelle précédentes utilisées pour prédire le moment présent.
Fenêtre Prévision (facultatif) Plage à prévoir en fonction des données de la fenêtre de récupération des consultations.
Algorithmes à inclure (facultatif) Limiter la liste des estimateurs à utiliser (la liste dépend du type d'apprentissage)
Pipelines à réaliser Vous pouvez éventuellement ajuster le nombre de pipelines à créer. Plus de pipelines augmentent le temps et les ressources de formation.
Spécification matérielle (facultatif) Spécification d'une spécification matérielle pour l'expérimentation
Description de l'expérimentation de séries temporelles AutoAI (facultatif) Description de l'expérience
Balises d'expérimentation AutoAI (facultatif) Balises permettant d'identifier l'expérimentation
Mode de création (facultatif) Choisissez le mode de traitement d'un cas où le pipeline tente de créer une expérimentation et qu'il existe un nom identique. L'un des éléments suivants : ignore, fail, overwrite

Paramètres de sortie

Paramètre Descriptif
Expérimentation de séries temporelles AutoAI Chemin d'accès au modèle sauvegardé

Créer un déploiement de lot

Utilisez ce noeud pour créer un déploiement par lots pour un modèle d'apprentissage automatique.

Paramètres d'entrée

Paramètre Descriptif
Actif d'apprentissage automatique Nom ou ID de l'actif d'apprentissage automatique à déployer
Nouveau nom de déploiement (facultatif) Nom du nouveau travail avec, en option, une description et des étiquettes
Mode de création (facultatif) Comment gérer un cas où le pipeline tente de créer un travail et qu'un travail du même nom existe déjà. L'un des éléments suivants : ignore, fail, overwrite
Nouvelle description de déploiement (facultatif) Description du déploiement
Nouvelles balises de déploiement (facultatif) Balises permettant d'identifier le déploiement
Spécification matérielle (facultatif) Spécification d'une spécification matérielle pour le travail

Paramètres de sortie

Paramètre Descriptif
Nouveau déploiement Chemin d'accès au déploiement récemment créé

Créer un actif de données

Utilisez ce noeud pour créer un actif de données.

Paramètres d'entrée

Paramètre Descriptif
Fichier Chemin d'accès au fichier dans un espace de stockage de fichiers
Portée cible Chemin d'accès à l'espace cible ou au projet
Nom (facultatif) Nom de la source de données avec description facultative, pays d'origine et balises
Description (facultatif) Description de l'actif
Pays d'origine (facultatif) Pays d'origine pour la réglementation des données
Balises (facultatif) Balises permettant d'identifier les actifs
Mode création Comment gérer un cas où le pipeline tente de créer un travail et qu'un travail du même nom existe déjà. L'un des éléments suivants : ignore, fail, overwrite

Paramètres de sortie

Paramètre Descriptif
Actif de données L'actif de données nouvellement créé

Créer un espace de déploiement

Utilisez ce noeud pour créer et configurer un espace que vous pouvez utiliser pour organiser et créer des déploiements.

Paramètres d'entrée

Paramètre Descriptif
Nom du nouvel espace Nom du nouvel espace avec, en option, une description et des étiquettes
Nouvelles balises d'espace (facultatif) Balises permettant d'identifier l'espace
CRN d'instance COS du nouvel espace CRN de l'instance de service COS
Nouveau CRN d'instance WML d'espace (facultatif) CRN de l'instance de service watsonx.ai Runtime
Mode de création (facultatif) Comment gérer un cas où le pipeline tente de créer un espace et qu'il existe un nom identique. L'un des éléments suivants : ignore, fail, overwrite
Description de l'espace (facultatif) Description de l'espace

Paramètres de sortie

Paramètre Descriptif
Espace Chemin d'accès à l'espace récemment créé

Créer un déploiement en ligne

Utilisez ce noeud pour créer un déploiement en ligne dans lequel vous pouvez soumettre des données de test directement à un noeud final d'API REST de service Web.

Paramètres d'entrée

Paramètre Descriptif
Actif d'apprentissage automatique Nom ou ID de l'actif d'apprentissage automatique à déployer
Nouveau nom de déploiement (facultatif) Nom du nouveau travail avec, en option, une description et des étiquettes
Mode de création (facultatif) Comment gérer un cas où le pipeline tente de créer un travail et qu'un travail du même nom existe déjà. L'un des éléments suivants : ignore, fail, overwrite
Nouvelle description de déploiement (facultatif) Description du déploiement
Nouvelles balises de déploiement (facultatif) Balises permettant d'identifier le déploiement
Spécification matérielle (facultatif) Spécification d'une spécification matérielle pour le travail

Paramètres de sortie

Paramètre Descriptif
Nouveau déploiement Chemin d'accès au déploiement récemment créé

Wait

Utilisez des noeuds pour mettre en pause un pipeline jusqu'à ce qu'un actif soit disponible à l'emplacement spécifié dans le chemin.

Utilisez ce noeud pour attendre que tous les résultats des noeuds précédents du pipeline soient disponibles afin que le pipeline puisse continuer.

Ce noeud ne prend pas d'entrées et ne produit pas de sortie. Lorsque les résultats sont tous disponibles, le pipeline continue automatiquement.

Attendre tous les résultats

Utilisez ce nœud pour attendre que les nœuds précédents du pipeline soient disponibles pour que le pipeline puisse continuer. Exécutez les noeuds en aval dès que l'une des conditions en amont est remplie.

Ce noeud ne prend pas d'entrées et ne produit pas de sortie. Lorsque des résultats sont disponibles, le pipeline se poursuit automatiquement.

Attendre un quelconque résultat

Attendez qu'un actif soit créé ou mis à jour à l'emplacement spécifié dans le chemin d'accès à partir d'un travail ou d'un processus antérieur dans le pipeline. Indiquez un délai d'attente pour que la condition soit remplie. Si 00:00:00 est le délai d'attente spécifié, le flux attend indéfiniment.

Attente du fichier

Paramètres d'entrée

Paramètre Descriptif
Emplacement de fichier Indiquez l'emplacement dans le navigateur d'actifs où réside l'actif. Utilisez le format data_asset/filename où le chemin est relatif à la racine. Le fichier doit exister et se trouver à l'emplacement que vous spécifiez, sinon le noeud échoue avec une erreur.
Mode d'attente Par défaut, le mode est celui du fichier à afficher. Vous pouvez passer à l'attente de la disparition du fichier
Délai d'attente (facultatif) Indiquez le délai d'attente avant de poursuivre le pipeline. Utilisez le format hh:mm:ss
Règle d'erreur (facultatif) Voir Gestion des erreurs

Paramètres de sortie

Paramètre Descriptif
Valeur renvoyée Valeur de retour du noeud
Statut de l'exécution Renvoie une valeur de : Terminé, Terminé avec des avertissements, Terminé avec des erreurs, Échec ou Annulé
Message d'état Message associé à l'état

Noeuds de contrôle

Contrôlez le pipeline en ajoutant le traitement des erreurs et la logique.

Les boucles sont un noeud dans un pipeline qui fonctionne comme une boucle codée.

Les deux types de boucles sont parallèles et séquentielles.

Vous pouvez utiliser des boucles lorsque le nombre d'itérations d'une opération est dynamique. Par exemple, si vous ne connaissez pas le nombre de blocs-notes à traiter, ou si vous souhaitez choisir le nombre de blocs-notes lors de l'exécution, vous pouvez utiliser une boucle pour itérer dans la liste des blocs-notes.

Vous pouvez également utiliser une boucle pour itérer dans la sortie d'un noeud ou dans des éléments d'un tableau de données.

Attention : Le cache n'est pas transféré séquentiellement entre les itérations d'une boucle dans un pipeline. Les résultats de la première itération sont utilisés uniquement dans la première itération de l'exécution suivante.

Boucles en parallèle

Ajoutez une construction de boucle parallèle au pipeline. Une boucle parallèle exécute les noeuds d'itération indépendamment et éventuellement simultanément.

Par exemple, pour entraîner un modèle d'apprentissage automatique avec un ensemble d'hyperparamètres afin de trouver le meilleur exécutant, vous pouvez utiliser une boucle pour itérer sur une liste d'hyperparamètres afin d'entraîner les variations de bloc-notes en parallèle. Les résultats peuvent être comparés ultérieurement dans le flux pour trouver le meilleur bloc-notes. Pour voir les limites du nombre de boucles que vous pouvez exécuter simultanément, voir Limitations.

Dans l'exemple suivant, un noeud Exécuter un script Bash recherche et extrait les blocs-notes qui correspondent à des critères spécifiés. Un noeud Exécuter un travail DataStage extrait les données d'un référentiel Git . Lorsque l'entrée de chaque noeud est disponible, le processus de boucle commence, en exécutant chaque bloc-notes extrait par la recherche et en traitant les données extraites du référentiel Git .

Exemple de boucle parallèle

Cliquez sur Développer pour ajouter des noeuds ou sur l'icône sortante du noeud pour afficher le processus de boucle complète. Au fur et à mesure de l'exécution des blocs-notes, toute erreur dans le bloc-notes est capturée dans une condition appelée Qualité médiocre. La condition déclenche un script Bash pour incrémenter une variable utilisateur nommée Augmentation du nombre d'erreurs. Lorsque la valeur de la variable Nombre d'erreurs d'augmentation atteint le seuil spécifié, la boucle est arrêtée.

Exemple de boucle parallèle

Comme le flux est exécuté en parallèle pour chaque bloc-notes, il renvoie des résultats plus rapidement qu'une boucle séquentielle.

Paramètres d'entrée lors de l'itération des types de liste

Paramètre Descriptif
Entrée de liste Le paramètre Entrée de liste contient deux zones, le type de données de la liste et le contenu de la liste sur lequel la boucle itère ou un lien standard vers l'entrée de pipeline ou la sortie de pipeline.
Parallélisme Nombre maximal de tâches à exécuter simultanément. Doit être supérieur à zéro

Paramètres d'entrée lors de l'itération des types de chaîne

Paramètre Descriptif
Zone de saisie Données texte à partir de laquelle la boucle est lue
Séparateur Caractère utilisé pour fractionner le texte
Parallélisme (facultatif) Nombre maximal de tâches à exécuter simultanément. Doit être supérieur à zéro

Si le type d'élément de tableau d'entrée est JSON ou tout type représenté comme tel, cette zone peut le décomposer en tant que dictionnaire. Les clés sont les clés d'élément d'origine et les valeurs sont les alias des noms de sortie.

Paramètres de sortie

Paramètre Descriptif
Pause de contrôle ID du nœud Contient l'ID du nœud terminateur sur lequel le nœud s'est terminé, vide sinon
Statut de l'exécution Informations sur l'état du travail : en attente, démarrage en cours, en cours d'exécution, terminé, annulé ou échec avec des erreurs
Message d'état Informations sur l'état du travail

Boucles dans l'ordre

Ajoutez une construction de boucle séquentielle au pipeline. Les boucles peuvent itérer sur une plage numérique, une liste ou un texte avec un délimiteur.

Un cas d'utilisation pour les boucles séquentielles est si vous souhaitez essayer une opération 3 fois avant de déterminer si une opération a échoué.

Paramètres d'entrée

Paramètre Descriptif
Entrée de liste Le paramètre Entrée de liste contient deux zones, le type de données de la liste et le contenu de la liste sur lequel la boucle itère ou un lien standard vers l'entrée de pipeline ou la sortie de pipeline.
Zone de saisie Données texte à partir de laquelle la boucle est lue. Indiquez un caractère pour fractionner le texte.
Intervalle Indiquez les étapes de début, de fin et facultatives d'une plage à itérer. L'étape par défaut est 1.

Après avoir configuré la plage itérative de la boucle, définissez un flux de sous-pipeline à l'intérieur de la boucle à exécuter jusqu'à ce que la boucle soit terminée. Par exemple, il peut appeler un bloc-notes, un script ou un autre flux par itération.

Paramètres de sortie

Paramètre Descriptif
Pause de contrôle ID du nœud Contient l'ID du nœud terminateur sur lequel le nœud s'est terminé, vide sinon
Statut de l'exécution Informations sur l'état du travail : en attente, démarrage en cours, en cours d'exécution, terminé, annulé ou échec avec des erreurs
Message d'état Informations sur l'état du travail

Terminer la boucle

Dans un flux de processus de boucle parallèle ou séquentiel, vous pouvez ajouter un noeud Arrêter le pipeline pour arrêter le processus de boucle à tout moment. Vous devez définir vos propres conditions de résiliation. Dans les nœuds, vous pouvez changer l'état de la boucle lorsqu'elle se termine en Complete ou Failure. Cela garantit que vous pouvez terminer la boucle tout en remplissant les conditions d'échec du nœud de boucle et en choisissant de poursuivre le pipeline ou d'effectuer d'autres actions.

Attention: Si vous utilisez le noeud de fin de boucle, votre boucle annule toutes les tâches en cours et s'arrête sans terminer son itération.

Définir des variables utilisateur

Configurez une variable utilisateur avec une paire clé/valeur, puis ajoutez la liste des variables dynamiques pour ce noeud.

Pour plus d'informations sur la création d'une variable utilisateur, voir Configuration d'objets globaux.

Paramètres d'entrée

Tableau 1. Paramètres d'entrée des variables utilisateur
Paramètre Descriptif
Nom Entrez le nom ou la clé de la variable
Type d'entrée Choisissez le paramètre Expression ou Pipeline comme type d'entrée.
  • Pour les expressions, utilisez le générateur d'expressions intégré pour créer une variable qui résulte d'une expression personnalisée.
  • Pour les paramètres de pipeline, affectez un paramètre de pipeline et utilisez la valeur de paramètre comme entrée pour la variable utilisateur.

Arrêter le pipeline

Vous pouvez initier et contrôler l'arrêt d'un pipeline à l'aide d'un noeud Terminer le pipeline à partir de la catégorie Contrôle. Lorsque le flux d'erreurs s'exécute, vous pouvez éventuellement spécifier comment gérer les travaux de bloc-notes ou d'entraînement qui ont été lancés par les noeuds du pipeline. Vous devez indiquer s'il faut attendre la fin des travaux, annuler les travaux, puis arrêter le pipeline ou tout arrêter sans annuler. Indiquez les options du nœud de pipeline Terminate.

Paramètres d'entrée

Paramètre Descriptif
Mode de terminaison (facultatif) Choisissez le comportement pour le flux d'erreur

Le mode terminateur peut être :

  • Terminer l'exécution du pipeline et tous les travaux en cours d'exécution arrête tous les travaux et arrête le pipeline.
  • Annuler tous les travaux en cours d'exécution, puis terminer le pipeline annule tous les travaux en cours d'exécution avant d'arrêter le pipeline.
  • Terminer l'exécution du pipeline après l'exécution des travaux en cours d'exécution attend que les travaux en cours d'exécution se terminent, puis arrête le pipeline.
  • Arrêter le pipeline qui est exécuté sans arrêter les travaux arrête le pipeline mais permet aux travaux en cours d'exécution de continuer.

Mettre à jour les nœuds

Utilisez des noeuds de mise à jour pour remplacer ou mettre à jour des actifs afin d'améliorer les performances. Par exemple, si vous souhaitez standardiser vos étiquettes, vous pouvez effectuer une mise à jour pour remplacer une étiquette par une autre.

Mettez à jour les détails de l'entraînement pour une expérimentationAutoAI.

Mettre à jour l'expérimentation AutoAI

Paramètres d'entrée

Paramètre Descriptif
expérimentation AutoAI Chemin d'accès à un projet ou à un espace dans lequel réside l'expérimentation
Nom d'expérimentation AutoAI (facultatif) Nom de l'expérimentation à mettre à jour avec, en option, une description et des étiquettes
Description de l'expérimentation AutoAI (facultatif) Description de l'expérience
Balises d'expérimentation AutoAI (facultatif) Balises permettant d'identifier l'expérimentation

Paramètres de sortie

Paramètre Descriptif
expérimentation AutoAI Chemin d'accès à l'expérimentation mise à jour

Mettre à jour le déploiement de lot

Utilisez ces paramètres pour mettre à jour un déploiement par lot.

Paramètres d'entrée

Paramètre Descriptif
déploiement Chemin d'accès au déploiement à mettre à jour
Nouveau nom pour le déploiement (facultatif) Nom ou ID du déploiement à mettre à jour
Nouvelle description du déploiement (facultatif) Description du déploiement
Nouvelles balises pour le déploiement (facultatif) Balises permettant d'identifier le déploiement
Actif d'apprentissage automatique Nom ou ID de l'actif d'apprentissage automatique à déployer
Spécification matérielle Mise à jour de la spécification matérielle du travail

Paramètres de sortie

Paramètre Descriptif
déploiement Chemin d'accès au déploiement mis à jour

Mettre à jour l'espace de déploiement

Mettez à jour les détails d'un espace.

Paramètres d'entrée

Paramètre Descriptif
Espace Chemin d'accès à l'espace existant
Nom d'espace (facultatif) Mettre à jour le nom d'espace
Description de l'espace (facultatif) Description de l'espace
Balises d'espace (facultatif) Balises permettant d'identifier l'espace
Instance WML (facultatif) Spécifiez une nouvelle instance Machine Learning
Instance WML Indiquez une nouvelle instance Learning Machine. Remarque : Même si vous affectez un nom différent à une instance de l'interface utilisateur, le nom du système est Instance d'apprentissage machine. Différencier les différentes instances à l'aide du CRN de l'instance

Paramètres de sortie

Paramètre Descriptif
Espace Chemin d'accès à l'espace mis à jour

Mettre à jour le déploiement en ligne

Utilisez ces paramètres pour mettre à jour un déploiement en ligne (service Web).

Paramètres d'entrée

Paramètre Descriptif
déploiement Chemin d'accès au déploiement existant
Nom de déploiement (facultatif) Mettre à jour le nom de déploiement
Description du déploiement (facultatif) Description du déploiement
Balises de déploiement (facultatif) Balises permettant d'identifier le déploiement
Actif (facultatif) Actif (ou version) d'apprentissage automatique à redéployer

Paramètres de sortie

Paramètre Descriptif
déploiement Chemin d'accès au déploiement mis à jour

Supprimer les noeuds

Configurez les paramètres pour les opérations de suppression.

Supprimer

Vous pouvez supprimer :

  • expérimentation AutoAI
  • Déploiement par lot
  • Espace de déploiement
  • Déploiement en ligne

Pour chaque article, choisissez l'actif à supprimer.

Noeuds d'exécution

Utilisez ces noeuds pour entraîner une expérimentation, exécuter un script ou exécuter un flux de données.

Exécuter l'expérimentation AutoAI

Entraîne et stocke des pipelines et des modèles d'expérimentationAutoAI .

Paramètres d'entrée

Paramètre Descriptif
expérimentation AutoAI Recherchez l'actif de pipeline ML ou obtenez l'expérimentation à partir d'un paramètre de pipeline ou de la sortie d'un noeud précédent.
Actif de données d'apprentissage Parcourez ou recherchez les données pour entraîner l'expérimentation. Notez que vous pouvez fournir des données lors de l'exécution à l'aide d'un paramètre de pipeline
Actif de données restant (facultatif) Vous pouvez éventuellement choisir un fichier distinct à utiliser pour les données restantes pour les performances de testingmodel
Nombre de modèles (facultatif) Indiquez le nombre de modèles à sauvegarder à partir des pipelines les plus performants. La limite est de 3 modèles
Nom d'exécution (facultatif) Nom de l'expérimentation avec, en option, une description et des étiquettes
Préfixe de nom de modèle (facultatif) Préfixe utilisé pour nommer les modèles entraînés. La valeur par défaut est < (nom de l'expérimentation) >
Description de l'exécution (facultatif) Description de la nouvelle session d'entraînement
Balises d'exécution (facultatif) Balises pour la nouvelle exécution d'entraînement
Mode de création (facultatif) Choisissez le mode de traitement d'un cas où le flux de pipeline tente de créer un actif et qu'un actif du même nom existe déjà. L'un des éléments suivants : ignore, fail, overwrite
Règle d'erreur (facultatif) (Facultatif) Remplacer la règle d'erreur par défaut pour le noeud

Paramètres de sortie

Paramètre Descriptif
Modèles Liste des chemins des N modèles entraînés et conservés les plus élevés (classés par métrique d'évaluation sélectionnée)
Meilleur modèle Chemin d'accès au modèle gagnant (en fonction de la métrique d'évaluation sélectionnée)
Métriques du modèle Une liste de mesures de modèle formées (chaque élément est un objet imbriqué avec des mesures telles que : holdout_exactitude, holdout_average_precision, ...)
Métrique du modèle gagnant Métrique d'évaluation choisie du modèle gagnant
Métrique optimisée Métrique utilisée pour affiner le modèle
Statut de l'exécution Informations sur l'état du travail : en attente, démarrage en cours, en cours d'exécution, terminé, annulé ou échec avec des erreurs
Message d'état Informations sur l'état du travail

Exécuter le script Bash

Exécutez un script Bash en ligne pour automatiser une fonction ou un processus pour le pipeline. Vous pouvez entrer le code de script Bash manuellement ou importer le script bash à partir d'une ressource, d'un paramètre de pipeline ou de la sortie d'un autre noeud.

Vous pouvez également utiliser un script Bash pour traiter des fichiers de sortie volumineux. Par exemple, vous pouvez générer une grande liste séparée par des virgules que vous pouvez ensuite itérer à l'aide d'une boucle.

Dans l'exemple suivant, l'utilisateur a entré le code de script en ligne manuellement. Le script utilise l'outil cpdctl pour rechercher tous les blocs-notes avec une balise de variable définie et agrège les résultats dans une liste JSON. La liste peut ensuite être utilisée dans un autre noeud, comme l'exécution des blocs-notes renvoyés par la recherche.

Exemple de noeud de script bash

Paramètres d'entrée

Paramètre Descriptif
Code de script intégré Entrez un script Bash dans l'éditeur de code en ligne. Facultatif: Vous pouvez également sélectionner une ressource, affecter un paramètre de pipeline ou effectuer une sélection à partir d'un autre noeud.
Variables d'environnement (facultatif) Spécifiez un nom de variable (la clé) et un type de données et ajoutez la nouvelle variable à la liste des variables à utiliser dans le script.
Type d'exécution (facultatif) Sélectionnez soit un environnement d'exécution autonome (par défaut), soit un environnement d'exécution partagé. Utilisez un environnement d'exécution partagé pour les tâches qui nécessitent une exécution dans des pods partagés.
Règle d'erreur (facultatif) (Facultatif) Remplacer la règle d'erreur par défaut pour le noeud

Paramètres de sortie

Paramètre Descriptif
Variables de sortie Configurez une paire clé / valeur pour chaque variable personnalisée, puis cliquez sur le bouton Ajouter pour remplir la liste des variables dynamiques du noeud
Valeur renvoyée Valeur de retour du noeud
Sortie standard Sortie standard du script
Erreur standard Message d'erreur standard du script
Statut de l'exécution Informations sur l'état du travail : en attente, démarrage en cours, en cours d'exécution, terminé, annulé ou échec avec des erreurs
Message d'état Message associé à l'état

Règles pour la sortie de script Bash

La sortie d'un script Bash est souvent le résultat d'une expression calculée et peut être volumineuse. Lorsque vous examinez les propriétés d'un script avec une sortie de grande taille valide, vous pouvez prévisualiser ou télécharger la sortie dans un afficheur.

Ces règles régissent le type de sortie de grande taille valide.

  • La sortie d'une expression list_expression est une expression calculée. Par conséquent, il s'agit d'une sortie de grande taille.
  • La sortie de chaîne est traitée comme une valeur littérale plutôt que comme une expression calculée. Elle doit donc respecter les limites de taille qui régissent les expressions en ligne. Par exemple, vous êtes averti lorsqu'une valeur littérale dépasse 1 Ko et que les valeurs de 2 Ko et plus entraînent une erreur.
  • Vous pouvez inclure des messages d'erreur standard dans votre sortie standard (standard_output) et les afficher, par exemple avec la fonction GetCommandOutput .

Référencement d'une variable dans un script Bash

La façon dont vous référencez une variable dans un script varie selon que la variable a été créée en tant que variable d'entrée ou en tant que variable de sortie. Les variables de sortie sont créées en tant que fichiers et, à ce titre, elles requièrent un chemin de fichier dans leur référence. En particulier :

  • Les variables d'entrée sont disponibles et utilisables par le nom qui leur est affecté
  • Les noms de variables de sortie requièrent que _PATH soit ajouté au nom de variable pour indiquer que les valeurs doivent être écrites dans le fichier de sortie désigné par la variable {output_name}_PATH.

Exécuter le déploiement de lot

Configurez ce noeud pour exécuter les travaux de déploiement sélectionnés.

Paramètres d'entrée

Paramètre Descriptif
déploiement Parcourir ou rechercher le travail de déploiement
Actifs de données d'entrée Indiquez les données utilisées pour le travail par lot.
Actif de sortie Nom du fichier de sortie pour les résultats du travail par lot. Vous pouvez sélectionner Nom de fichier et entrer un nom de fichier personnalisé ou Actif de données et sélectionner un actif existant dans un espace.
Spécification matérielle (facultatif) Rechercher une spécification matérielle à appliquer pour le travail
Règle d'erreur (facultatif) (Facultatif) Remplacer la règle d'erreur par défaut pour le noeud

Paramètres de sortie

Paramètre Descriptif
Travail Chemin d'accès au fichier contenant les résultats du travail de déploiement
Exécution de travail ID du travail
Statut de l'exécution Informations sur l'état du travail : en attente, démarrage en cours, en cours d'exécution, terminé, annulé ou échec avec des erreurs
Message d'état Informations sur l'état du travail
Restriction : Toutes les options d'entrée et de sortie que vous avez définies lors de la création de votre travail par lots sont prises en charge par le nœud Exécuter un travail de déploiement par lots. Cela inclut la spécification de plusieurs fichiers comme entrée pour une solution SPSS Modeler ou Decision Optimization ou la spécification d'un fichier JSON comme entrée. Cependant, certaines des options d'entrée et de sortie ne peuvent pas être modifiées dans l'interface du nœud d'exécution de la tâche de déploiement par lots.

IBM DataStage est un outil d'intégration de données pour la conception, le développement et l'exécution de travaux qui déplacent et transforment des données. Exécutez un travail DataStage et utilisez la sortie dans un noeud ultérieur.

Par exemple, le flux suivant montre un noeud Exécuter DataStage qui extrait des données d'un référentiel Git . Si le travail aboutit, le pipeline exécute le noeud suivant et crée un espace de déploiement. Si le travail échoue, un courrier électronique de notification est déclenché et la boucle est arrêtée.

Exécution d'un travail DataStage dans un pipeline

Paramètre Descriptif
Travail DataStage Chemin d'accès au travail DataStage
Valeurs des paramètres locaux (facultatif) Editez les paramètres de travail par défaut. Cette option est disponible uniquement si vous avez des paramètres locaux dans le travail.
Valeurs des ensembles de paramètres (facultatif) Editez les ensembles de paramètres utilisés par ce travail. Vous pouvez choisir d'utiliser les paramètres tels qu'ils sont définis par défaut ou d'utiliser des ensembles de valeurs à partir des paramètres d'autres pipelines.
Environnement Recherchez et sélectionnez l'environnement utilisé pour exécuter le travail DataStage .
Attention: Laissez la zone des environnements telle qu'elle est pour utiliser l'environnement d'exécution DataStage XS par défaut. Si vous choisissez de le remplacer, indiquez un autre environnement pour l'exécution du travail. Assurez-vous que l'environnement que vous spécifiez est compatible avec la configuration matérielle afin d'éviter une erreur d'exécution.
Variables d'environnement (facultatif) Indiquez un nom de variable (la clé) et un type de données et ajoutez-les à la liste des variables à utiliser dans le travail
Paramètres de travail (facultatif) Paramètre supplémentaire à transmettre au travail lors de son exécution. Indiquez une paire clé / valeur et ajoutez-la à la liste.
Remarque: Si le paramètre local DSJobInvocationId est utilisé, cette valeur est transmise en tant que nom de travail dans le tableau de bord des détails du travail.
Règle d'erreur (facultatif) (Facultatif) Remplacer la règle d'erreur par défaut pour le noeud

Paramètres de sortie

Paramètre Descriptif
Travail Chemin d'accès aux résultats du travail DataStage
Exécution de travail Informations sur l'exécution du travail
Nom du travail Nom du travail
Statut de l'exécution Informations sur l'état du travail : en attente, démarrage en cours, en cours d'exécution, terminé, annulé ou échec avec des erreurs
Message d'état Informations sur l'état du travail

Exécuter le travail Data Refinery

Ce noeud exécute un travail Data Refinery spécifié.

Paramètres d'entrée

Paramètre Descriptif
Travail Data Refinery Chemin d'accès au travail Data Refinery .
Environnement Chemin de l'environnement utilisé pour exécuter le travail
Attention: Laissez la zone des environnements telle qu'elle est pour utiliser l'environnement d'exécution par défaut. Si vous choisissez de le remplacer, indiquez un autre environnement pour l'exécution du travail. Assurez-vous que l'environnement que vous spécifiez est compatible avec la langue du composant et la configuration matérielle afin d'éviter une erreur d'exécution.
Règle d'erreur (facultatif) (Facultatif) Remplacer la règle d'erreur par défaut pour le noeud

Paramètres de sortie

Paramètre Descriptif
Travail Chemin d'accès aux résultats du travail Data Refinery
Exécution de travail Informations sur l'exécution du travail
Nom du travail Nom du travail
Statut de l'exécution Informations sur l'état du flux : en attente, démarrage en cours, en cours d'exécution, terminé, annulé ou échec avec des erreurs
Message d'état Informations sur l'état du flux

Exécuter le travail de bloc-notes

Utilisez ces options de configuration pour spécifier comment exécuter un Jupyter Notebook dans un pipeline.

Paramètres d'entrée

Paramètre Descriptif
Travail de bloc-notes Chemin d'accès au travail de bloc-notes.
Environnement Chemin de l'environnement utilisé pour exécuter le bloc-notes.
Attention: Laissez la zone des environnements telle qu'elle est pour utiliser l'environnement par défaut. Si vous choisissez de le remplacer, indiquez un autre environnement pour l'exécution du travail. Assurez-vous que l'environnement que vous spécifiez est compatible avec le langage de bloc-notes et la configuration matérielle pour éviter une erreur d'exécution.
Variables d'environnement (facultatif) Liste des variables d'environnement utilisées pour exécuter le travail de bloc-notes
Règle d'erreur (facultatif) (Facultatif) Remplacer la règle d'erreur par défaut pour le noeud

Remarques :

  • Les variables d'environnement que vous définissez dans un pipeline ne peuvent pas être utilisées pour les travaux de bloc-notes que vous exécutez en dehors des pipelines d'orchestration.
  • Vous pouvez exécuter un bloc-notes à partir d'un package de code dans un package standard.

Paramètres de sortie

Paramètre Descriptif
Travail Chemin d'accès aux résultats du travail de bloc-notes
Exécution de travail Informations sur l'exécution du travail
Nom du travail Nom du travail
Variables de sortie Configurez une paire clé / valeur pour chaque variable personnalisée, puis cliquez sur Ajouter pour remplir la liste des variables dynamiques du noeud
Statut de l'exécution Informations sur l'état de l'exécution : en attente, démarrage en cours, en cours d'exécution, terminé, annulé ou échec avec des erreurs
Message d'état Informations sur l'état de l'exécution du bloc-notes

Exécuter le composant Pipelines

Exécutez un composant de pipeline réutilisable créé à l'aide d'un script Python . Pour plus d'informations, voir Création d'un composant personnalisé.

  • Si un composant de pipeline est disponible, la configuration du noeud présente une liste des composants disponibles.
  • Le composant que vous choisissez spécifie l'entrée et la sortie du noeud.
  • Une fois que vous avez affecté un composant à un noeud, vous ne pouvez plus le supprimer ou le modifier. Vous devez supprimer le noeud et en créer un nouveau.

Exécuter le travail de pipelines

Ajoutez un pipeline pour exécuter un travail de pipeline imbriqué dans le cadre d'un pipeline conteneur. Il s'agit d'un moyen d'ajouter des processus réutilisables à plusieurs pipelines. Vous pouvez utiliser la sortie d'un pipeline imbriqué qui est exécuté en tant qu'entrée pour un noeud dans le pipeline qui le contient.

Paramètres d'entrée

Paramètre Descriptif
Travail de pipelines Sélectionnez ou entrez un chemin d'accès à un travail de pipelines existant.
Environnement (facultatif) Sélectionnez l'environnement dans lequel exécuter le travail Pipelines et affectez des ressources d'environnement.
Attention: Laissez la zone des environnements telle qu'elle est pour utiliser l'environnement d'exécution par défaut. Si vous choisissez de le remplacer, indiquez un autre environnement pour l'exécution du travail. Assurez-vous que l'environnement que vous spécifiez est compatible avec la langue du composant et la configuration matérielle afin d'éviter une erreur d'exécution.
Nom d'exécution du travail (facultatif) Un nom d'exécution de travail par défaut est utilisé sauf si vous le remplacez en spécifiant un nom d'exécution de travail personnalisé. Vous pouvez voir le nom de l'exécution du travail dans le tableau de bord Détails du travail .
Valeurs des paramètres locaux (facultatif) Editez les paramètres de travail par défaut. Cette option est disponible uniquement si vous avez des paramètres locaux dans le travail.
Valeurs des ensembles de paramètres (facultatif) Editez les ensembles de paramètres utilisés par ce travail. Vous pouvez choisir d'utiliser les paramètres tels qu'ils sont définis par défaut ou d'utiliser des ensembles de valeurs à partir des paramètres d'autres pipelines.
Règle d'erreur (facultatif) (Facultatif) Remplacer la règle d'erreur par défaut pour le noeud

Paramètres de sortie

Paramètre Descriptif
Travail Chemin d'accès aux résultats du travail de pipeline
Exécution de travail Informations sur l'exécution du travail
Nom du travail Nom du travail
Statut de l'exécution Renvoie une valeur de : Terminé, Terminé avec des avertissements, Terminé avec des erreurs, Échec ou Annulé
Message d'état Message associé à l'état

Remarques relatives à l'exécution de travaux de pipeline imbriqués

Si vous créez un pipeline avec des pipelines imbriqués et exécutez un travail de pipeline à partir du niveau supérieur, les pipelines sont nommés et sauvegardés en tant qu'actifs de projet qui utilisent cette convention:

  • Le travail de pipeline de niveau supérieur est nommé "Travail d'essai- Identificateur global unique du pipeline".
  • Tous les travaux suivants sont nommés "pipeline_ pipeline guid".

Exécuter le travail SPSS Modeler

Utilisez ces options de configuration pour indiquer comment exécuter un SPSS Modeler dans un pipeline.

Paramètres d'entrée

Paramètre Descriptif
Travail SPSS Modeler Sélectionnez ou entrez un chemin d'accès à un travail SPSS Modeler existant.
Environnement (facultatif) Sélectionnez l'environnement dans lequel exécuter le travail SPSS Modeler et affectez des ressources d'environnement.
Attention: Laissez le champ des environnements tel qu'il est pour utiliser l'environnement d'exécution SPSS Modeler par défaut. Si vous choisissez de le remplacer, indiquez un autre environnement pour l'exécution du travail. Assurez-vous que l'environnement que vous spécifiez est compatible avec la configuration matérielle afin d'éviter une erreur d'exécution.
Valeurs des paramètres locaux Editez les paramètres de travail par défaut. Cette option est disponible uniquement si vous avez des paramètres locaux dans le travail.
Règle d'erreur (facultatif) (Facultatif) Remplacer la règle d'erreur par défaut pour le noeud

Paramètres de sortie

Paramètre Descriptif
Travail Chemin d'accès aux résultats du travail de pipeline
Exécution de travail Informations sur l'exécution du travail
Nom du travail Nom du travail
Statut de l'exécution Renvoie une valeur de : Terminé, Terminé avec des avertissements, Terminé avec des erreurs, Échec ou Annulé
Message d'état Message associé à l'état

En savoir plus

Rubrique parent: Création d'un pipeline

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus