Retourner à la version anglaise de la documentationDétails de l'entrée de déploiement par lots pour les scripts Python
Détails de l'entrée de déploiement par lots pour les scripts Python
Dernière mise à jour : 28 nov. 2024
Suivez ces règles lorsque vous spécifiez les détails d'entrée pour les déploiements par lots de scripts Python .
Tableau récapitulatif du type de données :
Données | Descriptif |
---|---|
Type | Références de données |
Formats de fichier | Tous |
Sources de données
Références de données d'entrée ou de sortie:
- Actifs locaux ou gérés de l'espace
- Actifs connectés (distants) : Cloud Object Storage.
Remarques :
- Pour les connexions de type Cloud Object Storage ou Cloud Object Storage(infrastructure), vous devez configurer la clé d'accès et la clé secrète, également connues sous le nom d'informations d'identification HMAC.
Si vous spécifiez des références de données d'entrée/sortie programmatiquement :
- La référence de la source de données
type
dépend du type d'actif. Pour plus d'informations, voir la section Types de référence de source de données dans Ajout d'actifs de données à un espace de déploiement. - Vous pouvez spécifier les variables d'environnement requises pour l'exécution du script Python sous forme de paires
'key': 'value'
dansscoring.environment_variables
.key
doit être le nom d'une variable d'environnement etvalue
doit être la valeur correspondante de la variable d'environnement. - Le contenu du travail de déploiement est sauvegardé en tant que fichier JSON dans le conteneur de déploiement où vous exécutez le script Python . Le script Python peut accéder au nom de fichier de chemin d'accès complet du fichier JSON qui utilise la variable d'environnement
JOBS_PAYLOAD_FILE
. - Si les données d'entrée sont référencées en tant qu'actif de données local ou géré, le service de déploiement télécharge les données d'entrée et les place dans le conteneur de déploiement où vous exécutez le script Python . Vous pouvez accéder à l'emplacement (chemin) des données d'entrée téléchargées via la variable d'environnement
BATCH_INPUT_DIR
. - Pour les références de données d'entrée (actif de données ou actif de connexion), le téléchargement des données doit être géré par le script Python . Si un actif de données connecté ou un actif de connexion est présent dans le contenu des travaux de déploiement, vous pouvez y accéder à l'aide de la variable d'environnement
JOBS_PAYLOAD_FILE
qui contient le chemin d'accès complet au contenu du travail de déploiement sauvegardé en tant que fichier JSON. - Si les données de sortie doivent être conservées en tant qu'actif de données local ou géré dans un espace, vous pouvez spécifier le nom de l'actif à créer dans
scoring.output_data_reference.location.name
. Dans le cadre d'un script Python , les données de sortie peuvent être placées dans le chemin spécifié par la variable d'environnementBATCH_OUTPUT_DIR
. Le service de déploiement compresse les données au format de fichier compressé et les télécharge à l'emplacement spécifié dansBATCH_OUTPUT_DIR
. - Ces variables d'environnement sont définies en interne. Si vous essayez de les définir manuellement, vos valeurs sont remplacées:
BATCH_INPUT_DIR
BATCH_OUTPUT_DIR
JOBS_PAYLOAD_FILE
- Si les données de sortie doivent être sauvegardées dans un magasin de données distant, vous devez spécifier la référence de la référence de données de sortie (par exemple, un actif de données ou un actif de données connecté) dans
output_data_reference.location.href
. Le script Python doit s'occuper du téléchargement des données de sortie vers la source de données distante. Si un actif de données connecté ou une référence d'actif de connexion est présente dans le contenu des travaux de déploiement, vous pouvez y accéder à l'aide de la variable d'environnementJOBS_PAYLOAD_FILE
, qui contient le chemin d'accès complet au contenu du travail de déploiement sauvegardé en tant que fichier JSON. - Si le script Python ne requiert pas que des références de données d'entrée ou de sortie soient spécifiées dans le contenu du travail de déploiement, ne fournissez pas les objets
scoring.input_data_references
etscoring.output_data_references
dans le contenu.
En savoir plus
Déploiement de scripts dans watsonx.ai Runtime.
Rubrique parent : Détails des entrées de déploiement par lots par structure