Lorsque vous soumettez un travail, vous pouvez définir les données de sortie que vous souhaitez utiliser et la manière dont vous les collectez (données en ligne ou référencées).
Données en ligne
Vous pouvez définir comment collecter vos données de sortie en tant que données en ligne.
"output_data": [{
"id":"solution.csv"
}]
Données référencées
Lors de l'utilisation de ressources de données ou de connexions pour les données tabulaires, utilisez " .csv
comme extension de l'identifiant de données dans le champ " id
, quel que soit le type de ressource. Le connecteur de données effectue les transformations nécessaires pour que vous puissiez enregistrer les données dans le format cible sans avoir à modifier le format des données. Vous pouvez donc utiliser le même modèle d'Decision Optimization avec de nombreux types et formats de sources de données différents en utilisant un connecteur de données pour référencer vos données. Si vous utilisez d'autres extensions d'identifiant de données, les données sont enregistrées sous la forme d'un fichier binaire de données brutes sans aucune transformation.
- Actifs de données
- Vous pouvez utiliser les références des biens de données pour localiser tout bien de données présent dans votre espace et bénéficier des capacités d'intégration des connecteurs de données.Vous pouvez spécifier l'emplacement de la sortie en utilisant un "
href
, si le bien existe déjà dans l'espace, et le bien est mis à jour. Exemple :
Vous pouvez également créer un bien en spécifiant le nom du bien et une description. Cet exemple crée le bien ""location": { "href": "/v2/assets/<ASSET_ID>?space_id=<SPACE_ID>" }
solution.csv
."location": { "name": "solution.csv", "description": "solution description" }
Cet exemple définit des références de données de sortie pour mettre à jour un bien de données dans un espace.
output_data_references": [{ "type": "data_asset", "id" : "solution.csv", "connection": {}, "location": { "href": "/v2/assets/<ASSET_ID>?space_id=<SPACE_ID>" } }]
Vous pouvez également enregistrer vos données de sortie sous la forme d'une ressource portant un nom différent en utilisant le champ "name
. Cet exemple crée un bien de sortie nommé "my_solution.csv
dans l'espace courant."output_data_references": [{ "type" : "data_asset", "id" : "solution.csv", "connection": {}, "location": { "name": "my_solution.csv" } }]
Cet exemple vous montre comment enregistrer un fichier Microsoft Excel dans un espace.
"output_data_references": [{ "type": "data_asset", "id": "kpis.csv", "connection": {}, "location": { "id": "<SPACE_ID>" "name": "kpis.xlsx" } }]
Vous pouvez également utiliser une expression régulière comme identifiant. Pour plus d'informations, voir Regexp.
- Actifs de connexion
- Vous pouvez utiliser des actifs de connexion pour référencer n'importe quelles données et vous référer ensuite à la connexion sans avoir à spécifier les informations d'identification à chaque fois. Le référencement d'une connexion sécurisée sans avoir à utiliser des informations d'identification en ligne dans le contenu renforce également la sécurité. Vous pouvez utiliser le
id
pour identifier les connexions. Exemple :"output_data_references": [{ "type": "connection_asset", "id": "solution.csv", "connection": { "id" : "<CONNECTION_ID>", } "location": { <data-connector interaction properties depending on connection type> } }]
Le
<CONNECTION_ID>
est l'identifiant unique d'une connexion. Vous pouvez trouver cet identifiant lorsque vous avez créé une connexion et que vous modifiez ensuite la connexion dans votre projet. L'identifiant est visible dans l'URL de la fenêtre Editer la connexion.Pour plus d'informations sur les définitions de tâches, voir Définitions des tâches de déploiement.
Vous pouvez spécifier les propriétés d'interaction requises pour la connexion dans le champ "
location
Cet exemple se connecte à un seau COS/S3. Les propriétés d'interaction sont indiquées dans le champ "location
"location": { "file_name" : "<FILENAME>", "bucket" : "<BUCKET_NAME>" }
Cet exemple se connecte à une ressource Db2. Les propriétés d'interaction sont indiquées dans le champ "Cet exemple se connecte à un seau COS/S3. La référence de la connexion est indiquée dans le champ "location
"location": { "table_name" : "<TABLE_NAME>", "schema_name" : "<SCHEMA_NAME>" }
id
."output_data_references": [{ "type": "connection_asset", "id": "diet_food.csv", "connection": { "id" : "<CONNECTION_ID>" }, "location": { "file_name" : "<FILENAME>", "bucket" : "<BUCKET_NAME>" } }]
Cet exemple vous montre comment enregistrer un fichier Microsoft Excel dans un godet COS/S3."output_data_references": [{ "type": "kpis.csv", "id": "kpis.csv", "connection": { "id" : "<CONNECTION_ID>" }, "location": { "file_name" : "<kpis.xlsx>", "bucket" : "<BUCKET_NAME>" } }]
Cet exemple vous montre comment vous connecter à un poste Db2. La référence de la connexion est indiquée dans le champ "id
."output_data_references": [{ "type" : "connection_asset", "id" : "solution.csv", "connection" : { "id" : "<CONNECTION_ID>" }, "location" : { "table_name" : "<TABLE_NAME>", "schema_name" : "<SCHEMA_NAME>" } }]
Pour plus d'informations sur les propriétés d'interaction que vous pouvez utiliser dans le champ
location
, voir Connexions de plate-forme dans le menu principal. Sur la page Connexions, sélectionnez Ressources de connexion > Propriétés de connexion. Sélectionnez ensuite l'onglet Propriétés d'interaction > En tant que cible pour le connecteur concerné. Vous devrez peut-être créer un Platform assets catalog.Pour plus d'informations sur les différentes connexions disponibles pour l' Decision Optimization, voir Sources de données prises en charge dans l'Decision Optimization
- Données référencées par URL
- Vous pouvez utiliser des données référencées par URL pour stocker des données à une URL particulière.Cet exemple utilise la commande
PUT
pour placer le fichier de sortiesolution.csv
sur le serveur."output_data_references": { "type": "url", "id": "solution.csv", "connection": { "verb": "PUT", "url": "https://myserver.com/diet_food.csv", "headers": { "Content-Type": "application/x-www-form-urlencoded" } }, "location": {} }
Expression régulière
Regexp
comme identifiant pour tous les types de sorties. Par exemple, pour collecter tous les fichiers de sortie .csv
:"id":".*\\.csv"
"id":".*"
Vous pouvez utiliser un " Regexp
comme identificateur et le combiner avec les supports " ${oaas_job_id}
et " ${oaas_attachment_name}
dans le " name
, afin de créer une ressource de sortie à chaque fois que le travail est exécuté."output_data_references": [{
"type" : "data_asset",
"id" : ".*",
"connection": {
"href" : "/v2/connections/<CONNECTION_ID>?space_id=><SPACE_ID>"
},
"location": {
"name" : "${oaas_job_id}_${oaas_attachment_name}"
}
}]
solution.csv
est généré en sortie, ce fichier est enregistré dans un dossier portant le même nom que le numéro de travail."output_data_references": [{
"type" : "connection_asset",
"id" : ".*",
"connection": {
"id" : "<CONNECTION_ID>"
},
"location": {
"bucket" : "<BUCKET_NAME>",
"file_name": "${oaas_job_id}/${oaas_attachment_name}"
}
}]
Vous pouvez combiner différents types de données dans la même demande. Pour plus d'informations sur les définitions de données, voir Ajouter des données à un projet d'analyse.