Informazioni sui vari modi di aggiunta e promozione degli asset di dati a uno spazio e sui tipi di dati utilizzati nelle distribuzioni.
I dati possono essere:
- Un file di dati come un file .csv
- Una connessione ai dati ubicati in un repository come un database.
- Dati connessi che si trovano in un bucket di archiviazione. Per ulteriori informazioni, vedi Utilizzo dei dati dal servizio Cloud Object Storage.
Note:
- Per le definizioni di termini relativi ai dati, fare riferimento a Tipi di asset e proprietà.
- È possibile utilizzare i cataloghi inIBM Knowledge Catalog come archivio di funzionalità per accedere a risorse di dati che possono essere condivise all'interno di un'organizzazione. Gli asset di dati includono metadati su dove vengono utilizzati nei modelli. I cataloghi controllano l'accesso a livello di catalogo e di asset di dati.
È possibile aggiungere dati a uno spazio in uno dei seguenti modi:
- Aggiunta di dati e connessioni allo spazio utilizzando l'interfaccia utente
- Promuovere un'origine dati, ad esempio un file o una connessione da un progetto associato
- Salvare un asset di dati in uno spazio in modo programmatico
- Importare uno spazio o un progetto, inclusi gli asset di dati, in uno spazio esistente.
I dati aggiunti a uno spazio sono gestiti in modo simile a quelli aggiunti a un progetto. Ad esempio:
- L'aggiunta di dati a uno spazio crea una nuova copia dell'asset e dei relativi allegati all'interno dello spazio, mantenendo un riferimento all'asset del progetto. Se un asset, come una connessione dati, richiede credenziali di accesso, persistono e sono le stesse se si accede ai dati da un progetto o da uno spazio.
- Proprio come con la connessione dati in un progetto, è possibile modificare i dettagli della connessione dati dallo spazio.
- Gli asset di dati vengono memorizzati in uno spazio nello stesso modo in cui vengono memorizzati in un progetto. Utilizzano la stessa struttura di file per lo spazio della struttura utilizzata per il progetto.
Aggiunta di dati e connessioni allo spazio utilizzando l'interfaccia utente
Per aggiungere dati o connessioni allo spazio utilizzando l'interfaccia utente:
- Nella scheda Asset dello spazio di distribuzione, fare clic su Importa asset.
- Scegliere tra l'aggiunta di asset di dati connessi, asset di catalogo o file di progetto:
- Se si desidera aggiungere un asset di dati connesso, selezionare Dati connessi e scegliere una connessione.
- Se si desidera aggiungere un asset del catalogo, selezionare Asset del catalogo e scegliere un catalogo.
- Se si desidera aggiungere un file di progetto, selezionare File di progetto e scegliere il proprio file di progetto.
- Fare clic su Importa.
L'asset di dati viene visualizzato nello spazio ed è disponibile per l'utilizzo come origine dati di input in un lavoro di distribuzione.
Aggiunta di dati allo spazio in modo programmatico
Se si utilizzano le API per creare, aggiornare o eliminare le risorse di watsonx.ai Runtime, assicurarsi di utilizzare Data and AI Common Core API.
Per un esempio di come aggiungere asset in modo programmatico, fare riferimento a questo notebook di esempio: Utilizzare SPSS e la distribuzione batch con Db2 per prevedere il tasso di abbandono dei clienti
Tipi di riferimento dell'origine dati in watsonx.ai Runtime
I tipi di riferimento dell'origine dati sono referenziati nelle richieste di watsonx.ai Runtime per rappresentare i dati di input e le posizioni dei risultati. Utilizzare data_asset
e connection_asset
per questi tipi di origini dati:
- Cloud Object Storage
- Db2
- Dati database
Note:
- Per Decision Optimization, il tipo di riferimento è
url
.
Payload data_asset di esempio
{"input_data_references": [{
"type": "data_asset",
"connection": {
},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
}
}]
Payload connection_asset di esempio
"input_data_references": [{
"type": "connection_asset",
"connection": {
"id": "<connection_guid>"
},
"location": {
"bucket": "<bucket_name>",
"file_name": "<directory_name>/<file_name>"
}
<other wdp-properties supported by runtimes>
}]
Per ulteriori informazioni, vedere:
- aPI REST del runtime di watsonx.ai
Utilizzo dei dati dal servizio Cloud Object Storage
Il servizio Cloud Object Storage può essere utilizzato con i lavori di distribuzione tramite un asset di dati connesso o un asset di connessione. Per utilizzare i dati dal servizio Cloud Object Storage :
Creare una connessione a IBM Cloud Object Storage una connessione al progetto o allo spazio e selezionando Cloud Object Storage (infrastructure) o Cloud Object Storage come connettore. Fornire la chiave segreta, la chiave di accesso e l'URL di login.
Nota:Quando crei una connessione a Cloud Object Storage o Cloud Object Storage (Infrastruttura), devi specificare sia
access_key
chesecret_key
. Seaccess_key
esecret_key
non sono specificati, il download dei dati da tale connessione non funziona in un lavoro di distribuzione batch. Per riferimento, vedere Connessione aIBM Cloud Object Storage e Connessione aIBM Cloud Object Storage (infrastructure).Aggiungi file di input e output allo spazio di distribuzione come dati connessi utilizzando la connessione Cloud Object Storage che hai creato.
Argomento principale Asset negli spazi di distribuzione