0 / 0
Torna alla versione inglese della documentazione
Tipi di asset e proprietà
Tipi di asset e proprietà

Tipi di asset e proprietà

Un asset è un articolo che contiene metadati relativi a dati, altri tipi di informazioni o codice operativo. Si lavora con gli asset in tutta la piattaforma Cloud Pak for Data , inclusi i principali spazi di lavoro: progetti, cataloghi e spazi di distribuzione.

Per comprendere gli asset, devi conoscere i diversi tipi di asset, le loro proprietà e dove li trovi:

Spazi di lavoro per gli asset

È possibile trovare qualsiasi asset in qualsiasi degli spazi di lavoro per cui si è collaboratore ricercandolo dalla barra di ricerca globale. Consultare Ricerca di asset su tutta la piattaforma.

Quello che si può fare con gli asset dipende dal tipo di asset e dal tipo di spazio di lavoro.

Progetti Dove si collabora con gli altri per lavorare con i dati. Ad esempio, è possibile preparare i dati, analizzare i dati o creare modelli in progetti. È possibile creare tutti i tipi di asset in progetti e si possono eseguire asset operativi. Vedere Progetti.

Cataloghi Dove si memorizzano asset da condividere con la propria organizzazione. È possibile copiare asset dai cataloghi in progetti per lavorare con loro, oppure pubblicare asset da progetti nel catalogo. È possibile pubblicare tutti i tipi di asset dati e alcuni tipi di asset operativi in un catalogo. È possibile modificare i metadati di asset in un catalogo, ma non si possono eseguire asset operativi. Consultare Cataloghi.

Spazi di distribuzione Dove si distribuiscono modelli o altri asset in produzione. Copiare asset distribuibili da progetti in spazi di distribuzione e quindi creare distribuzioni da tali asset. Vedere spazi di distribuzione.

Data virtualization Dove si creano tabelle virtuali combinando o segmentando una o più tabelle. Si pubblicano tabelle virtuali come asset dati in un catalogo. Vedere Virtualizzare i dati.

Asset di dati

Gli asset di dati contengono metadati relativi ai dati, tra cui come accedere ai dati.

Come si crea un asset di dati dipende da dove i tuoi dati sono:

  • Se i tuoi dati sono in un file, caricati il file dal tuo sistema locale in un progetto, un catalogo o uno spazio di distribuzione.
  • Se i tuoi dati si trovano in un'origine dati remota, si crea per la prima volta un asset di connessione che definisce la connessione a quella data source. Poi si crea un asset dati selezionando la connessione, il percorso o altra struttura e la tabella o il file che contiene i dati. Questo tipo di asset di dati si chiama asset data connesso.

Tipi di asset di dati

Data asset da un file Un asset di dati da un file punta ad un file caricato dal tuo sistema locale. Il file viene memorizzato nel contenitore di archiviazione oggetti sull'istanza IBM Cloud Object Storage associata al progetto, al catalogo o allo spazio di distribuzione. Il contenuto del file può includere dati strutturati, dati testuali non strutturati, immagini e altri tipi di dati. È possibile creare un asset di dati con un file di qualsiasi formato. Tuttavia, è possibile effettuare più azioni su file CSV rispetto ad altri tipi di file.

Asset dati connessi Un asset di dati connesso a una tabella, file o cartella a cui si accede tramite una connessione ad una sorgente di dati remota. La connessione è definita nell'asset di connessione che è associata all'asset di dati connesso. Quando si accede ad un asset di dati connesso, i dati vengono richiamati dinamicamente dall'origine dati.

Un asset data cartella è un caso particolare di un asset di dati connesso. Punta ad una cartella in IBM Cloud Object Storage. Si crea un asset data cartella specificando il percorso nella cartella e il asset di connessione IBM Cloud Object Storage . È possibile visualizzare i file e le sottocartelle che condividono il percorso con l'asset data cartella. I file che è possibile visualizzare all'interno dell'asset data cartella non sono essi stessi asset di dati. Ad esempio, è possibile creare un asset data cartella per un percorso che contiene feed di notizie continuamente aggiornati.

Asset di connessione Un asset di connessione è considerato un tipo di asset di dati. Contiene le informazioni necessarie per creare una connessione ad una fonte di dati. È possibile scegliere di fornire credenziali condivise per tutti gli utenti che hanno accesso all'asset di connessione da utilizzare o è possibile specificare che ogni utente deve inserire le proprie credenziali personali quando utilizza la connessione. I progetti e i cataloghi supportano molti tipi di connessione sia a IBM che a fonti di dati di terza parte.

Consultare Aggiunta di dati a un progetto, Aggiunta di asset a un catalogoe Aggiunta di asset di dati a uno spazio di distribuzione.

Asset operativi

Gli asset operativi sono come si lavora con i dati nei progetti utilizzando strumenti che preparano i dati, analizzano i dati o costruiscono modelli. Si creano asset operativi con strumenti in progetti. Ad esempio, un notebook Jupyter è un asset operativo che è possibile creare con lo strumento dell'editor dei notebook per analizzare i dati.

Esecuzione degli asset operativi

Quando si eseguono asset operativi, si utilizzano risorse compatte. Le risorse di calcolo sono misurate in ore di unità di capacità (CUH) e sono tracciate. A seconda dei piani per i tuoi servizi, puoi avere una quantità limitata di CUH al mese, oppure incur extra se superi una quantità impostata di CUH al mese.

Per molti asset operativi, si ha una scelta della configurazione dell'ambiente di elaborazione da utilizzare. Generalmente le configurazioni di ambiente più grandi e più veloci consumano risorse compatte più velocemente. Vedere Ambienti.

Ogni volta che gesti un asset operativo, è considerato un lavoro. È possibile monitorare e pianificare i lavori. Vedere Lavori.

Tipi di attività operative

Molti asset operativi sono forniti dai servizi core. Tuttavia, alcune attività operative richiedono altri servizi.

È possibile creare questi tipi di asset operativi senza ulteriori servizi:

Questi asset operativi richiedono altri servizi. È possibile fornire ogni servizio quando si crea il primo asset che ne ha bisogno:

  • DataStage flussi per creare lavori di trasformazione dei dati con lo strumento DataStage . Richiede il servizio DataStage .
  • Dashboard per visualizzare i dati senza codice nell'editor Dashboard. Richiede il servizio Cognos Dashboards .

Se si dispone del servizio Watson Knowledge Catalog senza Watson Studio, è possibile creare flussi Data Refinery , asset import metadati e asset di arricchimento dei metadati.

Asset di configurazione

Gli asset di configurazione sono modelli riutilizzabili in progetti per configurare altri asset o lavori.

Con il servizio DataStage è possibile creare questi tipi di asset di configurazione:

  • DataStage subflussi per raccogliere una serie di stage e connettori da riutilizzare nei flussi DataStage .
  • definizioni dati per specificare i metadati della colonna di un asset di dati da riutilizzare nei lavori di flusso DataStage .
  • Serie di parametri per raccogliere più parametri di lavoro con valori specificati da riutilizzare nei lavori.

Proprietà patrimoniali, metadati e relazioni

Tutti gli asset hanno metadati comuni visibili ovunque. Altre proprietà patrimoniali variano per tipologia di asset e dove si trova l'asset.

Proprietà comuni

Tutti gli asset hanno proprietà comuni visibili e modificabili in progetti, cataloghi e spazi di distribuzione.

Nome Può contenere fino a 100 caratteri. Supporta caratteri multibyte. Non può essere vuoto, contenere caratteri di controllo Unicode o contenere solo spazi vuoti. I nomi di asset non devono essere univmi all'interno di uno spazio di progetto o di distribuzione. Se i nomi di asset devono essere univomi in un catalogo dipende dal metodo di gestione duplicato impostato per il catalogo.

Descrizione Optional. Può contenere fino a 245 caratteri, non compresi spazi vuoti. Supporta caratteri multibyte e collegamenti ipertestati.

I metadati generati o rilevati automaticamente possono includere altre informazioni, a seconda del tipo di asset, ad esempio, data aggiunta, dimensione, creata da, ultimo editor, ultima modifica, pianificata, condivisa, lingua, tipo di modello e stato.

Alcuni tipi di asset possono avere tag, che sono metadati non governati che rendono più semplice la ricerca dell'asset. I tag possono contenere solo spazi vuoti, lettere, caratteri multibyte, numeri, sottolineature, trattini e i simboli # e @. I collaboratori del progetto, del catalogo o dello spazio di distribuzione con il ruolo admin o editor possono creare tag e aggiungerli agli asset.

Maggiori informazioni per gli asset

Gli asset possono avere più proprietà, relazioni e metadati.

Privacy asset Imposta al pubblico per impostazione predefinita. Questa impostazione può limitare l'accesso a un asset in un catalogo quando è impostato su privato. Solo il proprietario e i membri del bene possono visualizzare e utilizzare gli asset privati.

proprietario asset e membri asset Per impostazione predefinita, l'asset proprietario è l'utente che ha aggiunto l'asset al catalogo. I membri dell'asset possono visualizzare e utilizzare l'asset quando è marcato privato.

Artefatti di governance Può essere assegnato automaticamente, dal proprietario dell'asset o dagli steward dati. Gli artefatti di governance possono aggiungere metadati e relazioni agli asset, oppure mascherare i dati sensibili all'interno degli asset dati. In generale, queste informazioni sono disponibili nei cataloghi. Per alcuni tipi di asset, queste informazioni sono disponibili anche nei progetti.

attributi personalizzati Optional. Gli attributi personalizzati vengono mostrati nella sezione Dettagli nella scheda Panoramica dell'asset nel catalogo. È possibile creare attributi personalizzati per gli asset con le API.

Anteprima asset A anteprima di un asset. Il contenuto che si vede in un'anteprima dipende dal tipo di asset, file o dati.

Recensioni e abilitazioni Tutti i collaboratori del catalogo possono valutare e rivedere gli asset.

Maggiori informazioni per gli asset dati

A seconda del formato dei dati in asset dati, si visualizzano maggiori informazioni quando si apre l'asset.

Il percorso dei dati Le informazioni necessarie per accedere ai dati. Un asset di dati connesso per una tabella in un database ha un riferimento all'asset di connessione per il database, allo schema o ad altre informazioni di percorso e al nome della tabella. Un asset di dati per un file di upload ha un riferimento all'ubicazione del file nel contenitore di archiviazione oggetti per il progetto, il catalogo o lo spazio di distribuzione.

Formato file Il tipo MIME di un file. Rilevato automaticamente.

Profilo dati Un profilo dei dati, per i dati provenienti da fonti di dati relazionali così come per CSV, TSV, Avro, Parquet, Microsoft Word, Microsoft Excel (solo il primo foglio in un workbook), PDF, testo e file HTML.

Attività La cronologia di attività eseguita sull'asset in progetti e cataloghi. Che tu possa visualizzare le attività dipende dal tuo Watson Knowledge Catalog piano di offerta.

Ulteriori informazioni

Argomento principale: Panoramica di IBM Cloud Pak for Data as a Service