0 / 0
Torna alla versione inglese della documentazione
Tipi di asset e proprietà
Tipi di asset e proprietà

Tipi di asset e proprietà

Un asset è un elemento che contiene metadati relativi ai dati, altri tipi di informazioni o codice operativo. Si lavora con le risorse in tutta la piattaforma Cloud Pak for Data , inclusi i principali spazi di lavoro: progetti, cataloghi e spazi di distribuzione.

Per comprendere gli asset, è necessario conoscere i diversi tipi di asset, le relative proprietà e dove è possibile trovarli:

Aree di lavoro per asset

È possibile trovare qualsiasi asset in uno qualsiasi degli spazi di lavoro per cui si è collaboratori ricercandolo dalla barra di ricerca globale. Consultare Ricerca di asset nella piattaforma.

Le operazioni che è possibile eseguire con gli asset dipendono dal tipo di asset e dal tipo di spazio di lavoro.

Progetti Dove si collabora con altri per gestire i dati. Ad esempio, è possibile preparare dati, analizzare dati o creare modelli nei progetti. È possibile creare tutti i tipi di asset nei progetti ed eseguire asset operativi. Vedere Progetti.

Cataloghi Dove si memorizzano le risorse da condividere con la propria organizzazione. È possibile copiare le risorse dai cataloghi nei progetti per utilizzarle oppure pubblicare le risorse dai progetti nel catalogo. È possibile pubblicare tutti i tipi di asset di dati e alcuni tipi di asset operativi in un catalogo. È possibile modificare i metadati dell'asset in un catalogo, ma non è possibile eseguire asset operativi. Vedere Cataloghi.

Spazi di distribuzione Il punto in cui si distribuiscono i modelli o altri asset in produzione. Copiare gli asset distribuibili dai progetti negli spazi di distribuzione e quindi creare le distribuzioni da tali asset. Vedere Spazi di distribuzione.

Data virtualization Dove si creano tabelle virtuali combinando o segmentando una o più tabelle. Le tabelle virtuali vengono pubblicate come asset di dati in un catalogo. Vedere Virtualizzazione dei dati.

Asset di dati

Gli asset di dati contengono metadati relativi ai dati, incluso come accedere ai dati.

Il modo in cui si crea un asset di dati dipende da dove si trovano i dati:

  • Se i tuoi dati si trovano in un file, lo carichi dal tuo sistema locale in un progetto, catalogo o spazio di distribuzione.
  • Se i dati si trovano in un'origine dati remota, si crea innanzitutto un asset di connessione che definisce la connessione a tale origine dati. Quindi, creare un asset di dati selezionando la connessione, il percorso o un'altra struttura e la tabella o il file che contiene i dati. Questo tipo di asset di dati è denominato asset di dati connesso.

Il seguente grafico illustra il modo in cui gli asset di dati da file puntano a file caricati in IBM Cloud e gli asset di dati connessi richiedono un asset di connessione e puntano a dati in una origine dati remota.

Questo grafico mostra che gli asset di dati dal punto file ai file caricati e gli asset di dati connessi richiedono un asset di collegamento e un punto ai dati in un'origine dati remota.

Asset di dati da un file Un asset di dati da un file punta a un file caricato dal sistema locale. Il file viene memorizzato nel contenitore di archiviazione oggetti sull'istanza di IBM Cloud Object Storage associata al progetto, catalogo o spazio di distribuzione. Il contenuto del file può includere dati strutturati, dati di testo non strutturato, immagini e altri tipi di dati. È possibile creare un asset di dati con un file di qualsiasi formato. Tuttavia, è possibile eseguire più azioni sui file CSV rispetto ad altri tipi di file.

Asset dati connessi Un asset di dati connesso fa riferimento a una tabella, un file o una cartella a cui si accede tramite una connessione a un'origine dati remota. La connessione è definita nell'asset di connessione associato all'asset di dati connesso. Quando si accede a un asset di dati connesso, i dati vengono richiamati dinamicamente dall'origine dati.

Un asset di dati cartella è un caso speciale di un asset di dati connesso. Punta a una cartella in IBM Cloud Object Storage. Creare un asset di dati della cartella specificando il percorso della cartella e l'asset di connessione IBM Cloud Object Storage . È possibile visualizzare i file e le cartelle secondarie che condividono il percorso con l'asset di dati della cartella. I file che è possibile visualizzare all'interno dell'asset di dati della cartella non sono essi stessi asset di dati. Ad esempio, è possibile creare un asset di dati cartella per un percorso che contiene feed di notizie continuamente aggiornati.

Asset di collegamento Un asset di connessione è considerato un tipo di asset di dati. Contiene le informazioni necessarie per creare una connessione a un'origine dati. È possibile scegliere di fornire credenziali condivise per tutti gli utenti che hanno accesso all'asset di connessione da utilizzare oppure è possibile specificare che ogni utente deve immettere le proprie credenziali personali quando utilizza la connessione. I progetti e i cataloghi supportano molti tipi di connessione sia a IBM che a origini dati di terzi.

Consultare Aggiunta di dati a un progetto, Aggiunta di asset a un catalogoe Aggiunta di asset di dati a uno spazio di distribuzione.

Asset operativi

Gli asset operativi sono il modo in cui si utilizzano i dati nei progetti utilizzando strumenti che preparano i dati, analizzano i dati o creano modelli. Creare asset operativi con strumenti nei progetti. Ad esempio, un notebook Jupyter è un asset operativo che è possibile creare con lo strumento editor notebook per analizzare i dati.

Esecuzione degli asset operativi

Quando si eseguono asset operativi, si utilizzano le risorse di calcolo. Le risorse di calcolo vengono misurate in CUH (capacity unit hours) e vengono tracciate. A seconda dei piani per i tuoi servizi, puoi avere una quantità limitata di CUH al mese o incorrere in costi aggiuntivi se superi una quantità impostata di CUH al mese.

Per molti asset operativi, è possibile scegliere la configurazione dell'ambiente di elaborazione da utilizzare. In genere, le configurazioni di ambiente più grandi e più veloci consumano le risorse di elaborazione più velocemente. Vedere Ambienti.

Ogni volta che si esegue un asset operativo, viene considerato un lavoro. È possibile monitorare e pianificare i lavori. Vedere Lavori.

Tipi di attività operative

Molti asset operativi sono forniti dai principali servizi. Tuttavia, alcuni asset operativi richiedono altri servizi.

È possibile creare questi tipi di asset operativi senza ulteriori servizi:

Questi asset operativi richiedono altri servizi. Puoi eseguire il provisioning di ciascun servizio quando crei il primo asset che ne ha bisogno:

  • DataStage fluisce per creare job di trasformazione dati con lo strumento DataStage . Richiede il servizio DataStage .
  • Dashboard per visualizzare i dati senza codice nell'editor Dashboard. Richiede il servizio Cognos Dashboards .
  • Regole di qualità dei dati per eseguire l'analisi della qualità dei dati. Richiede il servizio DataStage .

Se hai il servizio Watson Knowledge Catalog senza Watson Studio, puoi creare i flussi Data Refinery , gli asset di importazione dei metadati e gli asset di arricchimento dei metadati.

Asset di configurazione

Gli asset di configurazione sono modelli riutilizzabili nei progetti per configurare altri asset o job.

Con il servizio DataStage , puoi creare questi tipi di asset di configurazione:

  • DataStage per raccogliere una serie di stage e connettori da riutilizzare nei flussi DataStage .
  • Definizioni dei dati per specificare i metadati di colonna di un asset di dati da riutilizzare nei job di flusso DataStage .
  • Serie di parametri per raccogliere più parametri del job con valori specificati da riutilizzare nei job.

È possibile creare definizioni di qualità dei dati da cui creare regole di qualità dei dati.

Asset descrittivi

Gli asset descrittivi descrivono la struttura dei report di business o dei modelli di dati gestiti in strumenti esterni e trasformazioni di dati.

Copybook Cobol

I copybook Cobol descrivono la struttura dei dati di un programma COBOL. Non possono essere profilati, arricchiti tramite l'arricchimento dei metadati o utilizzati in data refinery.

Proprietà, metadati e relazioni dell'asset

Tutti gli asset hanno metadati comuni che sono visibili ovunque. Le altre proprietà dell'asset variano in base al tipo di asset e a dove si trova l'asset.

Proprietà comuni

Tutti gli asset hanno proprietà comuni visibili e modificabili in progetti, cataloghi e spazi di distribuzione.

Nome Può contenere fino a 100 caratteri. Supporta caratteri multibyte. Non può essere vuoto, contenere caratteri di controllo Unicode o contenere solo spazi vuoti. Non è necessario che i nomi asset siano univoci all'interno di un progetto o di un spazio di distribuzione. Se i nomi asset devono essere univoci in un catalogo dipende dal metodo di gestione duplicato impostato per il catalogo.

Descrizione Facoltativo. Può contenere fino a 245 caratteri, esclusi gli spazi vuoti. Supporta collegamenti ipertestuali e caratteri multibyte.

I metadati generati o rilevati automaticamente possono includere altre informazioni, a seconda del tipo di asset, ad esempio, data aggiunta, dimensione, creato da, ultimo editor, ultima modifica, pianificato, condiviso, lingua, tipo di modello e stato.

Alcuni tipi di asset possono avere tag, che sono metadati non governati che rendono più semplice la ricerca dell'asset. I tag possono contenere solo spazi vuoti, lettere, caratteri multibyte, numeri, caratteri di sottolineatura, trattini e i simboli # e @. I collaboratori dello spazio di distribuzione, del catalogo o del progetto con il ruolo di amministratore o editor possono creare tag e aggiungerli agli asset.

Ulteriori informazioni per gli asset

Gli asset possono avere più proprietà, relazioni e metadati.

Riservatezza asset Impostare su pubblico per impostazione predefinita. Questa impostazione può limitare l'accesso a un asset in un catalogo quando è impostato su privato. Solo il proprietario e i membri dell'asset possono visualizzare e utilizzare asset privati.

Proprietario asset e membri asset Per impostazione predefinita, il proprietario asset è l'utente che ha aggiunto l'asset al catalogo. I membri dell'asset possono visualizzare e utilizzare l'asset quando è contrassegnato come privato.

Risorse di governance Può essere assegnato automaticamente, dal proprietario dell'asset o dagli steward di dati. Le risorse di governance possono aggiungere metadati e relazioni agli asset o mascherare i dati sensibili all'interno degli asset di dati. In generale, queste informazioni sono disponibili nei cataloghi. Per alcuni tipi di asset, queste informazioni sono disponibili anche nei progetti.

Proprietà personalizzate Facoltativo. Le proprietà personalizzate vengono visualizzate nella sezione Dettagli nella scheda Panoramica dell'asset nel catalogo. È possibile creare proprietà personalizzate per gli asset. Consultare Proprietà e relazioni personalizzate per risorse utente del glossario e risorse del catalogo.

Relazioni Facoltativo. Può essere tra asset nello stesso spazio di lavoro o in spazi di lavoro differenti. Ad esempio, è possibile aggiungere una relazione tra un asset in un catalogo e un asset in un progetto. Gli amministratori possono creare relazioni personalizzate per gli asset. Consultare la sezione Aggiunta di relazioni asset.

Anteprima asset Un' anteprima di un asset. Il contenuto visualizzato in un'anteprima dipende dal tipo di asset, file o dati.

Recensioni e valutazioni Tutti i collaboratori del catalogo possono valutare ed esaminare gli asset.

Ulteriori informazioni per gli asset di dati

A seconda del formato dei dati negli asset di dati, è possibile visualizzare ulteriori informazioni quando si apre l'asset.

Il percorso dei dati Le informazioni necessarie per accedere ai dati. Un asset di dati connesso per una tabella in un database ha un riferimento all'asset di connessione per il database, lo schema o altre informazioni sul percorso e il nome della tabella. Un asset di dati per un file di caricamento ha un riferimento all'ubicazione del file nel contenitore di archiviazione oggetti per il progetto, il catalogo o lo spazio di distribuzione.

Formato file Il tipo MIME di un file. Rilevato automaticamente.

Profilo dati Un profilo dei dati, per i dati provenienti da origini dati relazionali e non relazionali e per i file CSV, TSV, Avro, Parquet, Microsoft Word, Microsoft Excel (solo il primo foglio di una cartella di lavoro), PDF, testo e HTML.

Attività La cronologia delle attività eseguite sull'asset nei progetti e nei cataloghi catalogs.Whether è possibile visualizzare le attività dipende dal piano dell'offerta Watson Knowledge Catalog.

Ulteriori informazioni

Argomento principale: Panoramica di IBM Cloud Pak for Data as a Service