Tipi di asset e proprietà
La piattaforma fornisce spazi di lavoro e strumenti collaborativi e l'utente fornisce il contenuto alla piattaforma, sotto forma di asset. Un asset è un elemento che contiene informazioni sui dati, altre informazioni preziose o codice che funziona con i dati.
Aggiungere gli asset importandoli o creandoli con gli strumenti. Si lavora con gli asset negli spazi di collaborazione. Lo spazio di lavoro che si utilizza dipende dalle attività.
Progetti Dove collaborare con altri per lavorare con i dati e creare asset. La maggior parte degli strumenti si trova nei progetti e si eseguono asset che contengono codice nei progetti. Ad esempio, è possibile importare dati, preparare dati, analizzare dati o creare modelli nei progetti. Vedere Progetti.
Cataloghi Dove si memorizzano le risorse da condividere con l'organizzazione o per trovare le risorse con cui è necessario lavorare. È possibile copiare gli asset dai cataloghi nei progetti o pubblicare gli asset dai progetti nel catalogo. È possibile modificare le proprietà dell'asset e i metadati in un catalogo, ma non è possibile eseguire gli asset. Vedere Cataloghi.
Spazi di distribuzione Dove si distribuiscono ed eseguono gli asset pronti per il test o la produzione. Si spostano gli asset dai progetti negli spazi di distribuzione e quindi si creano le installazioni da tali asset. Le distribuzioni vengono monitorate e aggiornate in base alle esigenze. Vedere Spazi di distribuzione.
È possibile trovare qualsiasi asset in uno qualsiasi degli spazi di lavoro per cui si è collaboratori ricercandolo dalla barra di ricerca globale. Consultare Ricerca di asset nella piattaforma.
È possibile creare diversi tipi di asset, ma tutti gli asset hanno alcune proprietà comuni:
Tipi di asset
Per creare la maggior parte dei tipi di asset, è necessario utilizzare uno strumento specifico. La maggior parte degli strumenti sono forniti da uno o più servizi. Gli strumenti per creare asset di dati e asset di connessione sono forniti dalla piattaforma e non richiedono alcun servizio specifico.
Per visualizzare quali servizi sono necessari per quali strumenti, aprire la mappa di strumenti e servizi.
La seguente tabella elenca i tipi di asset che è possibile creare, gli strumenti necessari per crearli e gli spazi di lavoro in cui è possibile aggiungerli.
Tipo di asset | Descrizione | Strumenti per crearlo | Spazi di lavoro |
---|---|---|---|
Esperimento AutoAI | Genera automaticamente le pipeline del modello predittivo candidato. | AutoAI | Progetti |
Quaderno COBOL | Visualizza i metadati della mappa per gli asset di dati connessi dai computer mainframe z/OS . | Strumento Metadata import | Progetti, cataloghi |
Asset di dati connesso | Rappresenta i dati a cui si accede tramite una connessione a un'origine dati remota. | Strumento dati connessi, strumento Metadata import | Progetti, Cataloghi, Spazi |
Connessione | Contiene le informazioni per connettersi a un'origine dati. | Strumento di connessione | Progetti, Cataloghi, Spazi |
Asset di dati da file | Rappresenta un file caricato dal sistema locale. | Riquadro di caricamento | Progetti, Cataloghi, Spazi |
Flusso Data Refinery | Prepara i dati. | Data Refinery | Progetti, spazi |
Flusso Data Replication | Replica i dati. | Data Replication | Progetti, cataloghi |
Definizione della qualità dei dati | Definisce un componente logico della regola riutilizzabile per le regole di qualità dei dati. | Editor di definizione della qualità dei dati | Progetti, cataloghi |
Regola di qualità dei dati | Valuta la qualità dei dati per condizioni specifiche. | Editor regola di qualità dei dati | Progetti |
DataStage definizione dei dati | Definisce un componente metadati di colonna riutilizzabile per i job di flusso DataStage . | Editor componente DataStage | Progetti, spazi |
Flusso DataStage | Trasforma e integra i dati. | Editor del flusso DataStage | Progetti, spazi |
DataStage libreria schema | Importa una serie riutilizzabile di risorse per flussi DataStage . | Editor componente DataStage | Progetti, spazi |
Regola di standardizzazione DataStage | Definisce un componente regola riutilizzabile per formattare i dati nei flussi DataStage . | Editor componente DataStage | Progetti, spazi |
Flusso secondario DataStage | Definisce una serie riutilizzabile di stage e connettori per i flussi DataStage . | Editor componente DataStage | Progetti, spazi |
Esperimento Decision Optimization | Risolve i problemi di ottimizzazione. | Decision Optimization | Progetti |
Vista dinamica | Rappresenta i dati a cui si accede tramite una connessione a un'origine dati remota e filtrati da una query SQL. | Strumento di query | Progetti |
Esperimento di apprendimento federato | Forma un modello comune su una serie di origini dati remote. | Apprendimento federato | Progetti |
Asset cartella | Rappresenta una cartella in IBM Cloud Object Storage. | Strumento dati connessi | Progetti, Cataloghi, Spazi |
notebook di Jupyter | Esegue il codice Python o R per analizzare i dati o i modelli di build. | Jupyter editor di notebook, AutoAI, Prompt Lab | Progetti, cataloghi |
Flusso di mascheramento | Crea copie mascherate degli asset di dati. | Flusso di mascheramento | Progetti |
Configurazione di dati master | Configura Match 360. | Match 360 | Progetti |
Arricchimento dei metadati | Arricchisce i metadati degli asset importati. | Strumento di arricchimento metadati | Progetti |
Metadata import | Importa i metadati dell'asset da una connessione. | Strumento Metadata import | Progetti |
Modello | Contiene informazioni su un modello salvato o importato. | Vari strumenti che eseguono esperimenti o modelli di addestramento | Progetti, Cataloghi, Spazi |
Vincolo fisico | Rappresenta i vincoli di chiave primaria o esterna per gli asset di dati. | Vengono creati automaticamente quando vengono pubblicati i risultati dell'arricchimento dei metadati che contengono le relazioni chiave | Cataloghi |
Pipeline | Automatizza il ciclo di vita del modello. | Pipeline di orchestrazione | Progetti |
Python funzione | Contiene il codice Python per supportare un modello in produzione. | Editor di notebook Jupyter | Progetti, spazi |
Script | Contiene uno script Python o R per supportare un modello in produzione. | Jupyter editor di notebook, RStudio | Progetti, spazi |
Flusso SPSS Modeler | Esegue un flusso per preparare i dati e creare un modello. | SPSS Modeler | Progetti |
Visualizzazione | Mostra le visualizzazioni da un asset di dati. | Pagina Visualizzazione negli asset di dati | Progetti |
Proprietà comuni per gli asset
Gli asset accumulano informazioni nelle proprietà quando vengono creati, utilizzati o quando vengono aggiornati da processi automatizzati. Alcune proprietà sono fornite dagli utenti e possono essere modificate dagli utenti. Altre proprietà vengono fornite automaticamente dal sistema. La maggior parte delle proprietà fornite dal sistema non possono essere modificate dagli utenti.
Il campo Ultima modifica per un asset tiene traccia sia delle azioni utente che delle azioni di sistema. Le azioni di sistema spesso si verificano in background e potrebbero comportare solo modifiche ai metadati interni dell'asset.
Proprietà comuni per gli asset ovunque
La maggior parte dei tipi di asset ha le proprietà elencate nella seguente tabella in tutti gli spazi di lavoro in cui esistono tali tipi di asset.
Proprietà | Descrizione | Modificabile? |
---|---|---|
Nome | Il nome dell'asset. Può contenere fino a 255 caratteri. Supporta caratteri multibyte. Non può essere vuoto, contenere caratteri di controllo Unicode o contenere solo spazi vuoti. Non è necessario che i nomi asset siano univoci all'interno di un progetto o di un spazio di distribuzione. Se i nomi asset devono essere univoci in un catalogo dipende dal metodo di gestione duplicato impostato per il catalogo. | Sì |
Descrizione | Facoltativo. Supporta collegamenti ipertestuali e caratteri multibyte. | Sì |
Data di creazione | La data/ora in cui l'asset è stato creato o importato. | N |
Creatore o proprietario | Il nome utente o l'indirizzo email della persona che ha creato o importato l'asset. | N |
Data ultima modifica | La data/ora dell'ultima modifica dell'asset. | N |
Ultimo editor | Il nome utente o l'indirizzo email della persona che ha apportato l'ultima modifica all'asset. | N |
Proprietà comuni per gli asset nei cataloghi
Oltre alle proprietà comuni di tutti gli asset, gli asset nei cataloghi hanno le proprietà e le pagine elencate nella seguente tabella.
Proprietà o pagina | Descrizione | Modificabile? |
---|---|---|
Pagina Asset | Una vista del contenuto dell'asset. Vedere Contenuto asset o anteprime. | N |
Privacy | Impostare su pubblico per impostazione predefinita. Questa impostazione può limitare l'accesso a un asset in un catalogo quando impostato su privato. Solo il proprietario e i membri dell'asset possono visualizzare e utilizzare asset privati. | Sì |
Pagina Accesso | Il proprietario e i membri dell'asset. Per impostazione predefinita, il proprietario dell'asset è l'utente che ha aggiunto l'asset al catalogo. I membri dell'asset possono visualizzare e utilizzare l'asset quando è contrassegnato come privato. Vedere Controllo dell'accesso a un asset. | Sì |
Pagina Valutazioni | Facoltativo. I collaboratori del catalogo possono valutare e revisionare gli asset. | Sì |
Tag | Facoltativo. Etichette di testo create dai collaboratori del catalogo per semplificare la ricerca. Un tag è composto da una stringa di massimo 255 caratteri. Può contenere spazi, lettere, numeri, caratteri di sottolineatura, trattini e i simboli # e @. | Sì |
Relazioni | Facoltativo. Le relazioni visualizzate nella sezione Elementi correlati della pagina Panoramica dell'asset sono informative e non hanno altri effetti sull'asset. Può essere tra asset nello stesso spazio di lavoro o in spazi di lavoro differenti. Ad esempio, è possibile aggiungere una relazione tra un asset in un catalogo e un asset in un progetto. Può essere compreso tra un asset e una risorsa utente. Ad esempio, è possibile aggiungere una relazione tra un asset e una politica. Gli amministratori possono creare relazioni personalizzate per gli asset. Consultare la sezione Aggiunta di relazioni asset. | Sì |
Risorse utente di governance | Facoltativo. I termini di business e la classificazione che gli utenti hanno assegnato all'asset. Queste assegnazioni possono influire sull'asset. Ad esempio, un termine di business assegnato può attivare l'applicazione di una regola di protezione dati. | Sì |
È possibile creare proprietà personalizzate per i tipi di asset. Le proprietà personalizzate vengono visualizzate nella sezione Dettagli nella scheda Panoramica dell'asset nel catalogo. Vedere Proprietà e relazioni personalizzate.
Per modificare le proprietà dell'asset, è necessario disporre delle autorizzazioni richieste. Consultare Modifica di asset in un catalogo.
Proprietà comuni per gli asset eseguiti negli strumenti
Alcuni asset sono associati all'esecuzione di uno strumento. Ad esempio, un asset di esperimento AutoAI viene eseguito nello strumento AutoAI . Gli asset eseguiti negli strumenti sono anche noti come asset operativi. Ogni volta che si eseguono asset in strumenti, si avvia un lavoro. È possibile monitorare e pianificare i lavori. I lavori utilizzano risorse di calcolo. Le risorse di calcolo vengono misurate in CUH (capacity unit hours) e vengono tracciate. A seconda dei tuoi piani di servizio, puoi avere una quantità limitata di CUH al mese o pagare il CUH che utilizzi ogni mese.
Per molti asset eseguiti negli strumenti, è possibile scegliere la configurazione dell'ambiente di calcolo da utilizzare. In genere, le configurazioni di ambiente più grandi e più veloci consumano le risorse di elaborazione più velocemente.
Oltre alle proprietà di base, la maggior parte degli asset eseguiti negli strumenti contiene i seguenti tipi di informazioni nei progetti:
Proprietà | Descrizione | Modificabile? | Spazi di lavoro |
---|---|---|---|
Definizione dell'ambiente | Il modello di ambiente, la specifica hardware e la specifica software per l'esecuzione dell'asset. Vedere Ambienti. | Sì | Progetti, spazi |
Impostazioni | Informazioni che definiscono come viene eseguito l'asset. Specifico per ciascun tipo di asset. | Sì | Progetti |
Asset di dati associati | I dati su cui sta lavorando l'asset. | Sì | Progetti |
Lavori | Informazioni su come eseguire l'asset, incluse le opzioni di definizione, pianificazione e notifica dell'ambiente. Vedere Lavori. | Sì | Progetti, spazi |
Tipi di asset di dati e relative proprietà
I tipi di asset di dati contengono metadati e altre informazioni sui dati, incluso come accedere ai dati.
Il modo in cui si crea un asset di dati dipende da dove si trovano i dati:
Se i tuoi dati si trovano in un file, lo carichi dal tuo sistema locale in un progetto, catalogo o spazio di distribuzione.
Se i dati si trovano in un'origine dati remota, si crea innanzitutto un asset di connessione che definisce la connessione a tale origine dati. Quindi, creare un asset di dati selezionando la connessione, il percorso o un'altra struttura e la tabella o il file che contiene i dati. Questo tipo di asset di dati è denominato asset di dati connesso.
Per le origini dati che supportano le interrogazioni SQL, è anche possibile creare viste dinamiche, che sono asset di dati di tipo Interrogazione. Per creare un tale asset, selezionare la connessione e fornire una query SQL che richiama solo i dati necessari.
Il seguente grafico illustra il modo in cui gli asset di dati dai file puntano ai file caricati in Cloud Object Storage. Gli asset di dati connessi richiedono un asset di connessione e puntano ai dati in una origine dati remota.
È possibile creare i seguenti tipi di asset di dati in un progetto, catalogo o spazio di distribuzione:
Asset di dati da un file Rappresenta un file caricato dal sistema locale. Il file viene memorizzato nel contenitore di archiviazione degli oggetti sull'istanza IBM Cloud Object Storage associata all'area di lavoro. Il contenuto del file può includere dati strutturati, dati di testo non strutturato, immagini e altri tipi di dati. È possibile creare un asset di dati con un file di qualsiasi formato. Tuttavia, è possibile eseguire più azioni sui file CSV rispetto ad altri tipi di file. Vedere Proprietà degli asset di dati.
È possibile creare un asset di dati da un file caricandone uno in un workspace. È inoltre possibile creare file di dati con strumenti e convertirli in asset. Ad esempio, è possibile creare risorse di dati da file con gli strumenti Data Refinery, Jupyter notebook e RStudio.
Asset dati connessi Rappresenta una tabella, un file o una cartella a cui si accede tramite una connessione a un'origine dati remota. La connessione è definita nell'asset di connessione associato all'asset di dati connesso. È possibile creare un asset di dati connesso per ogni connessione supportata. Quando si accede a un asset di dati connesso, i dati vengono richiamati dinamicamente dall'origine dati. Vedere Proprietà degli asset di dati.
È possibile importare gli asset di dati connessi da un'origine dati con lo strumento di dati connesso in uno spazio di lavoro. Se si desidera importare serie di asset di dati connessi, ad esempio un intero schema di database, utilizzare lo strumento di importazione dei metadati nei progetti. È possibile creare tabelle virtuali che compilano dati da più origini dati con Data Virtualization nell'area di lavoro Data virtualization .
Nei progetti, è possibile creare viste dinamiche che contengono dati filtrati da una o più tabelle in un'origine dati utilizzando lo strumento di accesso ai dati di query.
Attività cartella Rappresenta una cartella in IBM Cloud Object Storage. Un asset di dati cartella è un caso speciale di un asset di dati connesso. Si crea una risorsa dati cartella specificando il percorso della cartella e la risorsa di connessione IBM Cloud Object Storage. È possibile visualizzare i file e le cartelle secondarie che condividono il percorso con l'asset di dati della cartella. I file che è possibile visualizzare all'interno dell'asset di dati della cartella non sono essi stessi asset di dati. Ad esempio, è possibile creare un asset di dati cartella per un percorso che contiene feed di notizie continuamente aggiornati. Vedere Proprietà degli asset di dati.
È possibile importare le risorse della cartella da IBM Cloud Object Storage con lo strumento dati connessi in un'area di lavoro.
Asset di collegamento Contiene le informazioni necessarie per creare una connessione a un'origine dati. Consultare Proprietà degli asset di connessione.
È possibile creare connessioni con lo strumento di connessione in uno spazio di lavoro.
Ulteriori informazioni sulla creazione e l'importazione di asset di dati:
- Aggiunta di dati a un progetto
- Aggiunta di asset a un catalogo
- Aggiunta di asset di dati a uno spazio di distribuzione
- Virtualizzazione dei dati
Proprietà degli asset di dati da file e asset di dati connessi
Oltre alle proprietà di base e alle proprietà di catalogo comuni, gli asset di dati dei file e gli asset di dati connessi hanno le proprietà o le pagine elencate nella seguente tabella.
Proprietà o pagina | Descrizione | Modificabile? | Spazi di lavoro |
---|---|---|---|
Colonne | Un riepilogo delle proprietà delle colonne nell'asset di dati. Include il punteggio di qualità, la descrizione, le classi di dati assegnate e i termini di business assegnati per ciascuna colonna. Le classi di dati e i termini di business assegnati possono influire sull'asset. Ad esempio, un termine aziendale assegnato può attivare l'applicazione di una regola di protezione dei dati. Informazioni sulla chiave primaria e sulla relazione con la chiave: - Una colonna impostata come chiave primaria è identificata da un'icona di chiave (). Una chiave primaria è mostrata anche nel pannello laterale delle risorse. - Se esistono relazioni chiave per l'asset, è possibile fare clic su Visualizza relazioni chiave . Nella scheda Padre di , vengono visualizzate tutte le relazioni per la chiave primaria. Nella scheda Figlio di , vengono visualizzate tutte le relazioni per cui l'asset contiene una chiave esterna. |
N | Cataloghi |
Tag | Facoltativo. Etichette di testo create dagli utenti per semplificare la ricerca. Un tag è composto da una stringa di massimo 255 caratteri. Può contenere spazi, lettere, numeri, caratteri di sottolineatura, trattini e i simboli # e @. | Sì | Progetti, cataloghi |
Formato | Il tipo MIME di un file. Rilevato automaticamente. | Sì | Progetti, Cataloghi, Spazi |
Dettagli asset | Informazioni sulla dimensione dei dati, il numero di colonne e righe e la versione dell'asset. Nei progetti viene visualizzato anche il tipo di tabella dei dati relazionali. |
N | Progetti, Cataloghi, Spazi |
Origine | Informazioni sul file di dati nella memoria o sull'origine dati e la connessione. | N | Cataloghi, Spazi |
Query | Query SQL che genera l'asset. Solo viste dinamiche. |
Sì | Progetti |
Dettagli connessione | Per gli asset di dati connessi, il percorso, il nome della connessione, il tipo di connettore e il proprietario della connessione. Per viste dinamiche, vengono visualizzati solo il nome della connessione e il tipo di connettore. |
N | Progetti |
Riquadro Attività | La cronologia delle azioni eseguite sull'asset in tutte le aree di lavoro. Consultare Attività. | N | Progetti, cataloghi |
Pagina Anteprima asset o Asset | Un'anteprima dei dati che include una serie limitata di colonne e righe dall'origine dati originale. Vedere Contenuto asset o anteprime. | N | Progetti, Cataloghi, Spazi |
Pagina Profilo | Metadati e statistiche sul contenuto dei dati. Ad esempio, quando una risorsa arricchita semanticamente viene pubblicata in un catalogo, vengono pubblicati anche i metadati espansi e Nome visualizzato e Descrizione, che sono il nome generato dall'IA o una versione modificata, appaiono in questa pagina. Queste informazioni vengono visualizzate anche nella pagina Overview. Vedere Profilo. | Sì | Progetti, cataloghi |
Pagina Qualità dei dati | Informazioni sulla qualità dei dati di un asset e delle relative colonne e sui controlli di qualità dei dati applicati. Vedere Qualità dei dati. | Sì [ 1] | Progetti, cataloghi |
Pagina Visualizzazioni | Grafici e grafici che gli utenti creano per comprendere i dati. Vedi Visualizzazioni. | Sì | Progetti |
Pagina Gruppo funzioni | Informazioni sulle colonne nell'asset di dati utilizzate come elementi nei modelli. Consultare Gestione dei gruppi di funzioni. | Sì | Progetti, Cataloghi, Spazi |
Proprietà degli asset di connessione
Le proprietà degli asset di connessione dipendono dall'origine dati selezionata quando si crea una connessione. Vedere Tipi di connessione. Gli asset di connessione per la maggior parte delle origini dati hanno le proprietà elencate nella seguente tabella.
Proprietà | Descrizione | Modificabile? | Spazi di lavoro |
---|---|---|---|
Dettagli connessione | Le informazioni che identifica l'origine dati. Ad esempio, nome database, nome host, indirizzo IP, porta, ID istanza, bucket, URL endpoint e così via. | Sì | Progetti, Cataloghi, Spazi |
Impostazione delle credenziali | Indica se le credenziali sono condivise sulla piattaforma (impostazione predefinita) o se ogni utente deve immettere le proprie credenziali personali. Non tutte le origini dati supportano credenziali personali. | Sì | Progetti, Cataloghi, Spazi |
Metodo di autenticazione | Il formato delle informazioni sulle credenziali. Ad esempio, una chiave API o un nome utente e password. | Sì | Progetti, Cataloghi, Spazi |
Credenziali | Il nome utente e la password, la chiave API o altre credenziali, come richiesto dall'origine dati e dal metodo di autenticazione specificato. | Sì | Progetti, Cataloghi, Spazi |
Certificati | Indica se la porta dell'origine dati è configurata per accettare le connessioni SSL e altre informazioni relative al certificato SSL. | Sì | Progetti, Cataloghi, Spazi |
Connettività privata | Il metodo per connettersi a un database che non è esternalizzato a internet. Consultare Connessione ai dati dietro un firewall. | Sì | Progetti, Cataloghi, Spazi |
Ubicazione e sovranità | L'ubicazione fisica del centro dati in cui sono memorizzati i dati e l'entità sovrana che ha giurisdizione sui dati. | Sì | Progetti, Cataloghi, Spazi |
Ulteriori informazioni
- Il valore degli asset
- Ricerca di asset nella piattaforma
- Profili
- Contenuto asset o anteprime
- Qualità dei dati
- Attività
- Visualizzazioni
- Introduzione
- tipi connessione
Argomento principale: Vista di IBM Cloud Pak for Data as a Service
Solo progetti ↩︎