La piattaforma fornisce spazi di lavoro e strumenti collaborativi e l'utente fornisce il contenuto alla piattaforma, sotto forma di asset. Un asset è un elemento che contiene informazioni sui dati, altre informazioni preziose o codice che funziona con i dati.
Aggiungere gli asset importandoli o creandoli con gli strumenti. Si lavora con gli asset negli spazi di collaborazione. Lo spazio di lavoro che si utilizza dipende dalle attività.
Progetti Dove collaborare con altri per lavorare con i dati e creare asset. La maggior parte degli strumenti si trova nei progetti e si eseguono asset che contengono codice nei progetti. Ad esempio, è possibile importare dati, preparare dati, analizzare dati o creare modelli nei progetti. Vedere Progetti.
Cataloghi Dove si memorizzano le risorse da condividere con l'organizzazione o per trovare le risorse con cui è necessario lavorare. È possibile copiare gli asset dai cataloghi nei progetti o pubblicare gli asset dai progetti nel catalogo. È possibile modificare le proprietà dell'asset e i metadati in un catalogo, ma non è possibile eseguire gli asset. Vedere Cataloghi.
Spazi di distribuzione Dove si distribuiscono ed eseguono gli asset pronti per il test o la produzione. Si spostano gli asset dai progetti negli spazi di distribuzione e quindi si creano le installazioni da tali asset. Le distribuzioni vengono monitorate e aggiornate in base alle esigenze. Vedere Spazi di distribuzione.
È possibile trovare qualsiasi asset in uno qualsiasi degli spazi di lavoro per cui si è collaboratori ricercandolo dalla barra di ricerca globale. Consultare Ricerca di asset nella piattaforma.
Per creare la maggior parte dei tipi di asset, è necessario utilizzare uno strumento specifico. La maggior parte degli strumenti sono forniti da uno o più servizi. Gli strumenti per creare asset di dati e asset di connessione sono forniti dalla piattaforma e non richiedono alcun servizio specifico.
Per visualizzare quali servizi sono necessari per quali strumenti, aprire la mappa di strumenti e servizi.
La seguente tabella elenca i tipi di asset che è possibile creare, gli strumenti necessari per crearli e gli spazi di lavoro in cui è possibile aggiungerli.
Gli asset accumulano informazioni nelle proprietà quando vengono creati, utilizzati o quando vengono aggiornati da processi automatizzati. Alcune proprietà sono fornite dagli utenti e possono essere modificate dagli utenti. Altre proprietà vengono fornite automaticamente dal sistema. La maggior parte delle proprietà fornite dal sistema non possono essere modificate dagli utenti.
Il campo Ultima modifica per un asset tiene traccia sia delle azioni utente che delle azioni di sistema. Le azioni di sistema spesso si verificano in background e potrebbero comportare solo modifiche ai metadati interni dell'asset.
Proprietà comuni per gli asset ovunque
Copy link to section
La maggior parte dei tipi di asset ha le proprietà elencate nella seguente tabella in tutti gli spazi di lavoro in cui esistono tali tipi di asset.
Proprietà comuni per gli asset
Proprietà
Descrizione
Modificabile?
Nome
Il nome dell'asset. Può contenere fino a 255 caratteri. Supporta caratteri multibyte. Non può essere vuoto, contenere caratteri di controllo Unicode o contenere solo spazi vuoti. Non è necessario che i nomi asset siano univoci all'interno di un progetto o di un spazio di distribuzione. Se i nomi asset devono essere univoci in un catalogo dipende dal metodo di gestione duplicato impostato per il catalogo.
Vero
Descrizione
Facoltativo. Supporta collegamenti ipertestuali e caratteri multibyte.
Vero
Data di creazione
La data/ora in cui l'asset è stato creato o importato.
N
Creatore o proprietario
Il nome utente o l'indirizzo email della persona che ha creato o importato l'asset.
N
Data ultima modifica
La data/ora dell'ultima modifica dell'asset.
N
Ultimo editor
Il nome utente o l'indirizzo email della persona che ha apportato l'ultima modifica all'asset.
N
Proprietà comuni per gli asset nei cataloghi
Copy link to section
Oltre alle proprietà comuni di tutti gli asset, gli asset nei cataloghi hanno le proprietà e le pagine elencate nella seguente tabella.
Impostare su pubblico per impostazione predefinita. Questa impostazione può limitare l'accesso a un asset in un catalogo quando impostato su privato. Solo il proprietario e i membri dell'asset possono visualizzare e utilizzare asset privati.
Vero
Pagina Accesso
Il proprietario e i membri dell'asset. Per impostazione predefinita, il proprietario dell'asset è l'utente che ha aggiunto l'asset al catalogo. I membri dell'asset possono visualizzare e utilizzare l'asset quando è contrassegnato come privato. Vedere Controllo dell'accesso a un asset.
Vero
Pagina Valutazioni
Facoltativo. I collaboratori del catalogo possono valutare e revisionare gli asset.
Vero
Tag
Facoltativo. Etichette di testo create dai collaboratori del catalogo per semplificare la ricerca. Un tag è composto da una stringa di massimo 255 caratteri. Può contenere spazi, lettere, numeri, caratteri di sottolineatura, trattini e i simboli # e @.
Vero
Relazioni
Facoltativo. Le relazioni visualizzate nella sezione Elementi correlati della pagina Panoramica dell'asset sono informative e non hanno altri effetti sull'asset. Può essere tra asset nello stesso spazio di lavoro o in spazi di lavoro differenti. Ad esempio, è possibile aggiungere una relazione tra un asset in un catalogo e un asset in un progetto. Può essere compreso tra un asset e una risorsa utente. Ad esempio, è possibile aggiungere una relazione tra un asset e una politica. Gli amministratori possono creare relazioni personalizzate per gli asset. Consultare la sezione Aggiunta di relazioni asset.
Vero
Risorse utente di governance
Facoltativo. I termini di business e la classificazione che gli utenti hanno assegnato all'asset. Queste assegnazioni possono influire sull'asset. Ad esempio, un termine di business assegnato può attivare l'applicazione di una regola di protezione dati.
Vero
È possibile creare proprietà personalizzate per i tipi di asset. Le proprietà personalizzate vengono visualizzate nella sezione Dettagli nella scheda Panoramica dell'asset nel catalogo. Vedere Proprietà e relazioni personalizzate.
Per modificare le proprietà dell'asset, è necessario disporre delle autorizzazioni richieste. Consultare Modifica di asset in un catalogo.
Proprietà comuni per gli asset eseguiti negli strumenti
Copy link to section
Alcuni asset sono associati all'esecuzione di uno strumento. Ad esempio, un asset di esperimento AutoAI viene eseguito nello strumento AutoAI . Gli asset eseguiti negli strumenti sono anche noti come asset operativi. Ogni volta che si eseguono asset in strumenti, si avvia un lavoro. È possibile monitorare e pianificare i lavori. I lavori utilizzano risorse di calcolo. Le risorse di calcolo vengono misurate in CUH (capacity unit hours) e vengono tracciate. A seconda dei tuoi piani di servizio, puoi avere una quantità limitata di CUH al mese o pagare il CUH che utilizzi ogni mese.
Per molti asset eseguiti negli strumenti, è possibile scegliere la configurazione dell'ambiente di calcolo da utilizzare. In genere, le configurazioni di ambiente più grandi e più veloci consumano le risorse di elaborazione più velocemente.
Oltre alle proprietà di base, la maggior parte degli asset eseguiti negli strumenti contiene i seguenti tipi di informazioni nei progetti:
Proprietà per gli asset nei progetti
Proprietà
Descrizione
Modificabile?
Spazi di lavoro
Definizione dell'ambiente
Il modello di ambiente, la specifica hardware e la specifica software per l'esecuzione dell'asset. Vedere Ambienti.
Vero
Progetti, spazi
Impostazioni
Informazioni che definiscono come viene eseguito l'asset. Specifico per ciascun tipo di asset.
Vero
Progetti
Asset di dati associati
I dati su cui sta lavorando l'asset.
Vero
Progetti
Lavori
Informazioni su come eseguire l'asset, incluse le opzioni di definizione, pianificazione e notifica dell'ambiente. Vedere Lavori.
Vero
Progetti, spazi
Tipi di asset di dati e relative proprietà
Copy link to section
I tipi di asset di dati contengono metadati e altre informazioni sui dati, incluso come accedere ai dati.
Il modo in cui si crea un asset di dati dipende da dove si trovano i dati:
Se i tuoi dati si trovano in un file, lo carichi dal tuo sistema locale in un progetto, catalogo o spazio di distribuzione.
Se i dati si trovano in un'origine dati remota, si crea innanzitutto un asset di connessione che definisce la connessione a tale origine dati. Quindi, creare un asset di dati selezionando la connessione, il percorso o un'altra struttura e la tabella o il file che contiene i dati. Questo tipo di asset di dati è denominato asset di dati connesso.
Per le origini dati che supportano le interrogazioni SQL, è anche possibile creare viste dinamiche, che sono asset di dati di tipo Interrogazione. Per creare un tale asset, selezionare la connessione e fornire una query SQL che richiama solo i dati necessari.
Il seguente grafico illustra il modo in cui gli asset di dati dai file puntano ai file caricati in Cloud Object Storage. Gli asset di dati connessi richiedono un asset di connessione e puntano ai dati in una origine dati remota.
È possibile creare i seguenti tipi di asset di dati in un progetto, catalogo o spazio di distribuzione:
Asset di dati da un file Rappresenta un file caricato dal sistema locale. Il file viene memorizzato nel contenitore di archiviazione degli oggetti sull'istanza IBM Cloud Object Storage associata all'area di lavoro. Il contenuto del file può includere dati strutturati, dati di testo non strutturato, immagini e altri tipi di dati. È possibile creare un asset di dati con un file di qualsiasi formato. Tuttavia, è possibile eseguire più azioni sui file CSV rispetto ad altri tipi di file. Vedere Proprietà degli asset di dati.
È possibile creare un asset di dati da un file caricandone uno in un workspace. È inoltre possibile creare file di dati con strumenti e convertirli in asset. Ad esempio, è possibile creare risorse di dati da file con gli strumenti Data Refinery, Jupyter notebook e RStudio.
Asset dati connessi Rappresenta una tabella, un file o una cartella a cui si accede tramite una connessione a un'origine dati remota. La connessione è definita nell'asset di connessione associato all'asset di dati connesso. È possibile creare un asset di dati connesso per ogni connessione supportata. Quando si accede a un asset di dati connesso, i dati vengono richiamati dinamicamente dall'origine dati. Vedere Proprietà degli asset di dati.
È possibile importare gli asset di dati connessi da un'origine dati con lo strumento di dati connesso in uno spazio di lavoro. Se si desidera importare serie di asset di dati connessi, ad esempio un intero schema di database, utilizzare lo strumento di importazione dei metadati nei progetti. È possibile creare tabelle virtuali che compilano dati da più origini dati con Data Virtualization nell'area di lavoro Data virtualization .
Nei progetti, è possibile creare viste dinamiche che contengono dati filtrati da una o più tabelle in un'origine dati utilizzando lo strumento di accesso ai dati di query.
Attività cartella Rappresenta una cartella in IBM Cloud Object Storage. Un asset di dati cartella è un caso speciale di un asset di dati connesso. Si crea una risorsa dati cartella specificando il percorso della cartella e la risorsa di connessione IBM Cloud Object Storage. È possibile visualizzare i file e le cartelle secondarie che condividono il percorso con l'asset di dati della cartella. I file che è possibile visualizzare all'interno dell'asset di dati della cartella non sono essi stessi asset di dati. Ad esempio, è possibile creare un asset di dati cartella per un percorso che contiene feed di notizie continuamente aggiornati. Vedere Proprietà degli asset di dati.
È possibile importare le risorse della cartella da IBM Cloud Object Storage con lo strumento dati connessi in un'area di lavoro.
Asset di collegamento Contiene le informazioni necessarie per creare una connessione a un'origine dati. Consultare Proprietà degli asset di connessione.
È possibile creare connessioni con lo strumento di connessione in uno spazio di lavoro.
Ulteriori informazioni sulla creazione e l'importazione di asset di dati:
Proprietà degli asset di dati da file e asset di dati connessi
Copy link to section
Oltre alle proprietà di base e alle proprietà di catalogo comuni, gli asset di dati dei file e gli asset di dati connessi hanno le proprietà o le pagine elencate nella seguente tabella.
Proprietà degli asset di dati da file e asset di dati connessi
Proprietà o pagina
Descrizione
Modificabile?
Spazi di lavoro
Colonne
Un riepilogo delle proprietà delle colonne nell'asset di dati. Include il punteggio di qualità, la descrizione, le classi di dati assegnate e i termini di business assegnati per ciascuna colonna. Le classi di dati e i termini di business assegnati possono influire sull'asset. Ad esempio, un termine aziendale assegnato può attivare l'applicazione di una regola di protezione dei dati.
Informazioni sulla chiave primaria e sulla relazione con la chiave: - Una colonna impostata come chiave primaria è identificata da un'icona di chiave (). Una chiave primaria è mostrata anche nel pannello laterale delle risorse. - Se esistono relazioni chiave per l'asset, è possibile fare clic su Visualizza relazioni chiave . Nella scheda Padre di , vengono visualizzate tutte le relazioni per la chiave primaria. Nella scheda Figlio di , vengono visualizzate tutte le relazioni per cui l'asset contiene una chiave esterna.
N
Cataloghi
Tag
Facoltativo. Etichette di testo create dagli utenti per semplificare la ricerca. Un tag è composto da una stringa di massimo 255 caratteri. Può contenere spazi, lettere, numeri, caratteri di sottolineatura, trattini e i simboli # e @.
Vero
Progetti, cataloghi
Formato
Il tipo MIME di un file. Rilevato automaticamente.
Vero
Progetti, Cataloghi, Spazi
Dettagli asset
Informazioni sulla dimensione dei dati, il numero di colonne e righe e la versione dell'asset. Nei progetti viene visualizzato anche il tipo di tabella dei dati relazionali.
N
Progetti, Cataloghi, Spazi
Origine
Informazioni sul file di dati nella memoria o sull'origine dati e la connessione.
N
Cataloghi, Spazi
Query
Query SQL che genera l'asset. Solo viste dinamiche.
Vero
Progetti
Dettagli connessione
Per gli asset di dati connessi, il percorso, il nome della connessione, il tipo di connettore e il proprietario della connessione. Per viste dinamiche, vengono visualizzati solo il nome della connessione e il tipo di connettore.
N
Progetti
Riquadro Attività
La cronologia delle azioni eseguite sull'asset in tutte le aree di lavoro. Consultare Attività.
N
Progetti, cataloghi
Pagina Anteprima asset o Asset
Un'anteprima dei dati che include una serie limitata di colonne e righe dall'origine dati originale. Vedere Contenuto asset o anteprime.
N
Progetti, Cataloghi, Spazi
Pagina Profilo
Metadati e statistiche sul contenuto dei dati. Ad esempio, quando una risorsa arricchita viene pubblicata in un catalogo, vengono pubblicati anche i metadati espansi e il Nome visualizzato e la Descrizione, che può essere una versione generata dall'IA o modificata, appaiono in questa pagina. Queste informazioni vengono visualizzate anche nella pagina Overview. Vedere Profilo.
Vero
Progetti, cataloghi
Pagina Qualità dei dati
Informazioni sulla qualità dei dati di un asset e delle relative colonne e sui controlli di qualità dei dati applicati. Vedere Qualità dei dati.
Grafici e grafici che gli utenti creano per comprendere i dati. Vedi Visualizzazioni.
Vero
Progetti
Pagina Gruppo funzioni
Informazioni sulle colonne nell'asset di dati utilizzate come elementi nei modelli. Consultare Gestione dei gruppi di funzioni.
Vero
Progetti, Cataloghi, Spazi
Proprietà degli asset di connessione
Copy link to section
Le proprietà degli asset di connessione dipendono dall'origine dati selezionata quando si crea una connessione. Vedere Tipi di connessione. Gli asset di connessione per la maggior parte delle origini dati hanno le proprietà elencate nella seguente tabella.
Proprietà degli asset di connessione
Proprietà
Descrizione
Modificabile?
Spazi di lavoro
Dettagli connessione
Le informazioni che identifica l'origine dati. Ad esempio, il nome del database, l'hostname, l'indirizzo IP, la porta, l'ID dell'istanza, il bucket, l'endpoint URL e così via.
Vero
Progetti, Cataloghi, Spazi
Impostazione delle credenziali
Indica se le credenziali sono condivise sulla piattaforma (impostazione predefinita) o se ogni utente deve immettere le proprie credenziali personali. Non tutte le origini dati supportano credenziali personali.
Vero
Progetti, Cataloghi, Spazi
Metodo di autenticazione
Il formato delle informazioni sulle credenziali. Ad esempio, una chiave API o un nome utente e password.
Vero
Progetti, Cataloghi, Spazi
Credenziali
Il nome utente e la password, la chiave API o altre credenziali, come richiesto dall'origine dati e dal metodo di autenticazione specificato.
Vero
Progetti, Cataloghi, Spazi
Certificati
Indica se la porta dell'origine dati è configurata per accettare le connessioni SSL e altre informazioni relative al certificato SSL.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Some tools perform the same tasks but have different features and levels of automation.
Jupyter notebook editor
Prepare data
Visualize data
Build models
Deploy assets
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
AutoAI
Build models
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
SPSS Modeler
Prepare data
Visualize data
Build models
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Decision Optimization
Build models
Visualize data
Deploy assets
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Data Refinery
Prepare data
Visualize data
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Orchestration Pipelines
Prepare data
Build models
Deploy assets
Automate the model lifecycle, including preparing data, training models, and creating deployments.
RStudio
Prepare data
Build models
Deploy assets
Work with R notebooks and scripts in an integrated development environment.
Federated learning
Build models
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deployments
Deploy assets
Monitor models
Deploy and run your data science and AI solutions in a test or production environment.
Catalogs
Catalog data
Governance
Find and share your data and other assets.
Metadata import
Prepare data
Catalog data
Governance
Import asset metadata from a connection into a project or a catalog.
Metadata enrichment
Prepare data
Catalog data
Governance
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Data quality rules
Prepare data
Governance
Measure and monitor the quality of your data.
Masking flow
Prepare data
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Governance
Governance
Create your business vocabulary to enrich assets and rules to protect data.
Data lineage
Governance
Track data movement and usage for transparency and determining data accuracy.
AI factsheet
Governance
Monitor models
Track AI models from request to production.
DataStage flow
Prepare data
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Data virtualization
Prepare data
Create a virtual table to segment or combine data from one or more tables.
OpenScale
Monitor models
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Data replication
Prepare data
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Master data
Prepare data
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
watsonx.ai Studio
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
watsonx.ai Runtime
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
IBM Knowledge Catalog
Discover, profile, catalog, and share trusted data in your organization.
DataStage
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
Data Virtualization
View, access, manipulate, and analyze your data without moving it.
Watson OpenScale
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Data Replication
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Match360 with Watson
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Manta Data Lineage
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Project
Where you work with data.
> Projects > View all projects
Catalog
Where you find and share assets.
> Catalogs > View all catalogs
Space
Where you deploy and run assets that are ready for testing or production.
> Deployments
Categories
Where you manage governance artifacts.
> Governance > Categories
Data virtualization
Where you virtualize data.
> Data > Data virtualization
Master data
Where you consolidate data into a 360 degree view.