0 / 0
Torna alla versione inglese della documentazione
Panoramica di Cloud Pak for Data as a Service
Panoramica di Cloud Pak for Data as a Service

Panoramica di Cloud Pak for Data as a Service

Cloud Pak for Data as a Service è una piattaforma di servizi cloud per tutta la tua governance dei dati, l'ingegneria dei dati, l'analisi dei dati e le attività del ciclo di vita AI. Cloud Pak for Data as a Service implementa una soluzione di tessuto dati in modo da poter fornire un accesso istantaneo e sicuro ai dati attendibili alla propria organizzazione, automatizzare i processi e la conformità e consegnare AI trustworthy AI nelle applicazioni.

Cloud Pak for Data as a Service è una piattaforma di cloud service completamente gestita con i seguenti vantaggi:

  • Nessuna installazione, gestione o aggiornamento di software o hardware
  • Semplice da scalare o in basso
  • Sicuro e conforme
  • Architettura dei servizi componibili
  • Fatturazione mensile a base di abbonamento

La soluzione di tessuto dati Cloud Pak for Data as a Service

Un'architettura di tessuti dati consente alla tua azienda di sbloccare il valore dei tuoi dati in un panorama dati ibrido multicalta. Passare ad un'architettura dei tessuti dati trasforma il modo in cui la tua azienda si integra, governa e utilizza i dati per l'analytics, la scienza dei dati, i dati master dei clienti e la conformità.

Con un tessuto di dati, è possibile avere un modo sicuro e coerente per accedere ai dati provenienti da fonti disparate. È possibile eliminare i processi di accesso e di integrazione dei dati inefficienti, ripetitivi e manuali. Un'architettura dei tessuti di dati colma il divario tra le fonti e fornisce dati di business - ready per supportare le esigenze della tua azienda. È possibile lavorare con i dati provenienti da vari tipi di sorgenti attraverso un panorama ibrido e multi - cloud, mentre si conserva quel dato sicuro e attendibile con l'ampiezza completa delle funzionalità integrate di gestione dei dati.

Immagine che mostra un tessuto dati con varie fonti di dati

I tuoi ingegneri dati hanno bisogno di strumenti per preparare, trasformare e virtualizzare i dati. I tuoi analisti di qualità dei dati hanno bisogno di strumenti per misurare la qualità dei dati. Il tuo team di governance ha bisogno di strumenti per controllare, proteggere e arricchire i tuoi dati. I vostri consumatori di dati, come gli analisti di business e gli scienziati di dati, hanno bisogno di strumenti per sviluppare collaborazioni di approfondimenti e modelli. Con la piattaforma Cloud Pak for Data di strumenti integrati, la tua organizzazione può funzionare in modo efficiente insieme per utilizzare i tuoi dati per migliorare il tuo business.

Per ulteriori informazioni sulla soluzione del fabric dei dati, consultare Panoramica della soluzione fabric. Per sperimentare l'implementazione del tessuto di dati, prendere i tutorial di tessuto dati.

Architettura dei servizi e della piattaforma

Si aggiungono funzioni e strumenti alla piattaforma Cloud Pak for Data as a Service da parte dei servizi di fornitura. Una serie di servizi core è integrata nella piattaforma comune. Altri servizi associati funzionano con la piattaforma ma corrono al di fuori di esso. A seconda di come si firma per Cloud Pak for Data as a Service, si potrebbe iniziare con un sottoinsieme dei servizi core che rappresentano un singolo caso di utilizzo della soluzione di fabric.

Architettura dei servizi

È possibile fornire questi tipi di servizi dal catalogo servizi di Cloud Pak for Data as a Service :

Servizi Core I servizi Core sono perfettamente integrati e aggiungono strumenti, spazi di lavoro o potenza di calcolo alla UI della piattaforma:

  • Watson Studio per l'analisi dei dati
  • Watson Machine Learning per la costruzione e la distribuzione dei modelli
  • Watson OpenScale per la valutazione dei modelli
  • Watson Knowledge Catalog per la gestione e la catalogazione dei dati e degli altri asset
  • DataStage per l'integrazione dei dati
  • Watson Query per la virtualizzazione e l'interrogazione dei dati
  • Match 360 per la creazione di dati master
  • Cognos Dashboard Embedded per la visualizzazione dei dati

Servizi associati Servizi di database IBM Cloud che è possibile utilizzare per accedere ai dati provenienti dall'interno della piattaforma ma memorizzare e gestire i dati al di fuori della piattaforma.

I servizi Watson che hanno le proprie UIs o forniscono API per l'analisi dei dati.

Spazi di lavoro e attività

Cloud Pak for Data as a Service è organizzato come una serie di spazi di lavoro collaborativi dove è possibile lavorare con il team o l'organizzazione. Ogni spazio di lavoro ha una serie di membri con ruoli che forniscono i permessi per eseguire azioni. La maggior parte degli utenti lavora con asset. Gli asset di dati contengono metadati che rappresentano i dati, mentre gli asset operativi, come le pipeline di dati e i modelli, eseguono il codice per lavorare con i dati. Il seguente diagramma mostra i principali spazi di lavoro, i loro scopi e come gli asset e gli altri articoli si spostano intorno alla piattaforma.

I principali spazi di lavoro sono progetti, cataloghi, spazi di distribuzione e categorie. Gli asset si spostano tra progetti e spazi di distribuzione e cataloghi. Gli artefatti di governance vengono creati in categorie e vengono aggiunti come metadati agli asset nei cataloghi.

Progetti

I progetti sono dove la tua scienza dei dati, l'ingegneria dei dati o i team di curazione dei dati funzionano con i dati per creare asset, come, notebook, dashboard, modelli, pipeline di dati o asset dati arricchiti. Gli strumenti del progetto sono forniti dalla maggior parte dei servizi core:

  • Watson Studio fornisce i Data Refinery, Jupyter notebooks editor, SPSS Modeler, Decision Optimization, Pipeline e strumenti RStudio
  • Watson Machine Learning fornisce strumenti di apprendimento AutoAI e Federated Learning
  • Watson Knowledge Catalog fornisce la Data Refinery, Metadata import, l'arricchimento dei metadati e gli strumenti di flusso di mascheramento
  • DataStage fornisce l'editor dei pipeline di dati DataStage
  • Cognos Dashboard Embedded fornisce l'editor di dashboard
  • Match 360 fornisce lo strumento di configurazione dei dati Master

La seguente immagine mostra quale potrebbe essere la pagina Panoramica di un progetto.

Un progetto contiene asset e collaboratori.

Cataloghi

I cataloghi sono dove la tua organizzazione trova e memorizza dati di alta qualità, attendibili e altri asset, come ad esempio i fogli factsheet. È possibile trovare asset di dati in un catalogo e spostarli in un progetto per lavorare con i dati. Oppure si possono curare i dati nei progetti e pubblicare gli asset dati di alta qualità in un catalogo per gli altri da utilizzare. I cataloghi richiedono il servizio Watson Knowledge Catalog .

La seguente immagine mostra quale potrebbe essere la pagina Assetti di un catalogo.

Un catalogo contiene una vista di asset.

Spazi di distribuzione

Gli spazi di distribuzione sono dove il tuo team ModelOps distribuisce modelli alla produzione e poi prova e gestisce i modelli in produzione. Dopo aver costruito modelli in progetti, li promuovi agli spazi di distribuzione. Gli spazi distribuzioni richiedono il servizio Watson Machine Learning .

La seguente immagine mostra quale potrebbe essere la pagina Panoramica di uno spazio di distribuzione.

Uno spazio di distribuzione contiene asset e collaboratori.

Categorie

Le categorie sono dove il tuo team di governance crea e gestisce artefatti di governance che arricchisce i beni dati nei cataloghi. Le categorie richiedono il servizio Watson Knowledge Catalog .

La seguente immagine mostra come potrebbe essere una categoria.

Una categoria contiene manufatti di governance.

Altri spazi di lavoro

È possibile creare asset di dati specializzati in altri spazi di lavoro e spostarli a progetti e cataloghi:

  • Il servizio Watson Query fornisce uno spazio di lavoro per virtualizzare gli asset di dati su molte fonti di dati.
  • Il servizio Match360 fornisce uno spazio di lavoro per configurare ed esplorare una visione a 360 gradi dei dati dei clienti.

La piattaforma include una Galleria integrata di campioni che fornisce asset dati, notebook e progetti di esempio. I notebook di esempio forniscono esempi di scienze dei dati e codice di apprendimento automatico. I progetti di esempio, compresi gli acceleratori di settore, contengono serie di dati, modelli, altri asset e istruzioni dettagliate su come risolvere un determinato problema aziendale. La Galleria fornisce anche Knowledge Accelerators, che contengono serie di artefatti di governance che è possibile importare per fornire vocabolari aziendali per specifiche industrie.

La seguente immagine mostra come appare la Gallery.

La Galleria contiene campioni.

Ulteriori informazioni

Argomento principale: Cloud Pak for Data as a Service