0 / 0
Torna alla versione inglese della documentazione
Multicloud data integration caso di utilizzo
Multicloud data integration caso di utilizzo

Multicloud data integration caso di utilizzo

Per far fronte all'afflusso di volumi e alle disparate fonti di dati, le imprese hanno bisogno di costruire automazione e intelligenza nei loro processi di integrazione dei dati. Cloud Pak for Data as a Service fornisce la piattaforma e gli strumenti per orchestrare dinamicamente e intelligentemente i dati in un panorama distribuito per creare una rete ad alte prestazioni di informazioni istantaneamente disponibili per i consumatori di dati.

Guarda questo video per vedere il caso di utilizzo del tessuto dati per implementare una soluzione Multicloud data integration in Cloud Pak for Data.

Questo video fornisce un metodo visivo in alternativa a seguire le fasi scritte in questa documentazione.

Verifiche

Man mano che i loro tipi di dati e volumi crescono, le imprese affronano le seguenti sfide di integrazione dei dati:

Inserire i dati di tutta l'azienda
Processi devono essere in grado di inglobare i dati da qualsiasi applicazione o sistema indipendentemente dal fatto che i dati risiedono nei locali, nel cloud o in un ambiente ibrido.

Integrare i dati da più fonti
Organizzazioni devono essere in grado di automatizzare l'ingestione di massa, la pulizia e le trasformazioni complesse dei dati.

Fare i dati disponibili per gli utenti
Gli ingegneri dati devono essere in grado di pubblicare ogni dataset integrato in un unico catalogo, e tutti gli utenti che devono consumare i dati devono avere accesso self-service ad esso.

Puoi risolvere queste sfide implementando la tua integrazione di dati multicalta con il tessuto dati su Cloud Pak for Data as a Service.

Esempio: le sfide della Golden Bank

Segui la storia di Golden Bank dato che il team di ingegneria dei dati implementa l'integrazione dei dati multicalta. Golden Bank ha una grande quantità di dati sui clienti e sui mutui che vengono memorizzati in tre fonti esterne di dati. I prestatori utilizzano queste informazioni per aiutarli a decidere se devono approvare o negare le applicazioni ipotecarie. La banca vuole integrare i dati provenienti dalle diverse fonti, per poi consegnare i dati trasformati a un singolo file di output che può essere condiviso.

Processo

Per implementare una soluzione di integrazione dati multicalta per la tua azienda, la tua organizzazione può seguire questo processo:

  1. Integrare i dati
  2. Condividi i dati

I servizi DataStage, Watson Querye Watson Knowledge Catalog in Cloud Pak for Data as a Service forniscono tutti gli strumenti e i processi di cui la tua organizzazione ha bisogno per implementare una soluzione di integrazione dati multicalta.

Immagine che mostra il flusso del caso di utilizzo dell'integrazione dati multicalta

1. Integrare i dati

Con un'architettura di tessuti di dati che utilizza Cloud Pak for Data as a Service, gli ingegneri dei dati possono ottimizzare l'integrazione dei dati utilizzando i carichi di lavoro e le policy dei dati per accedere in modo efficiente e lavorare con i dati e combinare i dati virtualizzati da diverse fonti, tipi e nuvole come se i dati fossero da un'unica fonte di dati. In questo passo del processo, i dati grezzati vengono estratti, ingeriti, virtualizzati e trasformati in dati di qualità consumabili, pronti per essere esplorati e poi orchestrati nel vostro ciclo di vita AI.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Watson Query Eseguire query su molte origini dati come se fosse una. Gli ingegneri dati possono creare tabelle dati virtuali in grado di combinare, unire o filtrare i dati provenienti da varie fonti di dati relazionali.

Gli ingegneri dati possono quindi rendere disponibili i dati combinati risultanti come asset dati nei cataloghi. Ad esempio, è possibile utilizzare i dati combinati per alimentare dashboard, notebook e flussi in modo che i dati possano essere esplorati.
È necessario combinare i dati provenienti da più fonti per generare viste.

È necessario rendere disponibili i dati combinati come asset di dati in un catalogo.
DataStage Gli ingegneri dei dati possono progettare ed eseguire flussi di dati complessi che spostano e trasformano i dati. È necessario progettare ed eseguire flussi di dati complessi che gestiscono grandi volumi di dati e connettersi a una vasta gamma di fonti di dati, integrare e trasformare i dati, e consegnarlo al proprio sistema di destinazione in batch o in tempo reale.
Data Refinery Accesso e rifinzione dei dati provenienti da connessioni di origine dati diversificate.

Materializza i dataset risultanti come istantanee nel tempo che potrebbero combinare, unire, filtrare o mascherare i dati per renderla utilizzabile per gli scienziati dei dati per analizzare ed esplorare.

Rendi i dataset risultanti disponibili nei cataloghi.
È necessario visualizzare i dati quando si desidera apportare modifiche ad esso.

Si desidera semplificare il processo di preparazione di grandi quantità di dati grezzi per l'analisi.


Esempio: integrazione dei dati della Golden Bank

Gli analisti di rischio alla Golden Bank calcolano il tasso di interesse giornaliero che raccomandano di offrire ai mutuatari per ogni fascia di punteggio di credito. Gli ingegneri dei dati utilizzano DataStage per aggregare i dati di applicazione dei mutui anonimi con le informazioni personali identificabili personalmente dai richiedenti ipotecari. DataStage integra queste informazioni, incluse le informazioni sul punteggio del credito per ciascun richiedente, il debito totale del richiedente e un tavolo di ricerca a tasso di interesse. Gli ingegneri dei dati poi caricano i dati in un file .csv di output di destinazione che può essere pubblicato su un catalogo e condiviso per l'utilizzo da parte di prestatori e analisti.


2. Condividi i dati

Il catalogo aiuta le tue squadre a capire i dati dei tuoi clienti e rende disponibili i dati giusti per l'uso giusto. Gli scienziati dei dati e gli altri tipi di utenti possono aiutare se stessi ai dati integrati di cui hanno bisogno mentre rimangono conformi alle politiche di accesso e protezione dei dati aziendali. Possono aggiungere asset di dati da un catalogo in un progetto, dove collaborano per preparare, analizzare e modellare i dati.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Cataloghi Utilizza cataloghi in Watson Knowledge Catalog per organizzare i tuoi asset da condividere tra i collaboratori nella tua organizzazione.

Prendi vantaggio dalla ricerca semantica alimentata da AI e consigli per aiutare gli utenti a trovare ciò di cui hanno bisogno.
I tuoi utenti hanno bisogno di comprendere facilmente, collaborare, arricchire e accedere ai dati di alta qualità.

Vuoi aumentare la visibilità dei dati e la collaborazione tra gli utenti aziendali.

Hai bisogno di utenti per visualizzare, accedere, manipolare e analizzare i dati senza capire il proprio formato fisico o la propria posizione, e senza doverlo spostare o copiarlo.

Vuoi che gli utenti potenziino gli asset grazie al rating e rivedendoli.


Esempio: catalogo della Golden Bank

Il leader del team di governance alla Golden Bank crea un catalogo, "Mortgage Approvazione Catalogo" e aggiunge i dati steward e gli scienziati dei dati come collaboratori di catalogo. Gli steward dati pubblicano gli asset dati che hanno creato nel catalogo. Gli scienziati dei dati trovano gli asset dati, curati dagli steward dei dati, nel catalogo e copiano tali asset in un progetto. Nel loro progetto, gli scienziati dei dati possono perfezionare i dati per prepararlo alla formazione di un modello.


Tutorial per integrazione dati multicalta

Supporto didattico Descrizione Competenze per il tutorial
Integrare i dati Estrarre, filtrare, unire e trasformare i tuoi dati. Utilizzare l'interfaccia drag and drop di DataStage per trasformare i dati.
Virtualizzare i dati esterni Virtualizzare e unire tabelle dati da fonti esterne. Utilizzare l'interfaccia Watson Query per virtualizzare i dati.


Ulteriori informazioni

Argomento principale: Panoramica della soluzione del fabric dei dati