Esercitazione sull'integrazione dei dati: Integrazione dei dati
Utilizzare questa esercitazione per trasformare i dati archiviati in tre origini dati esterne con il caso d'uso di integrazione dati della versione di prova del fabric di dati. L'obiettivo è quello di utilizzare DataStage per trasformare i dati e quindi fornire i dati trasformati in un singolo file di output. Se hai completato l'esercitazione Virtualizza dati esterni , hai eseguito molte delle stesse attività utilizzando Watson Query che questa esercitazione realizza utilizzando DataStage.
La storia per il tutorial è che Golden Bank deve aderire a un nuovo regolamento in cui non può prestare a richiedenti di prestiti sottoqualificati. In qualità di ingegnere dei dati presso Golden Bank, attualmente si utilizza DataStage per aggregare i dati delle domande di mutuo anonimizzati con le informazioni di identificazione personale dei richiedenti del mutuo. I creditori utilizzano queste informazioni per decidere se approvare o rifiutare le richieste di mutuo. La tua leadership ha aggiunto alcuni analisti di rischio che calcolano quotidianamente quale tasso di interesse consigliano di offrire ai mutuatari in ogni intervallo di punteggio di credito. È necessario integrare queste informazioni nel foglio di calcolo che si condivide con i creditori. Il foglio di calcolo include le informazioni sull'indice di affidabilità creditizia per ogni richiedente, il debito totale del richiedente e una tabella di ricerca dei tassi di interesse. Infine, caricare i dati in un file CSV di output di destinazione.
La seguente immagine animata fornisce una rapida anteprima di ciò che si realizzerà entro la fine di questo tutorial. Si utilizzerà DataStage per unire i dati del richiedente e della domanda, filtrare per stato, unire i punteggi di credito del richiedente, calcolare il debito totale, ricercare il tasso di interesse del mutuo da offrire in base agli intervalli di punteggio di credito ed emettere il risultato in un file CSV. Fare clic sull'immagine per visualizzare un'immagine più grande.
Anteprima dell'esercitazione
In questa esercitazione, verranno completate le seguenti attività:
- Impostare i requisiti.
- Attività 1: eseguire un flusso DataStage esistente
- Modificare il flusso DataStage in:
- Attività 2: specificare una colonna chiave per lo stage Join
- Attività 3: aggiunta di dati di punteggio di credito da un database PostgreSQL
- Attività 4: aggiunta di uno stage Join per unire i dati dell'indice di affidabilità creditizia con i dati del richiedente e della domanda
- Attività 5: aggiunta di uno stage Transformer per calcolare il debito totale
- Attività 6: aggiunta di dati del tasso di interesse da un database MongoDB
- Attività 7: Aggiungere una fase di ricerca per ricercare i tassi di interesse per i candidati
- Attività 8: modifica del nodo file sequenziale ed esecuzione del flusso DataStage
- Attività 9: creare un catalogo per memorizzare l'asset di dati pubblicato
- Attività 10: visualizzare l'emissione e pubblicarla in un catalogo
- Eliminazione (facoltativo)
Guarda questo video per visualizzare un'anteprima dei passi in questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.
Utilizzare il video immagine - in - immagine
La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:
Ottieni aiuto nella community
Se hai bisogno di aiuto con questa esercitazione, puoi fare una domanda o trovare una risposta nel forum di discussione della comunitàCloud Pak for Data.
Configurare le finestre del browser
Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.
Imposta i requisiti
Prerequisiti
Registrati per Cloud Pak for Data as a Service
Devi registrarti per Cloud Pak for Data as a Service e fornire i servizi necessari per il caso di utilizzo dell'integrazione dei dati.
- Se hai un account Cloud Pak for Data as a Service esistente, puoi iniziare con questa esercitazione. Se hai un account del piano Lite, solo un utente per account può eseguire questa esercitazione.
- Se non hai ancora un account Cloud Pak for Data as a Service , registrati per una versione di prova di data fabric.
Guarda il seguente video per ulteriori informazioni su data fabric in Cloud Pak for Data.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Verificare i servizi di cui è stato eseguito il provisioning necessari
Per avere un'anteprima di questa attività, guardate il video che inizia a 01:08.
Attenersi alla seguente procedura per verificare o eseguire il provisioning dei servizi necessari:
In Cloud Pak for Data, verifica di essere nella regione di Dallas o Francoforte. In caso contrario, fai clic sul menu a discesa della regione e seleziona Dallas o Francoforte.
Nel menu di navigazione Cloud Pak for Data , scegli Services> Service instances.
Utilizza l'elenco a discesa Prodotto per determinare se esiste un'istanza del servizio DataStage .
Se devi creare un'istanza del servizio DataStage , fai clic su Aggiungi servizio.
Selezionare DataStage.
Per la regione, seleziona Dallas o Frankfurt.
Seleziona il piano Lite.
Fare clic su Crea.
Ripetere questi passi per verificare o eseguire il provisioning dei seguenti servizi aggiuntivi:
- IBM Knowledge Catalog
- Cloud Object Storage
Controlla i tuoi progressi
La seguente immagine mostra le istanze del servizio di cui è stato eseguito il provisioning:
Crea il progetto di esempio
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 01:00.
Se già si dispone del progetto di esempio per questa esercitazione, passare all' Attività 1. In caso contrario, attenersi alla seguente procedura:
Accedere al progetto di esempio di integrazione dati nell'hub di risorse.
Fare clic su Crea progetto.
Se ti viene richiesto di associare il progetto a un'istanza Cloud Object Storage , seleziona un'istanza Cloud Object Storage dall'elenco.
Fare clic su Crea.
Attendere il completamento dell'importazione del progetto, quindi fare clic su Visualizza nuovo progetto per verificare che il progetto e gli asset siano stati creati correttamente.
Fare clic sulla scheda Asset per visualizzare le connessioni e il flusso DataStage .
Controlla i tuoi progressi
La seguente immagine mostra la scheda Asset del progetto di esempio. È ora possibile avviare l'esercitazione.
Attività 1: esecuzione di un flusso DataStage esistente
Per vedere un'anteprima di questa attività, guardate il video a partire da 02:29.
Iniziare con un flusso DataStage di base che unisca i richiedenti del mutuo e i dataset delle applicazioni del mutuo e quindi eseguire l'output che risulta in un file CSV nel progetto. Seguire questi passi per eseguire il flusso DataStage :
Iniziare nel progetto Integrazione dati . Se il progetto non è aperto, attenersi alla seguente procedura:
Dal menu di navigazione Cloud Pak for Data , scegli Progetti> Visualizza tutti i progetti.
Aprire il progetto Integrazione dati .
Fare clic sulla scheda Asset per visualizzare tutti gli asset nel progetto.
Fare clic su Flussi> DataStage.
Suggerimento: se non vedi alcun flusso DataStage , torna indietro per visualizzare le tue istanze del servizio per verificare che il provisioning della tua istanza DataStage sia stato eseguito correttamente. Vedi Provisioning dei servizi necessari.Fai clic sul flusso Data integration nell'elenco per aprirlo. Questo flusso unisce le tabelle Richiedenti mutuo e Applicazioni mutuo memorizzate in Db2 Warehouse, filtra i dati a tali record dallo Stato della California e crea un file sequenziale in formato CSV come output.
Fare clic sull'icona zoom avanti e sull'icona zoom indietro sulla Barra degli strumenti per impostare la vista preferita dell'area.
Fare doppio clic su MORTGAGE_APPLICATIONS_1 per visualizzare le impostazioni.
Espandere la sezione Proprietà .
Scorrere verso il basso e fare clic su Anteprima dati. Questo dataset include le informazioni acquisite su un'applicazione di mutuo.
Fare clic su Chiudi.
Fare doppio clic sul nodo MORTGAGE_APPLICANTS_1 per visualizzare le impostazioni.
Espandere la sezione Proprietà .
Scorrere verso il basso e fare clic su Anteprima dati. Questo dataset include informazioni sui richiedenti del mutuo che hanno richiesto un prestito.
Facoltativo: visualizzare i dati.
Fare clic su Grafico .
Nell'elenco Colonne da visualizzare , selezionare STATE.
Fare clic su Visualizza dati per visualizzare un grafico a torta che mostra la distribuzione dei dati per stato.
Fare clic sull'icona Treemap per visualizzare gli stessi dati in un grafico treemap.
Fare clic su Chiudi.
Fare doppio clic sul nodo Join_on_ID per visualizzare le impostazioni.
Espandere la sezione Proprietà .
Notare che la chiave di unione è la colonna ID.
Fare clic su Annulla per chiudere le impostazioni.
Fare clic sull'icona Log sulla barra degli strumenti in modo da poter visualizzare l'avanzamento del flusso.
Fare clic su Compila, quindi fare clic su Esegui. In alternativa, fare clic su Esegui per compilare ed eseguire il flusso DataStage . Il completamento dell'esecuzione può richiedere circa un minuto.
Visualizzare i log. È possibile utilizzare il numero totale di righe e righe / sec per ogni passo del flusso per verificare visivamente che il filtro funzioni come previsto.
Quando l'esecuzione viene completata correttamente, fare clic su Integrazione dati nella traccia di navigazione per tornare al progetto.
Sulla scheda Asset , fare clic su Dati> Asset dati.
Aprire il file MORTGAGE_DATA.CSV. È possibile vedere che questo file contiene le colonne sia dei richiedenti del mutuo che dei dataset delle applicazioni del mutuo.
Controlla i tuoi progressi
L'immagine seguente mostra il file CSV risultante. Il prossimo compito è quello di modificare il flusso DataStage.
Panoramica: modifica il flusso DataStage
Ora che hai unito il richiedente del mutuo e i dati della domanda, sei pronto a modificare il flusso DataStage per:
- Attività 2: specificare una colonna chiave per lo stage Join.
- Attività 3: aggiungere i dati del punteggio di credito da un database PostgreSQL .
- Attività 4: aggiungere una fase di unione per unire i dati dell'indice di affidabilità creditizia con i dati del richiedente e della domanda.
- Attività 5: aggiungere uno stage Transformer per calcolare il debito totale.
- Attività 6: aggiungere i dati del tasso di interesse da un database MongoDB .
- Attività 7: aggiungere una fase di ricerca per cercare i tassi di interesse per i candidati in base ai loro punteggi di credito e agli intervalli di tassi di interesse giornalieri della Golden Bank.
Attività 2: specificare la colonna chiave per lo stage Join
Per vedere un'anteprima di questa attività, guardate il video a partire da 04:42.
L'identificazione di una colonna chiave indica a DataStage che la colonna contiene valori univoci. Il nodo Join_on_ID unisce i richiedenti del mutuo e i dataset di applicazione del mutuo utilizzando la colonna ID per la chiave di unione. La fase successiva consiste nell'unire il dataset risultante con i dati dell'indice di affidabilità creditizia. Successivamente, si uniranno i dati filtrati risultanti con il dataset dell'indice di affidabilità creditizia. La seconda unione utilizzerà la colonna EMAIL_ADDRESS come chiave di unione. In questa attività, si modifica il flusso DataStage per specificare la colonna EMAIL_ADDRESS come colonna chiave per il dataset risultante quando viene unito ai dati del punteggio di credito.
La seguente immagine animata fornisce una rappresentazione visiva alternativa alla descrizione dei due nodi di unione. Fare clic sull'immagine per visualizzare un'immagine più grande.
Attenersi alla seguente procedura per modificare le impostazioni del nodo Unione:
Fare clic su Integrazione dati nella traccia di navigazione per tornare al progetto.
Nella scheda Asset , fare clic su Flussi> DataStage flussi.
Aprire il flusso Integrazione dati .
Fare doppio clic su Join_on_ID per modificare le impostazioni.
Fare clic sulla scheda Output ed espandere la sezione Colonne per visualizzare un elenco delle colonne nel dataset unito.
Fare clic su Modifica.
Per il nome della colonna EMAIL_ADDRESS , selezionare Chiave.
Fare clic su Applica e ritorna per tornare alle impostazioni di nodo Join_on_ID .
Fare clic su Salva per salvare le impostazioni del nodo Join_on_ID .
Controlla i tuoi progressi
La seguente immagine mostra il flusso di DataStage con lo stage Join_on_id modificato. Ora che hai identificato la colonna EMAIL_ADDRESS come colonna chiave, puoi aggiungere i dati PostgreSQL contenenti i punteggi di credito dei richiedenti.
Attività 3: aggiunta di dati sull'indice di affidabilità creditizia da un database PostgreSQL
Per vedere un'anteprima di questa attività, guardate il video a partire da 05:23.
Attieniti alla seguente procedura per aggiungere i dati dell'indice di affidabilità creditizie memorizzati in un database PostgreSQL al flusso DataStage :
Nella palette dei nodi, espandere la sezione Connettori .
Trascinare il connettore Browser asset nell'area di disegno accanto al nodo MORTGAGE_APPLICANTS_1 .
Individuare l'asset selezionando Connessione> Data Fabric Prova - Databases for PostgreSQL > BANKING> CREDIT_SCORE.
Nota: fare clic sul nome della connessione o dello schema invece che sulla casella di spunta per espandere la connessione e lo schema.Fare clic su Anteprima per visualizzare l'anteprima dei dati di punteggio del credito per ogni richiedente.
Fare clic su Aggiungi.
Controlla i tuoi progressi
La seguente immagine mostra il flusso di DataStage con l'asset del punteggio di credito aggiunto. Ora che hai aggiunto i dati dell'indice di affidabilità creditizia all'area, devi unirti ai dati dell'aspirante, della domanda e dell'indice di affidabilità creditizia.
Attività 4: aggiunta di una fase di unione per unire i dati dell'indice di affidabilità creditizia con i dati del richiedente e della domanda
Per vedere un'anteprima di questa attività, guardate il video a partire da 05:54.
Seguire questi passi per aggiungere un altro stage Join per unire i dati uniti dell'applicazione del mutuo filtrato e del richiedente del mutuo con i dati dell'indice di affidabilità creditizia nel flusso DataStage :
Nella tavolozza dei nodi, espandere la sezione Stage .
Trascinare lo stage Join nell'area di disegno e rilasciare il nodo sulla riga di link tra i nodi Filter_State_Code e Sequential_file_1 .
Passare con il mouse sul connettore CREDIT_SCORE_1 per visualizzare la freccia. Connetti la freccia allo stage Join .
Fare doppio clic sul nodo CREDIT_SCORE_1 per modificare le impostazioni.
Fare clic sulla scheda Output ed espandere la sezione Colonne per visualizzare un elenco delle colonne nel dataset unito.
Fare clic su Modifica.
Per i nomi colonna EMAIL_ADDRESS e CREDIT_SCORE , selezionare Chiave.
Fare clic su Applica e ritorna per tornare alle impostazioni del nodo CREDIT_SCORE_1 .
Fare clic su Salva per salvare le impostazioni del nodo CREDIT_SCORE_1 .
Fare doppio clic su Join_1 per modificare le impostazioni.
Espandere la sezione Proprietà .
Fare clic su Aggiungi chiave.
Fare nuovamente clic su Aggiungi chiave .
Selezionare EMAIL_ADDRESS dall'elenco di chiavi possibili.
Fai clic su Applica.
Fare clic su Applica e ritorna per tornare alle impostazioni di nodo Join_1 .
Modificare il nome nodo Join_1 in
Join_on_email
.Fare clic su Salva per salvare le impostazioni del nodo Join_1 .
Controlla i tuoi progressi
La seguente immagine mostra un flusso DataStage con un secondo stage Join aggiunto. Ora che hai unito i dati della domanda, del richiedente e dell'indice di affidabilità creditizia, devi aggiungere uno stage Transformer per calcolare il debito totale di ogni richiedente.
Attività 5: aggiunta di uno stage Transformer per calcolare il debito totale
Per vedere un'anteprima di questa attività, guardate il video a partire da 07:08.
Seguire questa procedura per aggiungere uno stage Transformer che crea una nuova colonna sommando le colonne LOAN_AMOUNT e CREDITCARD_DEBT:
Nella sezione Stage , trascinare lo stage Transformer nell'area di disegno e rilasciare il nodo sulla riga di collegamento tra i nodi Join_on_email e Sequential_file_1 .
Fare doppio clic sul nodo Transformer per modificare le impostazioni.
Fare clic sulla scheda Output .
Fare clic su Aggiungi colonna.
Scorrere verso il basso nell'elenco di colonne per visualizzare la nuova colonna.
Denominare la colonna
TOTAL_DEBT
.Fare clic su Modifica nella colonna Derivazione della riga.
Fare clic sull'icona Calcolatrice nella colonna Derivazione per aprire il builder dell'espressione.
Ricercare
LOAN_AMOUNT
e fare doppio clic sul nome della colonna per aggiungerlo all'espressione. Notare che il numero del collegamento viene aggiunto al nome della colonna.Immettere un segno più
+
.Ricercare
CREDITCARD_DEBT
e fare doppio clic sul nome della colonna per aggiungerlo all'espressione. Notare che il numero del collegamento viene aggiunto al nome della colonna.Verificare che l'espressione finale sia
Link_7.LOAN_AMOUNT + Link_7.CREDITCARD_DEBT
.Nota: il numero del link potrebbe essere diverso.Fare clic su Applica e ritorna per tornare alla pagina Transformer .
Per il nome colonna CREDIT_SCORE , selezionare Chiave.
Fare clic sulla scheda Stage.
Selezionare la pagina Avanzate.
Cambiare la modalità di esecuzione in Sequenziale.
Fare clic su Salva e torna per ritornare al canvas.
Controllare i progressi compiuti
La seguente immagine mostra il flusso DataStage con lo stage Transformer aggiunto. Ora che hai calcolato il debito totale di ciascun richiedente, devi aggiungere la tabella dei tassi di interesse da offrire in base agli intervalli di punteggio del credito.
Attività 6: aggiunta di dati del tasso di interesse da un database MongoDB
Per avere un'anteprima di questa attività, guardate il video che inizia a 08:15.
Effettuare le operazioni riportate di seguito per includere i tassi di interesse nel flusso aggiungendo un connettore dell'asset di dati a un database MongoDB :
Nella palette dei nodi, espandere la sezione Connettori .
Trascinare il connettore Browser asset nell'area di disegno accanto al nodo CREDIT_SCORE_1 .
Individuare l'asset selezionando Connessione> Data Fabric Trial - Mongo DB> DOCUMENT> DS_INTEREST _RATES.
Cliccate sull'icona Anteprima per visualizzare l'anteprima dei tassi di interesse per ogni fascia di punteggio di credito.
È possibile utilizzare i valori delle colonne INIZIO_LIMITE e FINE_LIMITE per cercare il tasso di interesse appropriato in base al punteggio di credito del richiedente. La colonna ID non è necessaria, quindi verrà eliminata nel passo successivo.Fare clic su Aggiungi.
Controllare i progressi compiuti
La seguente immagine mostra il flusso DataStage con l'asset di dati dei tassi di interesse aggiunto dall'origine esterna MongoDB . Ora che hai aggiunto la tabella dei tassi di interesse, puoi cercare il tasso di interesse appropriato per ogni candidato.
Attività 7: Aggiungere una fase di ricerca per cercare i tassi di interesse per i richiedenti
Per avere un'anteprima di questa attività, guardate il video che inizia a 09:00.
In base all'indice di affidabilità creditizia di ciascun richiedente, si desidera ricercare il tasso di interesse appropriato. Seguire questa procedura per aggiungere una fase di ricerca e specificare l'intervallo per i limiti di punteggio di credito iniziale e finale per ciascun tasso di interesse:
Nella sezione Stages , trascinare lo stage Lookup nell'area e rilasciare il nodo sulla linea di link tra i nodi Transformer_1 e Sequential_file_1 .
Connetti il connettore DS_INTEREST_RATES_1 allo stage Lookup_1 .
Fare doppio clic sul nodo DS_INTEREST_RATES_1 per modificare le impostazioni.
Fare clic sulla scheda Output .
Espandere la sezione Colonne e fare clic su Modifica.
Selezionare la colonna _ID .
Fare clic sull'icona Elimina per eliminare la colonna _ID.
Fare clic su Applica e ritorna per tornare alle impostazioni del nodo DS_INTEREST_RATES_1 .
Fare clic su Salva per salvare le modifiche al nodo DS_INTEREST_RATES_1 .
Fare doppio clic sul nodo Lookup_1 per modificare le impostazioni.
Espandere la sezione Proprietà .
Per il campo Applica intervallo alle colonne , selezionare CREDIT_SCORE. Vengono visualizzati i campi Link di riferimento, Operatoree Colonna intervallo .
Per Link di riferimenti, selezionare Link_9.
Nota: il numero del link potrebbe essere diverso.Per il primo Operatore, selezionare < =.
Per la prima Colonna intervallo, selezionare ENDING_LIMIT.
Per il secondo Operatore, selezionare > =.
Per la seconda colonna Intervallo, selezionare STARTING_LIMIT.
Fare clic sulla scheda Output .
Espandere la sezione Colonne e fare clic su Modifica.
Selezionare le colonne STARTING_LIMIT e ENDING_LIMIT .
Fare clic sull'icona Elimina per eliminare le colonne non necessarie STARTING_LIMIT e ENDING_LIMIT.
Fare clic su Applica e torna per tornare alle impostazioni del nodo Lookup_1 .
Fare clic su Salva per salvare le modifiche al nodo Lookup_1 .
Controllare i progressi compiuti
La seguente immagine mostra il flusso DataStage con lo stage Lookup aggiunto. Il flusso DataStage è ora completo. L'ultima attività prima di eseguire il flusso consiste nel specificare il nome per il file di output.
Attività 8: modificare il nodo del file sequenziale ed eseguire il flusso DataStage
Per vedere un'anteprima di questo compito, guardate il video a partire da 10:22.
Seguire questa procedura per modificare il nodo del file sequenziale per creare un file di output finale come asset di dati nel progetto, quindi compilare ed eseguire il flusso DataStage :
Fare doppio clic sul nodo Sequential_file_1 per modificare le impostazioni.
Fare clic sulla scheda Input .
Espandere la sezione Proprietà .
Per il file di destinazione, copiare e incollare
MORTGAGE_APPLICANTS_INTEREST_RATES.CSV
come nome file.Selezionare Crea asset di dati.
Per il campo La prima riga è nomi colonna , selezionare True.
Fare clic su Salva.
Fare clic su Esegui per compilare ed eseguire il flusso DataStage . Il completamento del lavoro richiede circa 1 minuto.
Fare clic su Log sulla barra degli strumenti per osservare l'avanzamento del flusso. È normale visualizzare le avvertenze durante l'esecuzione, quindi si vede che il flusso è stato eseguito correttamente.
Controllare i progressi compiuti
La seguente immagine mostra che il flusso di DataStage è stato correttamente eseguito. Ora che il flusso DataStage ha creato il file di output, è necessario creare il catalogo in cui verrà pubblicato il file di output.
Attività 9: creare un catalogo per memorizzare l'asset di dati pubblicato
Per avere un'anteprima di questo compito, guardate il video che inizia a 11:00.
Altri data engineers e analisti di Golden Bank hanno bisogno di accedere ai tassi di interesse ipotecari. Con il piano IBM Knowledge Catalog Lite, è possibile creare due cataloghi. Se si dispone già di un catalogo, ignorare questo passaggio. Altrimenti, completare la seguente procedura per creare un catalogo in cui è possibile pubblicare il dataset dei tassi di interesse.
Dal menu di navigazione Cloud Pak for Data , scegliere Cataloghi > Visualizza tutti i cataloghi.
Se viene visualizzato un Catalogo di approvazione del mutuo nella pagina Cataloghi , passare all' Attività 10: visualizzare l'output e pubblicarlo in un catalogo. Altrimenti, attenersi alla seguente procedura per creare un nuovo catalogo:
Fare clic su Crea catalogo.
Per il Nome, copiare e incollare il nome del catalogo esattamente come mostrato senza spazi iniziali o finali:
Mortgage Approval Catalog
Selezionare Applica regole di protezione dati, confermare la selezione e accettare i valori predefiniti per gli altri campi.
Fare clic su Crea.
Controllare i progressi compiuti
La seguente immagine mostra il tuo catalogo. Ora che il catalogo di approvazione del mutuo esiste, è possibile pubblicare il file di output nel catalogo.
Attività 10: visualizzazione dell'output e pubblicazione in un catalogo
Per vedere un'anteprima di questo compito, guardate il video a partire da 11:31.
Attenersi alla seguente procedura per visualizzare il file di output nel progetto e pubblicarlo in un catalogo:
Dal menu di navigazione di Cloud Pak for Data, scegliere Progetti > Visualizza tutti i progetti.
Aprire il progetto Integrazione dati .
Sulla scheda Asset , fare clic su Dati> Asset dati.
Aprire MORTGAGE_APPLICANTS_INTEREST_RATES.CSV .
Scorrere per visualizzare tutte le colonne nel dataset integrato con i tassi di interesse alla fine di ciascuna voce di dati.
Fare clic su Integrazione dati nella traccia di navigazione per tornare al progetto.
Nella scheda Assets, fare clic sul menu Overflow alla fine della riga per il file MORTGAGE_APPLICANTS_INTEREST_RATES.CSV e scegliere Publish to catalog.
Selezionare il Catalogo approvazione mutuo (o il nome del catalogo) dall'elenco e fare clic su Avanti.
Selezionare l'opzione Vai al catalogo dopo averlo pubblicatoe fare clic su Avanti.
Esaminare gli asset e fare clic su Pubblica.
Nel catalogo, cercare
Mortgage
.Aprire MORTGAGE_APPLICANTS_INTEREST_RATES.CSV .
Fare clic sulla scheda Asset per visualizzare i dati.
Controllare i progressi compiuti
La seguente immagine mostra i MORTGAGE_APPLICANTS_INTEREST_RATES.CSV nel catalogo. I dati di cui i finanziatori hanno bisogno per prendere decisioni sui mutui sono ora disponibili.
In qualità di ingegnere dei dati presso Golden Bank, è stato integrato il richiedente del mutuo, la domanda, il rating del credito e le informazioni sull'indice di affidabilità creditizia e sono stati pubblicati tali dati in un catalogo.
Ripulitura (facoltativo)
Se si desidera riprendere le esercitazioni nel caso di utilizzo dell'integrazione dati, eliminare le seguenti risorse utente.
Risorse utente | Come eliminare |
---|---|
Catalogo approvazione mutuo | Elimina un catalogo |
Progetto di esempio di integrazione dati | Eliminare un progetto |
Passi successivi
Prova altre esercitazioni:
Registrati per un altro caso di utilizzo di Data fabric.
Ulteriori informazioni
Argomento principale: Esercitazioni del caso d'uso