0 / 0
Torna alla versione inglese della documentazione
Esercitazione sull'integrazione dei dati: Integrazione dei dati

Esercitazione sull'integrazione dei dati: Integrazione dei dati

Utilizzare questa esercitazione per trasformare i dati archiviati in tre origini dati esterne con il caso d'uso di integrazione dati della versione di prova del fabric di dati. L'obiettivo è quello di utilizzare DataStage per trasformare i dati e quindi fornire i dati trasformati in un singolo file di output. Se è stata completata l'esercitazione Virtualizza dati esterni , sono state eseguite molte delle stesse attività utilizzando Data Virtualization che questa esercitazione esegue utilizzando DataStage.

Avvio rapido: se non è stato ancora creato il progetto di esempio per questa esercitazione, accedere a Progetto di esempio di integrazione dati nell'hub di risorse.

La storia per il tutorial è che Golden Bank deve aderire a un nuovo regolamento in cui non può prestare a richiedenti di prestiti sottoqualificati. In qualità di ingegnere dei dati presso Golden Bank, attualmente si utilizza DataStage per aggregare i dati delle domande di mutuo anonimizzati con le informazioni di identificazione personale dei richiedenti del mutuo. I creditori utilizzano queste informazioni per decidere se approvare o rifiutare le richieste di mutuo. La tua leadership ha aggiunto alcuni analisti di rischio che calcolano quotidianamente quale tasso di interesse consigliano di offrire ai mutuatari in ogni intervallo di punteggio di credito. È necessario integrare queste informazioni nel foglio di calcolo che si condivide con i creditori. Il foglio di calcolo include le informazioni sull'indice di affidabilità creditizia per ogni richiedente, il debito totale del richiedente e una tabella di ricerca dei tassi di interesse. Infine, caricare i dati in un file CSV di output di destinazione.

La seguente immagine animata fornisce una rapida anteprima di ciò che si realizzerà entro la fine di questo tutorial. Si utilizzerà DataStage per unire i dati del richiedente e della domanda, filtrare per stato, unire i punteggi di credito del richiedente, calcolare il debito totale, ricercare il tasso di interesse del mutuo da offrire in base agli intervalli di punteggio di credito ed emettere il risultato in un file CSV. Fare clic sull'immagine per visualizzare un'immagine più grande.

Immagine animata

Anteprima dell'esercitazione

In questa esercitazione, verranno completate le seguenti attività:

Guarda il video Guarda questo video per visualizzare un'anteprima dei passi in questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.





Suggerimenti per completare questa esercitazioneDi seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.

Utilizzare il video immagine - in - immagine

Suggerimento: avviare il video, quindi, scorrendo l'esercitazione, il video passa alla modalità immagine - in - immagine. Chiudere il sommario video per la migliore esperienza con l'immagine in foto. È possibile utilizzare la modalità immagine - in - immagine in modo da poter seguire il video mentre si completano le attività in questa esercitazione. Fare clic sulle date / ore per ciascuna attività da seguire.

La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:

Come usare il picture-in-picture e i capitoli

Ottieni aiuto nella community

Se hai bisogno di aiuto con questa esercitazione, puoi fare una domanda o trovare una risposta nel forum di discussione della comunitàCloud Pak for Data.

Configurare le finestre del browser

Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.

Esercitazione e IU affiancati

Suggerimento: se si incontra un tour guidato mentre si completa questa esercitazione nell'interfaccia utente, fare clic su Forse in seguito.



Imposta i requisiti

Prerequisiti

Registrati per Cloud Pak for Data as a Service

Devi registrarti per Cloud Pak for Data as a Service e fornire i servizi necessari per il caso di utilizzo dell'integrazione dei dati.

  • Se hai un account Cloud Pak for Data as a Service esistente, puoi iniziare con questa esercitazione. Se hai un account del piano Lite, solo un utente per account può eseguire questa esercitazione.
  • Se non hai ancora un account Cloud Pak for Data as a Service , registrati per una versione di prova di data fabric.

Icona Video Guarda il seguente video per ulteriori informazioni su data fabric in Cloud Pak for Data.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.

Verificare i servizi di cui è stato eseguito il provisioning necessari

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 01:09.

Importante : il servizio DataStage è disponibile solo nelle regioni Dallas e Francoforte. Se necessario, passare alla regione di Dallas o Francoforte prima di continuare.

Attenersi alla seguente procedura per verificare o eseguire il provisioning dei servizi necessari:

  1. In Cloud Pak for Data, verifica di essere nella regione di Dallas o Francoforte. In caso contrario, fai clic sul menu a discesa della regione e seleziona Dallas o Francoforte.
    Modifica regione

  2. Nel menu di navigazione Cloud Pak for Data Menu di navigazione, scegli Services> Service instances.

  3. Utilizza l'elenco a discesa Prodotto per determinare se esiste un'istanza del servizio DataStage .

  4. Se devi creare un'istanza del servizio DataStage , fai clic su Aggiungi servizio.

  5. Selezionare DataStage.

    1. Per la regione, seleziona Dallas o Frankfurt.

    2. Seleziona il piano Lite.

    3. Fare clic su Crea.

  6. Ripetere questi passi per verificare o eseguire il provisioning dei seguenti servizi aggiuntivi:

    • IBM Knowledge Catalog
    • Cloud Object Storage

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra le istanze del servizio di cui è stato eseguito il provisioning:

Servizi con provisioning

Crea il progetto di esempio

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 01:00.

Se già si dispone del progetto di esempio per questa esercitazione, passare all' Attività 1. In caso contrario, attenersi alla seguente procedura:

  1. Accedere al progetto di esempio di integrazione dati nell'hub di risorse.

  2. Fare clic su Crea progetto.

  3. Se ti viene richiesto di associare il progetto a un'istanza Cloud Object Storage , seleziona un'istanza Cloud Object Storage dall'elenco.

  4. Fare clic su Crea.

  5. Attendere il completamento dell'importazione del progetto, quindi fare clic su Visualizza nuovo progetto per verificare che il progetto e gli asset siano stati creati correttamente.

  6. Fare clic sulla scheda Asset per visualizzare le connessioni e il flusso DataStage .

Nota: potresti visualizzare un tour guidato che mostra le esercitazioni incluse con questo caso di utilizzo. I link nel tour guidato apriranno queste istruzioni dell'esercitazione.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra la scheda Asset del progetto di esempio. È ora possibile avviare l'esercitazione.

Progetto di esempio




Attività 1: esecuzione di un flusso DataStage esistente

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 02:40.

Iniziare con un flusso DataStage di base che unisca i richiedenti del mutuo e i dataset delle applicazioni del mutuo e quindi eseguire l'output che risulta in un file CSV nel progetto. Seguire questi passi per eseguire il flusso DataStage :

  1. Iniziare nel progetto Integrazione dati . Se il progetto non è aperto, attenersi alla seguente procedura:

    1. Dal menu di navigazione Cloud Pak for Data Menu di navigazione, scegli Progetti> Visualizza tutti i progetti.

    2. Aprire il progetto Integrazione dati .

  2. Fare clic sulla scheda Asset per visualizzare tutti gli asset nel progetto.

  3. Fare clic su Flussi> DataStage.

    Suggerimento: se non vedi alcun flusso DataStage , torna indietro per visualizzare le tue istanze del servizio per verificare che il provisioning della tua istanza DataStage sia stato eseguito correttamente. Vedi Provisioning dei servizi necessari.
  4. Fai clic sul flusso Data integration nell'elenco per aprirlo. Questo flusso unisce le tabelle Richiedenti mutuo e Applicazioni mutuo memorizzate in Db2 Warehouse, filtra i dati a tali record dallo Stato della California e crea un file sequenziale in formato CSV come output.

  5. Fare clic sull'icona zoom avanti Zoom avanti e sull'icona zoom indietro Zoom indietro sulla Barra degli strumenti per impostare la vista preferita dell'area.

  6. Fare doppio clic su MORTGAGE_APPLICATIONS_1 per visualizzare le impostazioni.

    1. Espandere la sezione Proprietà .

    2. Scorrere verso il basso e fare clic su Anteprima dati. Questo dataset include le informazioni acquisite su un'applicazione di mutuo.

    3. Fare clic su Chiudi.

  7. Fare doppio clic sul nodo MORTGAGE_APPLICANTS_1 per visualizzare le impostazioni.

    1. Espandere la sezione Proprietà .

    2. Scorrere verso il basso e fare clic su Anteprima dati. Questo dataset include informazioni sui richiedenti del mutuo che hanno richiesto un prestito.

    3. Facoltativo: visualizzare i dati.

      1. Fare clic su Grafico .

      2. Nell'elenco Colonne da visualizzare , selezionare STATE.

      3. Fare clic su Visualizza dati per visualizzare un grafico a torta che mostra la distribuzione dei dati per stato.

      4. Fare clic sull'icona Treemap per visualizzare gli stessi dati in un grafico treemap.

    4. Fare clic su Chiudi.

  8. Fare doppio clic sul nodo Join_on_ID per visualizzare le impostazioni.

    1. Espandere la sezione Proprietà .

    2. Notare che la chiave di unione è la colonna ID.
      Chiave di unione Join_on_ID

    3. Fare clic su Annulla per chiudere le impostazioni.

  9. Fare clic sull'icona Log Visualizza log sulla barra degli strumenti in modo da poter visualizzare l'avanzamento del flusso.

  10. Fare clic su Compila, quindi fare clic su Esegui. In alternativa, fare clic su Esegui per compilare ed eseguire il flusso DataStage . Il completamento dell'esecuzione può richiedere circa un minuto.

  11. Visualizzare i log. È possibile utilizzare il numero totale di righe e righe / sec per ogni passo del flusso per verificare visivamente che il filtro funzioni come previsto.

  12. Quando l'esecuzione viene completata correttamente, fare clic su Integrazione dati nella traccia di navigazione per tornare al progetto.
    Traccia di navigazione

  13. Sulla scheda Asset , fare clic su Dati> Asset dati.

  14. Aprire MORTGAGE_INTEREST_RATES.CSV . È possibile vedere che questo file contiene le colonne sia dei richiedenti del mutuo che dei dataset delle applicazioni del mutuo.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra i MORTGAGE_INTEREST_RATES.CSV . L'attività successiva consiste nel modificare il flusso DataStage .

MORTGAGE_INTEREST_RATES.CSV




Panoramica: modifica il flusso DataStage

Ora che hai unito il richiedente del mutuo e i dati della domanda, sei pronto a modificare il flusso DataStage per:

  • Attività 2: specificare una colonna chiave per lo stage Join.
  • Attività 3: aggiungere i dati del punteggio di credito da un database PostgreSQL .
  • Attività 4: aggiungere una fase di unione per unire i dati dell'indice di affidabilità creditizia con i dati del richiedente e della domanda.
  • Attività 5: aggiungere uno stage Transformer per calcolare il debito totale.
  • Attività 6: aggiungere i dati del tasso di interesse da un database MongoDB .
  • Attività 7: aggiungere una fase di ricerca per cercare i tassi di interesse per i candidati in base ai loro punteggi di credito e agli intervalli di tassi di interesse giornalieri della Golden Bank.



Attività 2: specificare la colonna chiave per lo stage Join

video dell'esercitazione di anteprima Per visualizzare in anteprima questa attività, guardare il video a partire dalle 04:33.

L'identificazione di una colonna chiave indica a DataStage che la colonna contiene valori univoci. Il nodo Join_on_ID unisce i richiedenti del mutuo e i dataset di applicazione del mutuo utilizzando la colonna ID per la chiave di unione. La fase successiva consiste nell'unire il dataset risultante con i dati dell'indice di affidabilità creditizia. Successivamente, si uniranno i dati filtrati risultanti con il dataset dell'indice di affidabilità creditizia. La seconda unione utilizzerà la colonna EMAIL_ADDRESS come chiave di unione. In questa attività, si modifica il flusso DataStage per specificare la colonna EMAIL_ADDRESS come colonna chiave per il dataset risultante quando viene unito ai dati del punteggio di credito.

La seguente immagine animata fornisce una rappresentazione visiva alternativa alla descrizione dei due nodi di unione. Fare clic sull'immagine per visualizzare un'immagine più grande.

Nodi di unione

Attenersi alla seguente procedura per modificare le impostazioni del nodo Unione:

  1. Fare clic su Integrazione dati nella traccia di navigazione per tornare al progetto.
    Traccia di navigazione

  2. Nella scheda Asset , fare clic su Flussi> DataStage flussi.

  3. Aprire il flusso Integrazione dati .

  4. Fare doppio clic su Join_on_ID per modificare le impostazioni.

  5. Fare clic sulla scheda Output ed espandere la sezione Colonne per visualizzare un elenco delle colonne nel dataset unito.

  6. Fare clic su Modifica.

  7. Per il nome della colonna EMAIL_ADDRESS , selezionare Chiave.

  8. Fare clic su Applica e ritorna per tornare alle impostazioni di nodo Join_on_ID .

  9. Fare clic su Salva per salvare le impostazioni del nodo Join_on_ID .

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il flusso di DataStage con lo stage Join_on_id modificato. Ora che hai identificato la colonna EMAIL_ADDRESS come colonna chiave, puoi aggiungere i dati PostgreSQL contenenti i punteggi di credito dei richiedenti.

Stage Join_on_id




Attività 3: aggiunta di dati sull'indice di affidabilità creditizia da un database PostgreSQL

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 05:14.

Attieniti alla seguente procedura per aggiungere i dati dell'indice di affidabilità creditizie memorizzati in un database PostgreSQL al flusso DataStage :

  1. Nella palette dei nodi, espandere la sezione Connettori .

  2. Trascinare il connettore Browser asset nell'area di disegno accanto al nodo MORTGAGE_APPLICANTS_1 .

  3. Individuare l'asset selezionando Connessione> Data Fabric Prova - Databases for PostgreSQL > BANKING> CREDIT_SCORE.

    Nota: fare clic sul nome della connessione o dello schema invece che sulla casella di spunta per espandere la connessione e lo schema.

    Anteprima punteggio di credito

  4. Fare clic su Anteprima Visualizza per visualizzare l'anteprima dei dati di punteggio del credito per ogni richiedente.

  5. Fare clic su Aggiungi.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il flusso di DataStage con l'asset del punteggio di credito aggiunto. Ora che hai aggiunto i dati dell'indice di affidabilità creditizia all'area, devi unirti ai dati dell'aspirante, della domanda e dell'indice di affidabilità creditizia.

Asset di dati dell'indice di affidabilità creditizia




Attività 4: aggiunta di una fase di unione per unire i dati dell'indice di affidabilità creditizia con i dati del richiedente e della domanda

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 05:46.

Seguire questi passi per aggiungere un altro stage Join per unire i dati uniti dell'applicazione del mutuo filtrato e del richiedente del mutuo con i dati dell'indice di affidabilità creditizia nel flusso DataStage :

  1. Nella tavolozza dei nodi, espandere la sezione Stage .

  2. Trascinare lo stage Join nell'area di disegno e rilasciare il nodo sulla riga di link tra i nodi Filter_State_Code e Sequential_file_1 .

  3. Passare con il mouse sul connettore CREDIT_SCORE_1 per visualizzare la freccia. Connetti la freccia allo stage Join .

  4. Fare doppio clic sul nodo CREDIT_SCORE_1 per modificare le impostazioni.

    1. Fare clic sulla scheda Output ed espandere la sezione Colonne per visualizzare un elenco delle colonne nel dataset unito.

    2. Fare clic su Modifica.

    3. Per i nomi colonna EMAIL_ADDRESS e CREDIT_SCORE , selezionare Chiave.

    4. Fare clic su Applica e ritorna per tornare alle impostazioni del nodo CREDIT_SCORE_1 .

    5. Fare clic su Salva per salvare le impostazioni del nodo CREDIT_SCORE_1 .

  5. Fare doppio clic su Join_1 per modificare le impostazioni.

    1. Espandere la sezione Proprietà .

    2. Fare clic su Aggiungi chiave.

      1. Fare nuovamente clic su Aggiungi chiave .

      2. Selezionare EMAIL_ADDRESS dall'elenco di chiavi possibili.

      3. Fai clic su Applica.

    3. Fare clic su Applica e ritorna per tornare alle impostazioni di nodo Join_1 .

    4. Modificare il nome nodo Join_1 in Join_on_email.

    5. Fare clic su Salva per salvare le impostazioni del nodo Join_1 .

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra un flusso DataStage con un secondo stage Join aggiunto. Ora che hai unito i dati della domanda, del richiedente e dell'indice di affidabilità creditizia, devi aggiungere uno stage Transformer per calcolare il debito totale di ogni richiedente.

Stage Join_on_email




Attività 5: aggiunta di uno stage Transformer per calcolare il debito totale

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 07:00.

Seguire questa procedura per aggiungere uno stage Transformer che crea una nuova colonna sommando le colonne LOAN_AMOUNT e CREDITCARD_DEBT:

  1. Nella sezione Stage , trascinare lo stage Transformer nell'area di disegno e rilasciare il nodo sulla riga di collegamento tra i nodi Join_on_email e Sequential_file_1 .

  2. Fare doppio clic sul nodo Transformer per modificare le impostazioni.

  3. Fare clic sulla scheda Output .

    1. Fare clic su Aggiungi colonna.

    2. Scorrere verso il basso nell'elenco di colonne per visualizzare la nuova colonna.

    3. Denominare la colonna TOTAL_DEBT.

    4. Fare clic su Modifica Modifica nella colonna Derivazione della riga.

    5. Fare clic sull'icona Calcolatrice Strumento di calcolo nella colonna Derivazione per aprire il builder dell'espressione.

    6. Ricercare LOAN_AMOUNTe fare doppio clic sul nome della colonna per aggiungerlo all'espressione. Notare che il numero del collegamento viene aggiunto al nome della colonna.

    7. Immettere un segno più +.

    8. Ricercare CREDITCARD_DEBTe fare doppio clic sul nome della colonna per aggiungerlo all'espressione. Notare che il numero del collegamento viene aggiunto al nome della colonna.

    9. Verificare che l'espressione finale sia Link_5.LOAN_AMOUNT + Link_5.CREDITCARD_DEBT.

      Nota: il numero del link potrebbe essere diverso.
    10. Fare clic su Applica e ritorna per tornare alla pagina Transformer .

    11. Per il nome colonna CREDIT_SCORE , selezionare Chiave.

  4. Fare clic su Salva e torna per ritornare al canvas.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il flusso DataStage con lo stage Transformer aggiunto. Ora che hai calcolato il debito totale di ciascun richiedente, devi aggiungere la tabella dei tassi di interesse da offrire in base agli intervalli di punteggio del credito.

Stage Transformer




Attività 6: aggiunta di dati del tasso di interesse da un database MongoDB

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 07:49.

Effettuare le operazioni riportate di seguito per includere i tassi di interesse nel flusso aggiungendo un connettore dell'asset di dati a un database MongoDB :

  1. Nella palette dei nodi, espandere la sezione Connettori .

  2. Trascinare il connettore Browser asset nell'area di disegno accanto al nodo CREDIT_SCORE_1 .

  3. Individuare l'asset selezionando Connessione> Data Fabric Trial - Mongo DB> DOCUMENT> DS_INTEREST _RATES.

  4. Fare clic sull'icona Anteprima Anteprima per visualizzare un'anteprima dei tassi di interesse per ciascun intervallo di punteggio di credito.
    Visualizza asset di dati
    È possibile utilizzare i valori nelle colonne STARTING_LIMIT e ENDING_LIMIT per cercare il tasso di interesse appropriato in base all'indice di affidabilità creditizia del richiedente. La colonna ID non è necessaria, quindi verrà eliminata nel passo successivo.

  5. Fare clic su Aggiungi.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il flusso DataStage con l'asset di dati dei tassi di interesse aggiunto dall'origine esterna MongoDB . Ora che hai aggiunto la tabella dei tassi di interesse, puoi cercare il tasso di interesse appropriato per ogni candidato.

Asset dati tassi di interesse




Attività 7: Aggiungere una fase di ricerca per cercare i tassi di interesse per i richiedenti

video dell'esercitazione di anteprima Per visualizzare in anteprima questa attività, guardare il video a partire dalle 08:35.

In base all'indice di affidabilità creditizia di ciascun richiedente, si desidera ricercare il tasso di interesse appropriato. Seguire questa procedura per aggiungere una fase di ricerca e specificare l'intervallo per i limiti di punteggio di credito iniziale e finale per ciascun tasso di interesse:

  1. Nella sezione Stages , trascinare lo stage Lookup nell'area e rilasciare il nodo sulla linea di link tra i nodi Transformer_1 e Sequential_file_1 .

  2. Connetti il connettore DS_INTEREST_RATES_1 allo stage Lookup_1 .

  3. Fare doppio clic sul nodo DS_INTEREST_RATES_1 per modificare le impostazioni.

  4. Fare clic sulla scheda Output .

    1. Espandere la sezione Colonne e fare clic su Modifica.

    2. Selezionare la colonna _ID .

    3. Fare clic su Elimina Cestino per eliminare la colonna _ID .

    4. Fare clic su Applica e ritorna per tornare alle impostazioni del nodo DS_INTEREST_RATES_1 .

    5. Fare clic su Salva per salvare le modifiche al nodo DS_INTEREST_RATES_1 .

  5. Fare doppio clic sul nodo Lookup_1 per modificare le impostazioni.

  6. Espandere la sezione Proprietà .

    1. Per il campo Applica intervallo alle colonne , selezionare CREDIT_SCORE. Vengono visualizzati i campi Link di riferimento, Operatoree Colonna intervallo .

    2. Per Link di riferimenti, selezionare Link_9.

      Nota: il numero del link potrebbe essere diverso.
    3. Per il primo Operatore, selezionare < =.

    4. Per la prima Colonna intervallo, selezionare ENDING_LIMIT.

    5. Per il secondo Operatore, selezionare > =.

    6. Per la seconda colonna Intervallo, selezionare STARTING_LIMIT.

  7. Fare clic sulla scheda Output .

    1. Espandere la sezione Colonne e fare clic su Modifica.

    2. Selezionare le colonne STARTING_LIMIT e ENDING_LIMIT .

    3. Fare clic sull'icona Elimina Cestino per eliminare queste colonne STARTING_LIMIT e ENDING_LIMIT non necessarie.

    4. Fare clic su Applica e torna per tornare alle impostazioni del nodo Lookup_1 .

    5. Fare clic su Salva per salvare le modifiche al nodo Lookup_1 .

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il flusso DataStage con lo stage Lookup aggiunto. Il flusso DataStage è ora completo. L'ultima attività prima di eseguire il flusso consiste nel specificare il nome per il file di output.

Stage Lookup




Attività 8: modificare il nodo del file sequenziale ed eseguire il flusso DataStage

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 09:30.

Seguire questa procedura per modificare il nodo del file sequenziale per creare un file di output finale come asset di dati nel progetto, quindi compilare ed eseguire il flusso DataStage :

  1. Fare doppio clic sul nodo Sequential_file_1 per modificare le impostazioni.

  2. Fare clic sulla scheda Input .

  3. Espandere la sezione Proprietà .

  4. Per il file di destinazione, copiare e incollare MORTGAGE_APPLICANTS_INTEREST_RATES.CSV come nome file.

  5. Selezionare Crea asset di dati.

  6. Per il campo La prima riga è nomi colonna , selezionare True.

  7. Fare clic su Salva.

  8. Fare clic su Esegui per compilare ed eseguire il flusso DataStage . Il completamento del lavoro richiede circa 1 minuto.

  9. Fare clic su Log sulla barra degli strumenti per osservare l'avanzamento del flusso. È normale visualizzare le avvertenze durante l'esecuzione, quindi si vede che il flusso è stato eseguito correttamente.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra che il flusso di DataStage è stato correttamente eseguito. Ora che il flusso DataStage ha creato il file di output, è necessario creare il catalogo in cui verrà pubblicato il file di output.

Esecuzione di DataStage completata




Attività 9: creare un catalogo per memorizzare l'asset di dati pubblicato

video dell'esercitazione di anteprima Per visualizzare in anteprima questa attività, guardare il video a partire dalle 10:28.

Altri data engineers e analisti di Golden Bank hanno bisogno di accedere ai tassi di interesse ipotecari. Con il piano IBM Knowledge Catalog Lite, è possibile creare due catalogo. Se si dispone già di un catalogo, ignorare questo passaggio. Altrimenti, completare la seguente procedura per creare un catalogo in cui è possibile pubblicare il dataset dei tassi di interesse.

  1. Dal menu di navigazione Cloud Pak for Data Menu di navigazione, scegli Cataloghi> Visualizza tutti i cataloghi.

  2. Se viene visualizzato un Catalogo di approvazione del mutuo nella pagina Cataloghi , passare all' Attività 10: visualizzare l'output e pubblicarlo in un catalogo. Altrimenti, attenersi alla seguente procedura per creare un nuovo catalogo:

  3. Fare clic su Crea catalogo.

  4. Per il Nome, copiare e incollare il nome del catalogo esattamente come mostrato senza spazi iniziali o finali:

    Mortgage Approval Catalog
    
  5. Selezionare Applica regole di protezione dati, confermare la selezione e accettare i valori predefiniti per gli altri campi.

  6. Fare clic su Crea.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il tuo catalogo. Ora che il catalogo di approvazione del mutuo esiste, è possibile pubblicare il file di output nel catalogo.

Catalogo approvazione mutuo




Attività 10: visualizzazione dell'output e pubblicazione in un catalogo

video dell'esercitazione di anteprima Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 10:00.

Attenersi alla seguente procedura per visualizzare il file di output nel progetto e pubblicarlo in un catalogo:

  1. Dal menu di navigazione Cloud Pak for Data Menu di navigazione, scegli Progetti> Visualizza tutti i progetti.

  2. Aprire il progetto Integrazione dati .

  3. Sulla scheda Asset , fare clic su Dati> Asset dati.

  4. Aprire MORTGAGE_APPLICANTS_INTEREST_RATES.CSV .

  5. Scorrere per visualizzare tutte le colonne nel dataset integrato con i tassi di interesse alla fine di ciascuna voce di dati.

  6. Fare clic su Integrazione dati nella traccia di navigazione per tornare al progetto.

  7. Sulla scheda Asset , fare clic sul menu Overflow Menu di overflow alla fine della riga per MORTGAGE_APPLICANTS_INTEREST_RATES.CSV e scegliere Pubblica nel catalogo.

    1. Selezionare il Catalogo approvazione mutuo (o il nome del catalogo) dall'elenco e fare clic su Avanti.

    2. Selezionare l'opzione Vai al catalogo dopo averlo pubblicatoe fare clic su Avanti.

    3. Esaminare gli asset e fare clic su Pubblica.

  8. Nel catalogo, cercare Mortgage.

  9. Aprire MORTGAGE_APPLICANTS_INTEREST_RATES.CSV .

  10. Fare clic sulla scheda Asset per visualizzare i dati.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra i MORTGAGE_APPLICANTS_INTEREST_RATES.CSV nel catalogo. I dati di cui i finanziatori hanno bisogno per prendere decisioni sui mutui sono ora disponibili.

MORTGAGE_APPLICANTS_INTEREST_RATES.CSV nel catalogo



In qualità di ingegnere dei dati presso Golden Bank, è stato integrato il richiedente del mutuo, la domanda, il rating del credito e le informazioni sull'indice di affidabilità creditizia e sono stati pubblicati tali dati in un catalogo.

Ripulitura (facoltativo)

Se si desidera riprendere le esercitazioni nel caso di utilizzo dell'integrazione dati, eliminare le seguenti risorse utente.

Risorse utente Come eliminare
Catalogo approvazione mutuo Elimina un catalogo
Progetto di esempio di integrazione dati Eliminare un progetto

Passi successivi

Ulteriori informazioni

Argomento principale: Esercitazioni del caso d'uso

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni