0 / 0
Torna alla versione inglese della documentazione

Esempi di estrazione di dati da file Microsoft Excel (DataStage® )

Ultimo aggiornamento: 12 mar 2025
Esempi di estrazione di dati da file Microsoft Excel (DataStage )

È possibile creare job di esempio che estraggono dati da file di Microsoft Excel. In questo esempio, Sequential File lo stadio viene utilizzato come stadio di uscita. È possibile utilizzare qualsiasi altra fase di output per creare l'output.

Per ottenere i file per gli esempi, estrarre il file IS_install\Clients\Samples\Connectors\UnstructuredData_Samples.zip .

Esempio 1: Estrazione di dati da un intervallo in un file di Microsoft Excel

Creare un lavoro che utilizzi lo stage Excel per recuperare i dati da un intervallo in un foglio di calcolo di Microsoft Excel.

Questo esempio utilizza il file Microsoft Excel di esempio Employee1.xls, che contiene i dettagli dei dipendenti di un'organizzazione. Questo file di esempio ha tre fogli di calcolo: Sheet1, Sheet2 e Sheet3.Sheet1 contengono informazioni sui dipendenti di ogni reparto dell'organizzazione. Sheet2 ESheet3 sono vuoti. In questo esempio, estrai le informazioni aziendali solo sui dipendenti che lavorano per il dipartimento B01.

Per estrarre i dati da un intervallo in un file Excel:
  1. Creare un lavoro che includa una fase Excel e una fase Sequential File.
  2. Fare doppio clic sullo stage di Excel.
  3. Nella finestra Configurazione, specificare il percorso completo del file di input di Microsoft Excel Employee1.xls.
  4. Dall'elenco Opzione intervallo, selezionare Specifica l'intero intervallo di dati per estrarre i dati in un intervallo specifico.
  5. Nel Espressione della gamma campo, specificareSheet1!A16:K28 .
  6. Dal campo Intestazione colonna, selezionare la Prima riga di intervalli di dati. Quando si seleziona la Prima riga di intervalli di dati, la prima riga viene considerata come intestazione e lo stage di Excel inizia a estrarre dalla seconda riga.
  7. Deselezionare la casella di controllo accanto alle colonne E (numero di telefono) e I (data di nascita) di Microsoft Excel.
  8. Fare clic su Importa e OK. Facendo clic su Importa, il riquadro Mappa in basso a destra della finestra Configurazione si aggiorna.
  9. Nella pagina Output > Colonna, cambiare il tipo della colonna EMP_NO in Integer, quindi fare clic su OK.
  10. Fare doppio clic sulla fase File sequenziale. Sul Proprietà pagina, specificare il percorso in cui si desidera creare il file di output, seguito dal nome del fileOutputOfExample1.txt e fare clic OK.
  11. Salvare il job. Ora è possibile compilare ed eseguire il lavoro.

Nella tabella seguente vengono visualizzate le informazioni in un file di input di Microsoft Excel che contiene le informazioni sui dipendenti per diversi reparti.

Tabella 1. Esempio di file Microsoft Excel con i dettagli dei dipendenti
EMP NO NOME METÀ INIZIO COGNOME TELEFONO N Data Assunzione LAVORO Sesso Data di nascita
Dipendenti dentro DEPT_A00
10 CRISTINA I HAAS 3978 1/1/1995 PRES F 24/08/1963
20 Michael L THOMSON 3476 10/10/2003 Manager M 2/2/1976
30 SORTITA A KWAN 4738 4/5/2005 Manager F 5/11/1971
50 John B GEYER 6789 17/08/1979 Manager M 15/09/1955
Dipendenti dentro DEPT_B01
60 Irving F POPPA 6423 14/09/2003 Manager M 7/7/1975
70 EVA D Pulaski 7831 30/9/2003 Manager F 26/05/2003
90 EILEEN W Henderson 5498 15/08/2000 Manager F 15/05/1971
100 TEODORO Q SPENSER 742 19/06/2000 Manager M 18/12/1980
110 VINCENZO G LUCCHESSI 3490 16/05/1988 RAPPRESENTANTE DELLE VENDITE M 5/11/1958
120 SEAN   O'CONNELL 2167 12/51993 impiegato M 18/10/1972
130 DELORES M QUINTANA 4578 28/07/2001 Analista F 15/09/1955
140 Heather A NICHOLLS 1793 15/12/2006 Analista F 19/01/1976
150 Bruce   ADAMO 4510 2/12/2002 Designer M 17/05/1972
160 ELISABETTA R PIANKA 3782 10/11/2006 Designer F 4/12/1980
1770 MASATOSHI J YOSHIMURA 2890 15/09/1999 Designer M 5/1/1981
180 MARILINA S SCOUTTEN 1682 7/7/2003 Designer F 21/02/1978

Una volta eseguito il lavoro, è possibile aprire il fileOutputOfExample1.txt file per visualizzare il risultato.

Il file OutputOfExample1.txt visualizza i dati per DEPT_B01 ad eccezione delle colonne N. di telefono e DATA DI NASCITA:
"60","IRVING","F","STERN","2003-09-14","MANAGER ","M","72250","500"
"70","EVA","D","PULASKI","2005-09-30","MANAGER ","F","96170","700"
"90","EILEEN","W","HENDERSON","2000-08-15","MANAGER ","F","89750","600"
"100","THEODORE","Q","SPENSER","2000-06-19","MANAGER ","M","86150","500"
"110","VINCENZO","G","LUCCHESSI","1988-05-16","SALESREP","M","66500","900"
"120","SEAN"," ","O'CONNELL","1993-12-05","CLERK   ","M","49250","600"
"130","DELORES","M","QUINTANA","2001-07-28","ANALYST ","F","73800","500"
"140","HEATHER","A","NICHOLLS","2006-12-15","ANALYST ","F","68420","600"
"150","BRUCE"," ","ADAMSON","2002-02-12","DESIGNER","M","55280","500"
"160","ELIZABETH","R","PIANKA","2006-10-11","DESIGNER","F","62250","400"
"170","MASATOSHI","J","YOSHIMURA","1999-09-15","DESIGNER","M","44680","500"
"180","MARILYN","S","SCOUTTEN","2003-07-07","DESIGNER","F","51340","500"

Esempio 2: estrazione di dati da più fogli Microsoft Excel

Questo esempio utilizza il file Microsoft Excel di esempio Employee2.xls. Questo file di esempio contiene i seguenti fogli:DEPT A00 ,DEPT B01 ,DEPT C01 , EDEPT D01 . Ogni scheda contiene informazioni sui dipendenti del dipartimento.

La struttura dei dati di ciascun foglio è simile. Ogni foglio ha le colonne EMP NO, FIRST NAME, MID INIT, LAST NAME, TELEFONO, HIRE DATE, JOB e ADDRESS e la terza riga è l'intestazione. Ma ogni foglio ha un numero diverso di righe.

Per estrarre dati da più file:
  1. Nella finestra Configurazione, specificare il percorso completo del file di input di Microsoft Excel Employee2.xls.
  2. Dal Opzione di intervallo, Selezionare Specificare la riga iniziale.
  3. Nel Espressione della gamma campo, specificareA3:H3 . Quando lo stage viene eseguito con l'opzione Specifica la prima riga e non viene specificato alcun nome di foglio specifico nell'espressione Range, il lavoro trova l'ultima riga ed estrae le righe fino all'ultima riga in fase di esecuzione.
  4. Nell'intestazione della colonna, selezionare la prima riga di intervalli di dati.
  5. Sul Proprietà scheda, seleziona la casella di controllo accanto alla proprietà per estrarre il valore della proprietà. In questo esempio, seleziona il Nome foglio come proprietà.
  6. Fare clic su Importa. Lo stage genera le mappature delle colonne.
  7. Per fare il SheetNname colonna la prima colonna dell'elenco, selezionare il SheetName colonna e fare clic Su fino al SheetName colonna è la prima colonna dell'elenco.
  8. Nella tabella di mappatura, inserire una riga per la colonna INDIRIZZO nel file di input che contiene il collegamento ipertestuale.
    1. Clic Inserire
    2. Nel Elemento Excel opzione, seleziona Colonna INDIRIZZO.
    3. Nella cella di opzione Importa della nuova riga, selezionare l'indirizzo Hyper link.
    4. Specificare la DataStage nome della colonna EMAIL_ADDRESS per la nuova riga. Quindi, fare clic su OK.
  9. Fare clic sulla scheda Output > Colonna per modificare il tipo di dati o altri attributi.
  10. Cambia il tipo diEMP_NO colonna a Numero intero. Fare clic su OK.
  11. Sul Proprietà pagina, specificare il percorso in cui si desidera creare il file di output, seguito dal nome del fileOutputOfExample2.txt . Fare clic su OK.
  12. Salvare il job. Ora è possibile compilare ed eseguire il lavoro.

Un esempio di file Microsoft Excel di input che contiene le informazioni sui dipendenti per ogni reparto nei diversi fogli. Gli estratti dei dati dei dipendenti di tutti i fogli vengono visualizzati sotto forma di tabelle:

Tabella 2. Informazioni sui dipendenti in DEPT_A00
EMP NO NOME METÀ INIZIO COGNOME TELEFONO N Data Assunzione LAVORO Sesso Data di nascita
10 CRISTINA I HAAS 3978 1/1/1995 PRES F 24/08/1963
20 Michael L THOMSON 3476 10/10/2003 Manager M 2/2/1976
30 SORTITA A KWAN 4738 4/5/2005 Manager F 5/11/1971
50 John B GEYER 6789 17/08/1979 Manager M 15/09/1955
Tabella 3. Dettagli dei dipendenti in Dipendenti in DEPT_B01
EMP NO NOME MIDI NIT COGNOME TELEFONO N Data Assunzione LAVORO Sesso Data di nascita
60 Irving F POPPA 6423 14/09/2003 Manager M 7/7/1975
70 EVA D Pulaski 7831 30/9/2003 Manager F 26/05/2003
90 EILEEN W Henderson 5498 15/08/2000 Manager F 15/05/1971
100 TEODORO Q SPENSER 742 19/06/2000 Manager M 18/12/1980
110 VINCENZO G LUCCHESSI 3490 16/05/1988 RAPPRESENTANTE DELLE VENDITE M 5/11/1958
120 SEAN   O'CONNELL 2167 12/51993 impiegato M 18/10/1972
130 DELORES M QUINTANA 4578 28/07/2001 Analista F 15/09/1955
140 Heather A NICHOLLS 1793 15/12/2006 Analista F 19/01/1976
150 Bruce   ADAMO 4510 2/12/2002 Designer M 17/05/1972
160 ELISABETTA R PIANKA 3782 10/11/2006 Designer F 4/12/1980
1770 MASATOSHI J YOSHIMURA 2890 15/09/1999 Designer M 5/1/1981
180 MARILINA S SCOUTTEN 1682 7/7/2003 Designer F 21/02/1978

Dopo l'esecuzione del lavoro, è possibile aprire il file OutputOfExample2.txt che contiene il seguente risultato.

"DEPT A00","10","CHRISTINE","I","HAAS","3978","1995-01-01","PRES    ","CHRISTINE HAAS","mailto:CHRISTINE%[email protected]"
"DEPT A00","20","MICHAEL","L","THOMPSON","3476","2003-10-10","MANAGER ","MICHAEL THOMPSON","mailto:MICHAEL%[email protected]"
"DEPT A00","30","SALLY","A","KWAN","4738","2005-04-05","MANAGER ","SALLY KWAN","mailto:SALLY%[email protected]"
"DEPT A00","50","JOHN","B","GEYER","6789","1979-08-17","MANAGER ","JOHN GEYER","mailto:JOHN%[email protected]"
"DEPT B01","60","IRVING","F","STERN","6423","2003-09-14","MANAGER ","IRVING STERN","mailto:IRVING%[email protected]"
"DEPT B01","70","EVA","D","PULASKI","7831","2005-09-30","MANAGER ","EVA PULASKI","mailto:EVA%[email protected]"
"DEPT B01","90","EILEEN","W","HENDERSON","5498","2000-08-15","MANAGER ","EILEEN HENDERSON","mailto:EILEEN%[email protected]"
"DEPT B01","100","THEODORE","Q","SPENSER","972","2000-06-19","MANAGER ","THEODORE SPENSER","mailto:THEODORE%[email protected]"
"DEPT B01","110","VINCENZO","G","LUCCHESSI","3490","1988-05-16","SALESREP","VINCENZO LUCCHESSI","mailto:VINCENZO%[email protected]"
"DEPT B01","120","SEAN"," ","O'CONNELL","2167","1993-12-05","CLERK   ","SEAN O'CONNELL","mailto:SEAN%20O'[email protected]"
"DEPT B01","130","DELORES","M","QUINTANA","4578","2001-07-28","ANALYST ","DELORES QUINTANA","mailto:DELORES%[email protected]"
"DEPT B01","140","HEATHER","A","NICHOLLS","1793","2006-12-15","ANALYST ","HEATHER NICHOLLS","mailto:HEATHER%[email protected]"
"DEPT B01","150","BRUCE"," ","ADAMSON","4510","2002-02-12","DESIGNER","BRUCE ADAMSON","mailto:BRUCE%[email protected]"
"DEPT B01","160","ELIZABETH","R","PIANKA","3782","2006-10-11","DESIGNER","ELIZABETH PIANKA","mailto:ELIZABETH%[email protected]"
"DEPT B01","170","MASATOSHI","J","YOSHIMURA","2890","1999-09-15","DESIGNER","MASATOSHI YOSHIMURA","mailto:MASATOSHI%[email protected]"
"DEPT B01","180","MARILYN","S","SCOUTTEN","1682","2003-07-07","DESIGNER","MARILYN SCOUTTEN","mailto:MARILYN%[email protected]"
"DEPT C01","190","JAMES","H","WALKER","2986","2004-07-26","DESIGNER","JAMES WALKER","mailto:JAMES%[email protected]"
"DEPT C01","200","DAVID"," ","BROWN","4501","2002-03-03","DESIGNER","DAVID BROWN","mailto:DAVID%[email protected]"
"DEPT C01","210","WILLIAM","T","JONES","942","1998-04-11","DESIGNER","WILLIAM JONES","mailto:WILLIAM%[email protected]"
"DEPT C01","220","JENNIFER","K","LUTZ","672","1998-08-29","DESIGNER","JENNIFER LUTZ","mailto:JENNIFER%[email protected]"
"DEPT C01","230","JAMES","J","JEFFERSON","2094","1996-11-21","CLERK   ","JAMES JEFFERSON","mailto:JAMES%[email protected]"
"DEPT C01","240","SALVATORE","M","MARINO","3780","2004-12-05","CLERK   ","SALVATORE MARINO","mailto:SALVATORE%[email protected]"
"DEPT C01","250","DANIEL","S","SMITH","961","1999-10-30","CLERK   ","DANIEL SMITH","mailto:DANIEL%[email protected]"
"DEPT C01","260","SYBIL","P","JOHNSON","8953","2005-09-11","CLERK   ","SYBIL JOHNSON","mailto:SYBIL%[email protected]"
"DEPT D01","270","MARIA","L","PEREZ","9001","2006-09-30","CLERK   ","MARIA PEREZ","mailto:MARIA%[email protected]"
"DEPT D01","280","ETHEL","R","SCHNEIDER","8997","1997-03-24","OPERATOR","ETHEL SCHNEIDER","mailto:ETHEL%[email protected]"
"DEPT D01","290","JOHN","R","PARKER","4502","2006-05-30","OPERATOR","JOHN PARKER","mailto:JOHN%[email protected]"
"DEPT D01","300","PHILIP","X","SMITH","2095","2002-06-19","OPERATOR","PHILIP SMITH","mailto:PHILIP%[email protected]"
"DEPT D01","310","MAUDE","F","SETRIGHT","3332","1994-09-12","OPERATOR","MAUDE SETRIGHT","mailto:MAUDE%[email protected]"
"DEPT D01","320","RAMLAL","V","MEHTA","9990","1995-07-07","FIELDREP","RAMLAL MEHTA","mailto:RAMLAL%[email protected]"
"DEPT D01","330","WING"," ","LEE","2103","2006-02-23","FIELDREP","WING LEE","mailto:WING%[email protected]"
"DEPT D01","340","JASON","R","GOUNOT","5698","1977-05-05","FIELDREP","JASON GOUNOT","mailto:JASON%[email protected]"

Esempio 3: estrazione di dati da più intervalli con strutture dati diverse in un file Microsoft Excel

Questo esempio utilizza il file Microsoft Excel di esempio Employee3.xls. Questo file di esempio ha due fogli di calcolo,Departments EEmployees , che hanno strutture dati diverse.

In questo esempio, lo stage Excel ha due collegamenti di uscita. Si estraggono i dati dal foglio Departments al primo link e dal foglio Employees al secondo link.

Per estrarre diverse strutture dati:
  1. Creare un lavoro che includa una fase Excel e due fasi Sequential File. Puoi rinominare i tuoi collegamenti come Dipartimenti e Dipendenti.
  2. Fare doppio clic sullo stage di Excel. Nella finestra Configurazione, specificare il percorso completo del file di input di Microsoft Excel Employee3.xls.
  3. Specificate i dati da estrarre dal foglio elettronico Dipartimenti e completate i seguenti passaggi secondari per generare le mappature delle colonne.
    1. Dal Collegamento casella di riepilogo, selezionare Dipartimenti.
    2. Dal Opzione di intervallo elenco, seleziona Specificare l'intero intervallo.
    3. Dal Espressione della gamma campo, specificare Dipartimenti!A2:C6 .
    4. Da Intestazione colonne, selezionare Prima riga di intervalli di dati.
    5. Clic Importare, quindi fare clic su OK.
  4. Specificare i dati da estrarre dal file Dipendenti foglio di calcolo e completare i passaggi secondari seguenti per generare le mappature delle colonne.
    1. Dal Collegamento casella di riepilogo, selezionare Dipendenti.
    2. Dal Opzione di intervallo elenco, Specificare l'intero intervallo.
    3. Dal Espressione della gamma campo, specificare Dipendenti!A2:L34.
    4. Dal Intestazione di colonna, Selezionare Prima riga di intervalli di dati.
    5. Clic Importare, quindi fare clic su OK.
  5. Nella pagina Output, seleziona il file Dipendenti collegamento come nome dell'output.
  6. Nella pagina Colonne, modificate il tipo di dati della colonna EMP_NO in un numero intero, quindi fate clic su OK.
  7. Fare doppio clic sul primo Sequential File palcoscenicoOutput_1 e specificare il percorso per creare il file di output, seguito dal nome del fileOutputOfExample3_1.txt .
  8. Fate doppio clic sul secondo stadio Sequential File Output_2, e specificate il percorso per creare il file di output, seguito dal nome del file OutputOfExample3_2.txt
  9. Salvare il job. Ora è possibile compilare ed eseguire il lavoro.

Un esempio di file Microsoft Excel di input Employee3.xls contiene informazioni sui dipartimenti nel foglio Dipartimenti e informazioni sui dipendenti nel foglio Dipendenti. Il lavoro estrae i dati del reparto inOutputOfExample3_1.txt archiviare i dati dei dipendentiOutputOfExample3_2.txt .

Una volta eseguito il lavoro, aprire il fileOutputOfExample3_1.txt file eOutputOfExample3_2.txt file. ILOutputOfExample3_1.txt il file dovrebbe corrispondere a Dipartimenti foglio eOutputOfExample3_2.txt il file dovrebbe corrispondere a Dipendenti foglio dalEmployee.xls file.