Esempi di estrazione di dati da file Microsoft Excel (DataStage® )
È possibile creare job di esempio che estraggono dati da file di Microsoft Excel. In questo esempio, Sequential File lo stadio viene utilizzato come stadio di uscita. È possibile utilizzare qualsiasi altra fase di output per creare l'output.
Per ottenere i file per gli esempi, estrarre il file IS_install\Clients\Samples\Connectors\UnstructuredData_Samples.zip .
Esempio 1: Estrazione di dati da un intervallo in un file di Microsoft Excel
Creare un lavoro che utilizzi lo stage Excel per recuperare i dati da un intervallo in un foglio di calcolo di Microsoft Excel.
Questo esempio utilizza il file Microsoft Excel di esempio Employee1.xls, che contiene i dettagli dei dipendenti di un'organizzazione. Questo file di esempio ha tre fogli di calcolo: Sheet1, Sheet2 e Sheet3.Sheet1 contengono informazioni sui dipendenti di ogni reparto dell'organizzazione. Sheet2 ESheet3 sono vuoti. In questo esempio, estrai le informazioni aziendali solo sui dipendenti che lavorano per il dipartimento B01.
- Per estrarre i dati da un intervallo in un file Excel:
- Creare un lavoro che includa una fase Excel e una fase Sequential File.
- Fare doppio clic sullo stage di Excel.
- Nella finestra Configurazione, specificare il percorso completo del file di input di Microsoft Excel Employee1.xls.
- Dall'elenco Opzione intervallo, selezionare Specifica l'intero intervallo di dati per estrarre i dati in un intervallo specifico.
- Nel Espressione della gamma campo, specificareSheet1!A16:K28 .
- Dal campo Intestazione colonna, selezionare la Prima riga di intervalli di dati. Quando si seleziona la Prima riga di intervalli di dati, la prima riga viene considerata come intestazione e lo stage di Excel inizia a estrarre dalla seconda riga.
- Deselezionare la casella di controllo accanto alle colonne E (numero di telefono) e I (data di nascita) di Microsoft Excel.
- Fare clic su Importa e OK. Facendo clic su Importa, il riquadro Mappa in basso a destra della finestra Configurazione si aggiorna.
- Nella pagina EMP_NO in Integer, quindi fare clic su OK. , cambiare il tipo della colonna
- Fare doppio clic sulla fase File sequenziale. Sul Proprietà pagina, specificare il percorso in cui si desidera creare il file di output, seguito dal nome del fileOutputOfExample1.txt e fare clic OK.
- Salvare il job. Ora è possibile compilare ed eseguire il lavoro.
Nella tabella seguente vengono visualizzate le informazioni in un file di input di Microsoft Excel che contiene le informazioni sui dipendenti per diversi reparti.
EMP NO | NOME | METÀ INIZIO | COGNOME | TELEFONO N | Data Assunzione | LAVORO | Sesso | Data di nascita |
---|---|---|---|---|---|---|---|---|
Dipendenti dentro DEPT_A00 | ||||||||
10 | CRISTINA | I | HAAS | 3978 | 1/1/1995 | PRES | F | 24/08/1963 |
20 | Michael | L | THOMSON | 3476 | 10/10/2003 | Manager | M | 2/2/1976 |
30 | SORTITA | A | KWAN | 4738 | 4/5/2005 | Manager | F | 5/11/1971 |
50 | John | B | GEYER | 6789 | 17/08/1979 | Manager | M | 15/09/1955 |
Dipendenti dentro DEPT_B01 | ||||||||
60 | Irving | F | POPPA | 6423 | 14/09/2003 | Manager | M | 7/7/1975 |
70 | EVA | D | Pulaski | 7831 | 30/9/2003 | Manager | F | 26/05/2003 |
90 | EILEEN | W | Henderson | 5498 | 15/08/2000 | Manager | F | 15/05/1971 |
100 | TEODORO | Q | SPENSER | 742 | 19/06/2000 | Manager | M | 18/12/1980 |
110 | VINCENZO | G | LUCCHESSI | 3490 | 16/05/1988 | RAPPRESENTANTE DELLE VENDITE | M | 5/11/1958 |
120 | SEAN | O'CONNELL | 2167 | 12/51993 | impiegato | M | 18/10/1972 | |
130 | DELORES | M | QUINTANA | 4578 | 28/07/2001 | Analista | F | 15/09/1955 |
140 | Heather | A | NICHOLLS | 1793 | 15/12/2006 | Analista | F | 19/01/1976 |
150 | Bruce | ADAMO | 4510 | 2/12/2002 | Designer | M | 17/05/1972 | |
160 | ELISABETTA | R | PIANKA | 3782 | 10/11/2006 | Designer | F | 4/12/1980 |
1770 | MASATOSHI | J | YOSHIMURA | 2890 | 15/09/1999 | Designer | M | 5/1/1981 |
180 | MARILINA | S | SCOUTTEN | 1682 | 7/7/2003 | Designer | F | 21/02/1978 |
Una volta eseguito il lavoro, è possibile aprire il fileOutputOfExample1.txt file per visualizzare il risultato.
"60","IRVING","F","STERN","2003-09-14","MANAGER ","M","72250","500"
"70","EVA","D","PULASKI","2005-09-30","MANAGER ","F","96170","700"
"90","EILEEN","W","HENDERSON","2000-08-15","MANAGER ","F","89750","600"
"100","THEODORE","Q","SPENSER","2000-06-19","MANAGER ","M","86150","500"
"110","VINCENZO","G","LUCCHESSI","1988-05-16","SALESREP","M","66500","900"
"120","SEAN"," ","O'CONNELL","1993-12-05","CLERK ","M","49250","600"
"130","DELORES","M","QUINTANA","2001-07-28","ANALYST ","F","73800","500"
"140","HEATHER","A","NICHOLLS","2006-12-15","ANALYST ","F","68420","600"
"150","BRUCE"," ","ADAMSON","2002-02-12","DESIGNER","M","55280","500"
"160","ELIZABETH","R","PIANKA","2006-10-11","DESIGNER","F","62250","400"
"170","MASATOSHI","J","YOSHIMURA","1999-09-15","DESIGNER","M","44680","500"
"180","MARILYN","S","SCOUTTEN","2003-07-07","DESIGNER","F","51340","500"
Esempio 2: estrazione di dati da più fogli Microsoft Excel
Questo esempio utilizza il file Microsoft Excel di esempio Employee2.xls. Questo file di esempio contiene i seguenti fogli:DEPT A00 ,DEPT B01 ,DEPT C01 , EDEPT D01 . Ogni scheda contiene informazioni sui dipendenti del dipartimento.
La struttura dei dati di ciascun foglio è simile. Ogni foglio ha le colonne EMP NO, FIRST NAME, MID INIT, LAST NAME, TELEFONO, HIRE DATE, JOB e ADDRESS e la terza riga è l'intestazione. Ma ogni foglio ha un numero diverso di righe.
- Per estrarre dati da più file:
- Nella finestra Configurazione, specificare il percorso completo del file di input di Microsoft Excel Employee2.xls.
- Dal Opzione di intervallo, Selezionare Specificare la riga iniziale.
- Nel Espressione della gamma campo, specificareA3:H3 . Quando lo stage viene eseguito con l'opzione Specifica la prima riga e non viene specificato alcun nome di foglio specifico nell'espressione Range, il lavoro trova l'ultima riga ed estrae le righe fino all'ultima riga in fase di esecuzione.
- Nell'intestazione della colonna, selezionare la prima riga di intervalli di dati.
- Sul Proprietà scheda, seleziona la casella di controllo accanto alla proprietà per estrarre il valore della proprietà. In questo esempio, seleziona il Nome foglio come proprietà.
- Fare clic su Importa. Lo stage genera le mappature delle colonne.
- Per fare il SheetNname colonna la prima colonna dell'elenco, selezionare il SheetName colonna e fare clic Su fino al SheetName colonna è la prima colonna dell'elenco.
- Nella tabella di mappatura, inserire una riga per la colonna INDIRIZZO nel file di input che contiene il collegamento ipertestuale.
- Clic Inserire
- Nel Elemento Excel opzione, seleziona Colonna INDIRIZZO.
- Nella cella di opzione Importa della nuova riga, selezionare l'indirizzo Hyper link.
- Specificare la DataStage nome della colonna EMAIL_ADDRESS per la nuova riga. Quindi, fare clic su OK.
- Fare clic sulla scheda per modificare il tipo di dati o altri attributi.
- Cambia il tipo diEMP_NO colonna a Numero intero. Fare clic su OK.
- Sul Proprietà pagina, specificare il percorso in cui si desidera creare il file di output, seguito dal nome del fileOutputOfExample2.txt . Fare clic su OK.
- Salvare il job. Ora è possibile compilare ed eseguire il lavoro.
Un esempio di file Microsoft Excel di input che contiene le informazioni sui dipendenti per ogni reparto nei diversi fogli. Gli estratti dei dati dei dipendenti di tutti i fogli vengono visualizzati sotto forma di tabelle:
EMP NO | NOME | METÀ INIZIO | COGNOME | TELEFONO N | Data Assunzione | LAVORO | Sesso | Data di nascita |
---|---|---|---|---|---|---|---|---|
10 | CRISTINA | I | HAAS | 3978 | 1/1/1995 | PRES | F | 24/08/1963 |
20 | Michael | L | THOMSON | 3476 | 10/10/2003 | Manager | M | 2/2/1976 |
30 | SORTITA | A | KWAN | 4738 | 4/5/2005 | Manager | F | 5/11/1971 |
50 | John | B | GEYER | 6789 | 17/08/1979 | Manager | M | 15/09/1955 |
EMP NO | NOME | MIDI NIT | COGNOME | TELEFONO N | Data Assunzione | LAVORO | Sesso | Data di nascita |
---|---|---|---|---|---|---|---|---|
60 | Irving | F | POPPA | 6423 | 14/09/2003 | Manager | M | 7/7/1975 |
70 | EVA | D | Pulaski | 7831 | 30/9/2003 | Manager | F | 26/05/2003 |
90 | EILEEN | W | Henderson | 5498 | 15/08/2000 | Manager | F | 15/05/1971 |
100 | TEODORO | Q | SPENSER | 742 | 19/06/2000 | Manager | M | 18/12/1980 |
110 | VINCENZO | G | LUCCHESSI | 3490 | 16/05/1988 | RAPPRESENTANTE DELLE VENDITE | M | 5/11/1958 |
120 | SEAN | O'CONNELL | 2167 | 12/51993 | impiegato | M | 18/10/1972 | |
130 | DELORES | M | QUINTANA | 4578 | 28/07/2001 | Analista | F | 15/09/1955 |
140 | Heather | A | NICHOLLS | 1793 | 15/12/2006 | Analista | F | 19/01/1976 |
150 | Bruce | ADAMO | 4510 | 2/12/2002 | Designer | M | 17/05/1972 | |
160 | ELISABETTA | R | PIANKA | 3782 | 10/11/2006 | Designer | F | 4/12/1980 |
1770 | MASATOSHI | J | YOSHIMURA | 2890 | 15/09/1999 | Designer | M | 5/1/1981 |
180 | MARILINA | S | SCOUTTEN | 1682 | 7/7/2003 | Designer | F | 21/02/1978 |
Dopo l'esecuzione del lavoro, è possibile aprire il file OutputOfExample2.txt che contiene il seguente risultato.
"DEPT A00","10","CHRISTINE","I","HAAS","3978","1995-01-01","PRES ","CHRISTINE HAAS","mailto:CHRISTINE%[email protected]"
"DEPT A00","20","MICHAEL","L","THOMPSON","3476","2003-10-10","MANAGER ","MICHAEL THOMPSON","mailto:MICHAEL%[email protected]"
"DEPT A00","30","SALLY","A","KWAN","4738","2005-04-05","MANAGER ","SALLY KWAN","mailto:SALLY%[email protected]"
"DEPT A00","50","JOHN","B","GEYER","6789","1979-08-17","MANAGER ","JOHN GEYER","mailto:JOHN%[email protected]"
"DEPT B01","60","IRVING","F","STERN","6423","2003-09-14","MANAGER ","IRVING STERN","mailto:IRVING%[email protected]"
"DEPT B01","70","EVA","D","PULASKI","7831","2005-09-30","MANAGER ","EVA PULASKI","mailto:EVA%[email protected]"
"DEPT B01","90","EILEEN","W","HENDERSON","5498","2000-08-15","MANAGER ","EILEEN HENDERSON","mailto:EILEEN%[email protected]"
"DEPT B01","100","THEODORE","Q","SPENSER","972","2000-06-19","MANAGER ","THEODORE SPENSER","mailto:THEODORE%[email protected]"
"DEPT B01","110","VINCENZO","G","LUCCHESSI","3490","1988-05-16","SALESREP","VINCENZO LUCCHESSI","mailto:VINCENZO%[email protected]"
"DEPT B01","120","SEAN"," ","O'CONNELL","2167","1993-12-05","CLERK ","SEAN O'CONNELL","mailto:SEAN%20O'[email protected]"
"DEPT B01","130","DELORES","M","QUINTANA","4578","2001-07-28","ANALYST ","DELORES QUINTANA","mailto:DELORES%[email protected]"
"DEPT B01","140","HEATHER","A","NICHOLLS","1793","2006-12-15","ANALYST ","HEATHER NICHOLLS","mailto:HEATHER%[email protected]"
"DEPT B01","150","BRUCE"," ","ADAMSON","4510","2002-02-12","DESIGNER","BRUCE ADAMSON","mailto:BRUCE%[email protected]"
"DEPT B01","160","ELIZABETH","R","PIANKA","3782","2006-10-11","DESIGNER","ELIZABETH PIANKA","mailto:ELIZABETH%[email protected]"
"DEPT B01","170","MASATOSHI","J","YOSHIMURA","2890","1999-09-15","DESIGNER","MASATOSHI YOSHIMURA","mailto:MASATOSHI%[email protected]"
"DEPT B01","180","MARILYN","S","SCOUTTEN","1682","2003-07-07","DESIGNER","MARILYN SCOUTTEN","mailto:MARILYN%[email protected]"
"DEPT C01","190","JAMES","H","WALKER","2986","2004-07-26","DESIGNER","JAMES WALKER","mailto:JAMES%[email protected]"
"DEPT C01","200","DAVID"," ","BROWN","4501","2002-03-03","DESIGNER","DAVID BROWN","mailto:DAVID%[email protected]"
"DEPT C01","210","WILLIAM","T","JONES","942","1998-04-11","DESIGNER","WILLIAM JONES","mailto:WILLIAM%[email protected]"
"DEPT C01","220","JENNIFER","K","LUTZ","672","1998-08-29","DESIGNER","JENNIFER LUTZ","mailto:JENNIFER%[email protected]"
"DEPT C01","230","JAMES","J","JEFFERSON","2094","1996-11-21","CLERK ","JAMES JEFFERSON","mailto:JAMES%[email protected]"
"DEPT C01","240","SALVATORE","M","MARINO","3780","2004-12-05","CLERK ","SALVATORE MARINO","mailto:SALVATORE%[email protected]"
"DEPT C01","250","DANIEL","S","SMITH","961","1999-10-30","CLERK ","DANIEL SMITH","mailto:DANIEL%[email protected]"
"DEPT C01","260","SYBIL","P","JOHNSON","8953","2005-09-11","CLERK ","SYBIL JOHNSON","mailto:SYBIL%[email protected]"
"DEPT D01","270","MARIA","L","PEREZ","9001","2006-09-30","CLERK ","MARIA PEREZ","mailto:MARIA%[email protected]"
"DEPT D01","280","ETHEL","R","SCHNEIDER","8997","1997-03-24","OPERATOR","ETHEL SCHNEIDER","mailto:ETHEL%[email protected]"
"DEPT D01","290","JOHN","R","PARKER","4502","2006-05-30","OPERATOR","JOHN PARKER","mailto:JOHN%[email protected]"
"DEPT D01","300","PHILIP","X","SMITH","2095","2002-06-19","OPERATOR","PHILIP SMITH","mailto:PHILIP%[email protected]"
"DEPT D01","310","MAUDE","F","SETRIGHT","3332","1994-09-12","OPERATOR","MAUDE SETRIGHT","mailto:MAUDE%[email protected]"
"DEPT D01","320","RAMLAL","V","MEHTA","9990","1995-07-07","FIELDREP","RAMLAL MEHTA","mailto:RAMLAL%[email protected]"
"DEPT D01","330","WING"," ","LEE","2103","2006-02-23","FIELDREP","WING LEE","mailto:WING%[email protected]"
"DEPT D01","340","JASON","R","GOUNOT","5698","1977-05-05","FIELDREP","JASON GOUNOT","mailto:JASON%[email protected]"
Esempio 3: estrazione di dati da più intervalli con strutture dati diverse in un file Microsoft Excel
Questo esempio utilizza il file Microsoft Excel di esempio Employee3.xls. Questo file di esempio ha due fogli di calcolo,Departments EEmployees , che hanno strutture dati diverse.
In questo esempio, lo stage Excel ha due collegamenti di uscita. Si estraggono i dati dal foglio Departments al primo link e dal foglio Employees al secondo link.
- Per estrarre diverse strutture dati:
- Creare un lavoro che includa una fase Excel e due fasi Sequential File. Puoi rinominare i tuoi collegamenti come Dipartimenti e Dipendenti.
- Fare doppio clic sullo stage di Excel. Nella finestra Configurazione, specificare il percorso completo del file di input di Microsoft Excel Employee3.xls.
- Specificate i dati da estrarre dal foglio elettronico Dipartimenti e completate i seguenti passaggi secondari per generare le mappature delle colonne.
- Dal Collegamento casella di riepilogo, selezionare Dipartimenti.
- Dal Opzione di intervallo elenco, seleziona Specificare l'intero intervallo.
- Dal Espressione della gamma campo, specificare Dipartimenti!A2:C6 .
- Da Intestazione colonne, selezionare Prima riga di intervalli di dati.
- Clic Importare, quindi fare clic su OK.
- Specificare i dati da estrarre dal file Dipendenti foglio di calcolo e completare i passaggi secondari seguenti per generare le mappature delle colonne.
- Dal Collegamento casella di riepilogo, selezionare Dipendenti.
- Dal Opzione di intervallo elenco, Specificare l'intero intervallo.
- Dal Espressione della gamma campo, specificare Dipendenti!A2:L34.
- Dal Intestazione di colonna, Selezionare Prima riga di intervalli di dati.
- Clic Importare, quindi fare clic su OK.
- Nella pagina Output, seleziona il file Dipendenti collegamento come nome dell'output.
- Nella pagina Colonne, modificate il tipo di dati della colonna EMP_NO in un numero intero, quindi fate clic su OK.
- Fare doppio clic sul primo Sequential File palcoscenicoOutput_1 e specificare il percorso per creare il file di output, seguito dal nome del fileOutputOfExample3_1.txt .
- Fate doppio clic sul secondo stadio Sequential File Output_2, e specificate il percorso per creare il file di output, seguito dal nome del file OutputOfExample3_2.txt
- Salvare il job. Ora è possibile compilare ed eseguire il lavoro.
Un esempio di file Microsoft Excel di input Employee3.xls contiene informazioni sui dipartimenti nel foglio Dipartimenti e informazioni sui dipendenti nel foglio Dipendenti. Il lavoro estrae i dati del reparto inOutputOfExample3_1.txt archiviare i dati dei dipendentiOutputOfExample3_2.txt .
Una volta eseguito il lavoro, aprire il fileOutputOfExample3_1.txt file eOutputOfExample3_2.txt file. ILOutputOfExample3_1.txt il file dovrebbe corrispondere a Dipartimenti foglio eOutputOfExample3_2.txt il file dovrebbe corrispondere a Dipendenti foglio dalEmployee.xls file.