0 / 0
Volver a la versión inglesa de la documentación

Ejemplos de extracción de datos de archivos de Microsoft Excel (DataStage® )

Última actualización: 12 mar 2025
Ejemplos de extracción de datos de archivos de Microsoft Excel (DataStage )

Puede crear trabajos de ejemplo que extraigan datos de archivos de Microsoft Excel. En este ejemplo, la etapa Sequential File se utiliza como etapa de salida. Puede utilizar cualquier otra etapa de salida para crear la salida.

Para obtener los archivos de los ejemplos, extraiga el archivo IS_install\Clients\Samples\Connectors\UnstructuredData_Samples.zip.

Ejemplo 1: Extracción de datos de un rango en un archivo de Microsoft Excel

Cree un trabajo que utilice la etapa Excel para recuperar datos de un rango en una hoja de cálculo de Microsoft Excel.

Este ejemplo utiliza el archivo de ejemplo de Microsoft Excel Employee1.xls, que contiene detalles de los empleados que trabajan en una organización. Este archivo de ejemplo tiene tres hojas de cálculo: Sheet1, Sheet2, y Sheet3.Sheet1 contiene información sobre los empleados de cada departamento de la organización. Sheet2 y Sheet3 están en blanco. En este ejemplo, extrae información empresarial únicamente sobre los empleados que trabajan para el departamento B01.

Para extraer datos de un rango en un archivo de Excel:
  1. Cree un trabajo que incluya una etapa Excel y una etapa Sequential File.
  2. Haga doble clic en el escenario Excel.
  3. En la ventana Configuración, especifique la ruta completa del archivo de entrada de Microsoft Excel Employee1.xls.
  4. En la lista Opción de rango, seleccione Especificar todo el rango de datos para extraer los datos de un rango específico.
  5. En el Expresión de rango campo, especifiqueSheet1!A16:K28 .
  6. En el campo Cabecera de columna, seleccione la Primera fila de rangos de datos. Cuando se selecciona la Primera fila de rangos de datos, la primera fila se considera la cabecera y la etapa de Excel comienza a extraer a partir de la segunda fila.
  7. Desactive la casilla de verificación situada junto a las columnas de Microsoft Excel E (Nº DE TELÉFONO) e I (FECHA DE NACIMIENTO).
  8. Haga clic en Importar y Aceptar. Al hacer clic en Importar, se actualiza el panel Mapa situado en la parte inferior derecha de la ventana Configuración.
  9. En la página Salida > Columna, cambie el tipo de la columna EMP_NO a Integer y, a continuación, haga clic en Aceptar.
  10. Efectúe una doble pulsación en la etapa Sequential File. Sobre el Propiedades página, especifique la ruta donde desea que se cree el archivo de salida, seguida del nombre del archivoOutputOfExample1.txt y haga clic DE ACUERDO.
  11. Guarde el trabajo. Ahora, puede compilar y ejecutar el trabajo.

La tabla siguiente muestra la información de un archivo de entrada de Microsoft Excel que contiene la información del empleado para distintos departamentos.

Tabla 1. Ejemplo de archivo de Microsoft Excel con detalles de empleado
EMP NO NOMBRE INICIO MEDIO APELLIDO TELEFONO NO HIRE DATE JOB SEX BIRTH DATE
Empleados en DEPT_A00
10 CHRISTINE I HAAS 3978 1/1/1995 PRES F 8/24/1963
20 MICHAEL L THOMSON 3476 10/10/2003 DTOR M 2/2/1976
30 SALLY A KWAN 4738 4/5/2005 DTOR F 5/11/1971
50 JOHN B GEYER 6789 8/17/1979 DTOR M 9/15/1955
Empleados en DEPT_B01
60 IRVING F STERN 6423 9/14/2003 DTOR M 7/7/1975
73 EVA D PULASKI 7831 9/30/2003 DTOR F 5/26/2003
90 EILEEN W HENDERSON 5498 8/15/2000 DTOR F 5/15/1971
100 THEODORE Q SPENSER 742 6/19/2000 DTOR M 12/18/1980
110 VINCENZO G LUCCHESSI 3490 5/16/1988 SALESREP M 11/5/1958
120 SEAN   O'CONNELL 2167 12/51993 CLERK M 10/18/1972
130 DELORES M QUINTANA 4578 7/28/2001 ANALYST F 9/15/1955
140 HEATHER A NICHOLLS 1793 12/15/2006 ANALYST F 1/19/1976
150 BRUCE   ADAMSON 4510 2/12/2002 DESIGNER M 5/17/1972
160 ELIZABETH R PIANKA 3782 10/11/2006 DESIGNER F 4/12/1980
1770 MASATOSHI J YOSHIMURA 2890 9/15/1999 DESIGNER M 1/5/1981
180 MARILYN S SCOUTTEN 1682 7/7/2003 DESIGNER F 2/21/1978

Después de ejecutar el trabajo, puede abrir elOutputOfExample1.txt archivo para ver el resultado.

El archivo OutputOfExample1.txt muestra los datos de DEPT_B01 excepto las columnas NO DE TELÉFONO y FECHA DE NACIMIENTO:
"60","IRVING","F","STERN","2003-09-14","MANAGER ","M","72250","500"
"70","EVA","D","PULASKI","2005-09-30","MANAGER ","F","96170","700"
"90","EILEEN","W","HENDERSON","2000-08-15","MANAGER ","F","89750","600"
"100","THEODORE","Q","SPENSER","2000-06-19","MANAGER ","M","86150","500"
"110","VINCENZO","G","LUCCHESSI","1988-05-16","SALESREP","M","66500","900"
"120","SEAN"," ","O'CONNELL","1993-12-05","CLERK   ","M","49250","600"
"130","DELORES","M","QUINTANA","2001-07-28","ANALYST ","F","73800","500"
"140","HEATHER","A","NICHOLLS","2006-12-15","ANALYST ","F","68420","600"
"150","BRUCE"," ","ADAMSON","2002-02-12","DESIGNER","M","55280","500"
"160","ELIZABETH","R","PIANKA","2006-10-11","DESIGNER","F","62250","400"
"170","MASATOSHI","J","YOSHIMURA","1999-09-15","DESIGNER","M","44680","500"
"180","MARILYN","S","SCOUTTEN","2003-07-07","DESIGNER","F","51340","500"

Ejemplo 2: Extracción de datos de varias hojas de Microsoft Excel

Este ejemplo utiliza el archivo de ejemplo de Microsoft Excel Employee2.xls. Este archivo de ejemplo tiene las siguientes hojas: DEPT A00, DEPT B01, DEPT C01 y DEPT D01. Cada hoja contiene información sobre los empleados del departamento.

La estructura de datos de cada hoja es similar. Cada hoja tiene las columnas EMP NO, FIRST NAME, MID INIT, LAST NAME, PHONE NO, HIRE DATE, JOB y ADDRESS, y la tercera fila es la cabecera. Pero cada hoja tiene un número diferente de filas.

Para extraer datos de varios archivos:
  1. En la ventana Configuración, especifique la ruta completa del archivo de entrada de Microsoft Excel Employee2.xls.
  2. En la opción Rango, seleccione Especificar la fila inicial.
  3. En el campo Expresión de rango, especifique A3:H3. Cuando la etapa se ejecuta con la opción Especificar la primera fila y no se especifica ningún nombre de hoja concreto en la Expresión de rango, el trabajo busca la última fila y extrae filas hasta la última fila en un tiempo de ejecución.
  4. En la Cabecera de columna, seleccione la Primera fila de rangos de datos.
  5. Sobre el Propiedad, seleccione la casilla de verificación junto a la propiedad para extraer el valor de la propiedad. En este ejemplo, seleccione Sheetname como propiedad.
  6. Haga clic en Importar. La etapa genera las correspondencias de las columnas.
  7. para hacer el SheetNname columna la primera columna de la lista, seleccione la SheetName columna y haga clic Arriba hasta el SheetName column es la primera columna de la lista.
  8. En la tabla de asignación, inserte una fila para la columna DIRECCIÓN en el archivo de entrada que contiene el hipervínculo.
    1. Hacer clic Insertar
    2. En la opción Elemento de Excel, seleccione Columna ADDRESS.
    3. En la celda de opción Importar de la nueva fila, seleccione la Dirección del hipervínculo.
    4. Especifique el nombre de columna de DataStage EMAIL_ADDRESS para la nueva fila. A continuación, pulse Aceptar.
  9. Haga clic en la pestaña Salida > Columna para cambiar el tipo de datos u otros atributos.
  10. Cambie el tipo de columna EMP_NO por Entero. Pulse Aceptar.
  11. En la página Propiedades, especifique la vía de acceso donde desea que se cree el archivo de salida, seguido del nombre de OutputOfExample2.txt. Pulse Aceptar.
  12. Guarde el trabajo. Ahora, puede compilar y ejecutar el trabajo.

Un ejemplo de entrada de archivos de Microsoft Excel que contienen la información de los empleados para cada departamento en las diferentes hojas. Los extractos de trabajo de los datos de los empleados de todas las hojas se muestran en forma de las siguientes tablas:

Tabla 2. Información de los empleados en DEPT_A00
EMP NO NOMBRE INICIO MEDIO APELLIDO TELEFONO NO HIRE DATE JOB SEX BIRTH DATE
10 CHRISTINE I HAAS 3978 1/1/1995 PRES F 8/24/1963
20 MICHAEL L THOMSON 3476 10/10/2003 DTOR M 2/2/1976
30 SALLY A KWAN 4738 4/5/2005 DTOR F 5/11/1971
50 JOHN B GEYER 6789 8/17/1979 DTOR M 9/15/1955
Tabla 3. Detalles de los empleados en Empleados en DEPT_B01
EMP NO NOMBRE MIDI NIT APELLIDO TELEFONO NO HIRE DATE JOB SEX BIRTH DATE
60 IRVING F STERN 6423 9/14/2003 DTOR M 7/7/1975
73 EVA D PULASKI 7831 9/30/2003 DTOR F 5/26/2003
90 EILEEN W HENDERSON 5498 8/15/2000 DTOR F 5/15/1971
100 THEODORE Q SPENSER 742 6/19/2000 DTOR M 12/18/1980
110 VINCENZO G LUCCHESSI 3490 5/16/1988 SALESREP M 11/5/1958
120 SEAN   O'CONNELL 2167 12/51993 CLERK M 10/18/1972
130 DELORES M QUINTANA 4578 7/28/2001 ANALYST F 9/15/1955
140 HEATHER A NICHOLLS 1793 12/15/2006 ANALYST F 1/19/1976
150 BRUCE   ADAMSON 4510 2/12/2002 DESIGNER M 5/17/1972
160 ELIZABETH R PIANKA 3782 10/11/2006 DESIGNER F 4/12/1980
1770 MASATOSHI J YOSHIMURA 2890 9/15/1999 DESIGNER M 1/5/1981
180 MARILYN S SCOUTTEN 1682 7/7/2003 DESIGNER F 2/21/1978

Después de que se ejecute el trabajo, puede abrir el archivo OutputOfExample2.txt que contiene el siguiente resultado.

"DEPT A00","10","CHRISTINE","I","HAAS","3978","1995-01-01","PRES    ","CHRISTINE HAAS","mailto:CHRISTINE%[email protected]"
"DEPT A00","20","MICHAEL","L","THOMPSON","3476","2003-10-10","MANAGER ","MICHAEL THOMPSON","mailto:MICHAEL%[email protected]"
"DEPT A00","30","SALLY","A","KWAN","4738","2005-04-05","MANAGER ","SALLY KWAN","mailto:SALLY%[email protected]"
"DEPT A00","50","JOHN","B","GEYER","6789","1979-08-17","MANAGER ","JOHN GEYER","mailto:JOHN%[email protected]"
"DEPT B01","60","IRVING","F","STERN","6423","2003-09-14","MANAGER ","IRVING STERN","mailto:IRVING%[email protected]"
"DEPT B01","70","EVA","D","PULASKI","7831","2005-09-30","MANAGER ","EVA PULASKI","mailto:EVA%[email protected]"
"DEPT B01","90","EILEEN","W","HENDERSON","5498","2000-08-15","MANAGER ","EILEEN HENDERSON","mailto:EILEEN%[email protected]"
"DEPT B01","100","THEODORE","Q","SPENSER","972","2000-06-19","MANAGER ","THEODORE SPENSER","mailto:THEODORE%[email protected]"
"DEPT B01","110","VINCENZO","G","LUCCHESSI","3490","1988-05-16","SALESREP","VINCENZO LUCCHESSI","mailto:VINCENZO%[email protected]"
"DEPT B01","120","SEAN"," ","O'CONNELL","2167","1993-12-05","CLERK   ","SEAN O'CONNELL","mailto:SEAN%20O'[email protected]"
"DEPT B01","130","DELORES","M","QUINTANA","4578","2001-07-28","ANALYST ","DELORES QUINTANA","mailto:DELORES%[email protected]"
"DEPT B01","140","HEATHER","A","NICHOLLS","1793","2006-12-15","ANALYST ","HEATHER NICHOLLS","mailto:HEATHER%[email protected]"
"DEPT B01","150","BRUCE"," ","ADAMSON","4510","2002-02-12","DESIGNER","BRUCE ADAMSON","mailto:BRUCE%[email protected]"
"DEPT B01","160","ELIZABETH","R","PIANKA","3782","2006-10-11","DESIGNER","ELIZABETH PIANKA","mailto:ELIZABETH%[email protected]"
"DEPT B01","170","MASATOSHI","J","YOSHIMURA","2890","1999-09-15","DESIGNER","MASATOSHI YOSHIMURA","mailto:MASATOSHI%[email protected]"
"DEPT B01","180","MARILYN","S","SCOUTTEN","1682","2003-07-07","DESIGNER","MARILYN SCOUTTEN","mailto:MARILYN%[email protected]"
"DEPT C01","190","JAMES","H","WALKER","2986","2004-07-26","DESIGNER","JAMES WALKER","mailto:JAMES%[email protected]"
"DEPT C01","200","DAVID"," ","BROWN","4501","2002-03-03","DESIGNER","DAVID BROWN","mailto:DAVID%[email protected]"
"DEPT C01","210","WILLIAM","T","JONES","942","1998-04-11","DESIGNER","WILLIAM JONES","mailto:WILLIAM%[email protected]"
"DEPT C01","220","JENNIFER","K","LUTZ","672","1998-08-29","DESIGNER","JENNIFER LUTZ","mailto:JENNIFER%[email protected]"
"DEPT C01","230","JAMES","J","JEFFERSON","2094","1996-11-21","CLERK   ","JAMES JEFFERSON","mailto:JAMES%[email protected]"
"DEPT C01","240","SALVATORE","M","MARINO","3780","2004-12-05","CLERK   ","SALVATORE MARINO","mailto:SALVATORE%[email protected]"
"DEPT C01","250","DANIEL","S","SMITH","961","1999-10-30","CLERK   ","DANIEL SMITH","mailto:DANIEL%[email protected]"
"DEPT C01","260","SYBIL","P","JOHNSON","8953","2005-09-11","CLERK   ","SYBIL JOHNSON","mailto:SYBIL%[email protected]"
"DEPT D01","270","MARIA","L","PEREZ","9001","2006-09-30","CLERK   ","MARIA PEREZ","mailto:MARIA%[email protected]"
"DEPT D01","280","ETHEL","R","SCHNEIDER","8997","1997-03-24","OPERATOR","ETHEL SCHNEIDER","mailto:ETHEL%[email protected]"
"DEPT D01","290","JOHN","R","PARKER","4502","2006-05-30","OPERATOR","JOHN PARKER","mailto:JOHN%[email protected]"
"DEPT D01","300","PHILIP","X","SMITH","2095","2002-06-19","OPERATOR","PHILIP SMITH","mailto:PHILIP%[email protected]"
"DEPT D01","310","MAUDE","F","SETRIGHT","3332","1994-09-12","OPERATOR","MAUDE SETRIGHT","mailto:MAUDE%[email protected]"
"DEPT D01","320","RAMLAL","V","MEHTA","9990","1995-07-07","FIELDREP","RAMLAL MEHTA","mailto:RAMLAL%[email protected]"
"DEPT D01","330","WING"," ","LEE","2103","2006-02-23","FIELDREP","WING LEE","mailto:WING%[email protected]"
"DEPT D01","340","JASON","R","GOUNOT","5698","1977-05-05","FIELDREP","JASON GOUNOT","mailto:JASON%[email protected]"

Ejemplo 3: Extracción de datos de varios rangos que tienen estructuras de datos diferentes en un archivo de Microsoft Excel

Este ejemplo utiliza el archivo de ejemplo de Microsoft Excel Employee3.xls. Este archivo de ejemplo tiene dos hojas de cálculo, Departments y Employees, que tienen estructuras de datos diferentes.

En este ejemplo, la etapa Excel tiene dos enlaces de salida. extrae datos de la hoja Departments al primer enlace y de la hoja Employees al segundo enlace.

Para extraer diferentes estructuras de datos:
  1. Cree un trabajo que incluya una etapa Excel y dos etapas Sequential File. Puede cambiar el nombre de sus enlaces como Departamentos y Empleados.
  2. Haga doble clic en el escenario Excel. En la ventana Configuración, especifique la ruta completa del archivo de entrada de Microsoft Excel Employee3.xls.
  3. Especifique los datos a extraer de la hoja de cálculo Departamentos y complete los siguientes subpasos para generar las asignaciones de columna.
    1. Desde el Enlace cuadro de lista, seleccione Departamentos.
    2. Desde el Opción de rango lista, seleccione Especifique todo el rango.
    3. En el campo Expresión de rango, especifique Departamentos!A2:C6 .
    4. En la Cabecera de columna, seleccione la Primera fila de rangos de datos.
    5. Pulse Importar y, a continuación, pulse Aceptar.
  4. Especifique los datos que se deben extraer de la hoja de cálculo Empleados y complete los subpasos siguientes para generar las correlaciones de columnas.
    1. En el recuadro de lista Enlace, seleccione Empleados.
    2. Desde el Opción de rango lista, Especifique todo el rango.
    3. En el campo Expresión de rango, especifique Empleados!A2:L34.
    4. En la Cabecera de columna, seleccione Primera fila de rangos de datos.
    5. Pulse Importar y, a continuación, pulse Aceptar.
  5. En la página Salida, seleccione el enlace Empleados como Nombre de salida.
  6. En la página Columnas, cambie el tipo de datos de la columna EMP_NO a un número entero y, a continuación, haga clic en OK.
  7. Haga doble clic en el primero Sequential File escenarioOutput_1 y especifique la ruta para crear el archivo de salida, seguida del nombre del archivoOutputOfExample3_1.txt .
  8. Haga doble clic en la segunda etapa Sequential File Output_2, y especifique la ruta para crear el archivo de salida, seguida del nombre del archivo OutputOfExample3_2.txt
  9. Guarde el trabajo. Ahora, puede compilar y ejecutar el trabajo.

Un archivo de Microsoft Excel de entrada de ejemplo Employee3.xls contiene información de departamentos en la hoja Departamentos e información de empleados en la hoja Empleados. El trabajo extrae datos del departamento al archivo OutputOfExample3_1.txt y los datos de empleado a OutputOfExample3_2.txt.

Después de ejecutar el trabajo, abra el archivo OutputOfExample3_1.txt y el archivo OutputOfExample3_2.txt. El archivo OutputOfExample3_1.txt debe coincidir con la hoja Departamentos y el archivo OutputOfExample3_2.txt debe coincidir con la hoja Empleados del archivo Employee.xls.