0 / 0
Volver a la versión inglesa de la documentación

Extrayendo los datos de Microsoft Excel (DataStage )

Última actualización: 12 mar 2025
Extracción de datos de Microsoft Excel (etapa Excel) en DataStage

Puede utilizar la etapa Excel para extraer varios tipos de datos de un rango de datos seleccionado en un archivo de Microsoft Excel.

Rangos de datos

Cuando utiliza la etapa Excel, puede extraer datos de un rango de datos especificado en una hoja de cálculo de Microsoft Excel.

El rango de datos representa una celda, una fila, una columna o una selección de celdas que contienen uno o más bloques continuos de celdas. El rango de datos se especifica mediante la expresión de rango. En la etapa Excel, puede utilizar una expresión de rango para especificar el rango de datos a extraer.

Por ejemplo, Employee_Salary!A1:G8 describe un rango de datos en el que la primera celda es A1 y la última celda es G8 en la hoja de cálculo Employee_Salary.

Tabla 1. Ejemplo de archivo Microsoft Excel; hoja de cálculo Salario_empleado
1 A
NÚMEMP
B
NOMBRE
C
APELLIDO
D
DTO
E
JOB
F
SALARY
G
BONUS
2 20 MICHAEL THOMPSON B01 DTOR 94250 800
3 30 SALLY KWAN C01 DTOR 98250 800
4 60 IRVING STERN D11 DTOR 72250 500
5 73 EVA PULASKI D21 DTOR 96170 700
6 50 JOHN GEYER E01 DTOR 80175 800
7 90 ELEEN HENDERSON E11 DTOR 89750 600
8 100 THEODORE SPENSER E21 DTOR 86150 500

La etapa Excel asigna la fila y columna de Microsoft Excel en el rango de datos especificado a la fila y columna de IBM® DataStage®, y extrae los registros.

La siguiente tabla describe los registros que extrae la etapa de Excel cuando la expresión del rango es ¡Salario_empleado!A2:G8.

Tabla 2. Ejemplo de fila y columna de DataStage
NÚMEMP NOMBRE APELLIDO DTO JOB SALARY BONUS
20 MICHAEL THOMPSON B01 DTOR 94250 800
30 SALLY KWAN C01 DTOR 98250 800
60 IRVING STERN D11 DTOR 72250 500
73 EVA PULASKI D21 DTOR 96170 700
50 JOHN GEYER E01 DTOR 80175 800
90 ELEEN HENDERSON E11 DTOR 89750 600
100 THEODORE SPENSER E21 DTOR 86150 500

Si desea utilizar el valor de las celdas de la primera fila como IBM InfoSphere® DataStage nombre de columna, puede utilizar la propiedad Cabecera de columna. Si la propiedad Cabecera de columna se establece en Primera fila de rangos de datos, y si se especifica la expresión de rango como ¡Salario_empleado!A1:G8, la primera fila se trata como cabecera y el valor de las celdas de la primera fila se utiliza como el nombre de columna de DataStage predeterminada en el trabajo. Puede generar una expresión de rango en el tiempo de diseño utilizando la etapa Excel.

Tipos de datos que se pueden extraer de Microsoft Excel

Puede utilizar la etapa Excel para extraer varios tipos de datos de un archivo de Microsoft Excel.

Propiedades de archivo
La tabla siguiente lista la información que se puede extraer como propiedades de archivo:
Tabla 3. Datos que se pueden extraer como propiedades de archivo
Datos Descripción
Nombre de archivo Nombre del archivo. Por ejemplo: Workbook1.xls
Vía de acceso de archivo Vía de acceso del archivo. Por ejemplo: C:\excel\Workbook1.xls
Tamaño de archivo Tamaño del archivo en bytes.
Fecha de última modificación La fecha y la hora en que se modificó por última vez el archivo.
Propiedades del documento
La tabla siguiente lista la información que se puede extraer como propiedades de documento:
Tabla 4. Datos que se pueden extraer como propiedades de documento
Datos Descripción
Autores 
 Autores del documento.
Comentarios de documentos Observaciones del documento.
Fecha de creación de contenido La fecha y la hora en que se ha creado el documento.
Palabras clave Palabras clave del documento.
Número de revisión Número de revisión del documento.
Asunto Asunto del documento.
Título Título del documento.
Compañía Valor de propiedad de empresa del documento.
Categoría Categoría del documento.
Gestor Gestor del documento.
Propiedades personalizadas Propiedades personalizadas del documento. Debe especificar el nombre de la propiedad personalizada que se debe extraer.
Información sobre hojas
La tabla siguiente lista la información que se puede extraer como información de hoja:
Tabla 5. Datos que se pueden extraer como información de hoja
Datos Descripción
Nombre de hoja Nombre de la hoja de Microsoft Excel.
Cabecera (izquierda, centro, derecha) Cabecera de la posición especificada.
Pie de página (izquierda, centro, derecha) Pie de página de la posición especificada.
Información de fila
La tabla siguiente lista la información que se puede extraer como información de fila:
Tabla 6. Datos que se pueden extraer como información de fila
Datos Descripción
Número de fila Número de fila de Microsoft Excel dentro de la hoja. El primer número de fila es el 1.
Está oculta Si la fila está oculta o no. Escribe true si la fila o la hoja a la que pertenece esta fila está oculta.
Información de casilla
Puede extraer la información de celda basada en la columna de Microsoft Excel o en la posición de la celda. Puede especificar la columna de Microsoft Excel de origen basándose en la posición relativa dentro del rango de datos cuando esté extrayendo la información de la celda basándose en la columna de Microsoft Excel.
La tabla siguiente lista información que se puede extraer como información de celda:
Tabla 7. Datos que se pueden extraer como información de celda
Datos Descripción
Valor Valor de una celda. Si la celda tiene una fórmula, la etapa extrae el valor de la memoria caché.
Comentario Comentario de una celda.
Autor del comentario Autor del comentario de una celda.
Fórmula Fórmula de una celda en texto.
Tipo de hiperenlace Tipo de hiperenlace de una celda.
Dirección de hiperenlace La dirección a la que apunta este hiperenlace. El formato depende del tipo de hipervínculo.
Etiqueta de hiperenlace Etiqueta de texto para este hiperenlace.

Propagación de columnas en tiempo de ejecución

En IBM DataStage, puede configurar un trabajo para propagar columnas adicionales que no están definidas en los metadatos por el resto del trabajo. Este proceso se conoce como propagación de columnas en tiempo de ejecución (RCP).

Cuando la propagación de columnas en tiempo de ejecución está habilitada, la etapa Excel propaga las columnas de Microsoft Excel basándose en el primer rango de datos. Si se utilizan caracteres comodín en el nombre de archivo, se utiliza el primer archivo que coincide con la expresión. El valor de la propiedad de columnas ocultas determina si una columna oculta se propaga. Para cada columna de Microsoft Excel propagada, solo se extraen los valores de celda. Para extraer información como el nombre de archivo, el nombre de hoja o el número de fila, puede definir las columnas adicionales en la ventana de configuración.

Reglas de denominación de columnas

IBM DataStage Las columnas reciben nombres según la letra de la columna de Microsoft Excel del primer rango de datos. El nombre de columna tiene el prefijo " Columna_" seguido de la letra de columna de Microsoft Excel. Por ejemplo, Columna_A, Columna_B, Columna_C, etc.

Si el trabajo ya tiene una columna con el nombre, el trabajo se detiene.

Tipos de datos

Todas las columnas que se añaden mediante la etapa Excel se encuentran en el tipo Unicode Varchar con una longitud no definida.