Extrayendo los datos de Microsoft Excel (DataStage )
Puede utilizar la etapa Excel para extraer varios tipos de datos de un rango de datos seleccionado en un archivo de Microsoft Excel.
Rangos de datos
Cuando utiliza la etapa Excel, puede extraer datos de un rango de datos especificado en una hoja de cálculo de Microsoft Excel.
El rango de datos representa una celda, una fila, una columna o una selección de celdas que contienen uno o más bloques continuos de celdas. El rango de datos se especifica mediante la expresión de rango. En la etapa Excel, puede utilizar una expresión de rango para especificar el rango de datos a extraer.
Por ejemplo, Employee_Salary!A1:G8 describe un rango de datos en el que la primera celda es A1 y la última celda es G8 en la hoja de cálculo Employee_Salary.
1 | A NÚMEMP
|
B NOMBRE
|
C APELLIDO
|
D DTO
|
E JOB
|
F SALARY
|
G BONUS
|
---|---|---|---|---|---|---|---|
2 | 20 | MICHAEL | THOMPSON | B01 | DTOR | 94250 | 800 |
3 | 30 | SALLY | KWAN | C01 | DTOR | 98250 | 800 |
4 | 60 | IRVING | STERN | D11 | DTOR | 72250 | 500 |
5 | 73 | EVA | PULASKI | D21 | DTOR | 96170 | 700 |
6 | 50 | JOHN | GEYER | E01 | DTOR | 80175 | 800 |
7 | 90 | ELEEN | HENDERSON | E11 | DTOR | 89750 | 600 |
8 | 100 | THEODORE | SPENSER | E21 | DTOR | 86150 | 500 |
La etapa Excel asigna la fila y columna de Microsoft Excel en el rango de datos especificado a la fila y columna de IBM® DataStage®, y extrae los registros.
La siguiente tabla describe los registros que extrae la etapa de Excel cuando la expresión del rango es ¡Salario_empleado!A2:G8.
NÚMEMP | NOMBRE | APELLIDO | DTO | JOB | SALARY | BONUS |
---|---|---|---|---|---|---|
20 | MICHAEL | THOMPSON | B01 | DTOR | 94250 | 800 |
30 | SALLY | KWAN | C01 | DTOR | 98250 | 800 |
60 | IRVING | STERN | D11 | DTOR | 72250 | 500 |
73 | EVA | PULASKI | D21 | DTOR | 96170 | 700 |
50 | JOHN | GEYER | E01 | DTOR | 80175 | 800 |
90 | ELEEN | HENDERSON | E11 | DTOR | 89750 | 600 |
100 | THEODORE | SPENSER | E21 | DTOR | 86150 | 500 |
Si desea utilizar el valor de las celdas de la primera fila como IBM InfoSphere® DataStage nombre de columna, puede utilizar la propiedad Cabecera de columna. Si la propiedad Cabecera de columna se establece en Primera fila de rangos de datos, y si se especifica la expresión de rango como ¡Salario_empleado!A1:G8, la primera fila se trata como cabecera y el valor de las celdas de la primera fila se utiliza como el nombre de columna de DataStage predeterminada en el trabajo. Puede generar una expresión de rango en el tiempo de diseño utilizando la etapa Excel.
Tipos de datos que se pueden extraer de Microsoft Excel
Puede utilizar la etapa Excel para extraer varios tipos de datos de un archivo de Microsoft Excel.
- Propiedades de archivo
- La tabla siguiente lista la información que se puede extraer como propiedades de archivo:
Tabla 3. Datos que se pueden extraer como propiedades de archivo Datos Descripción Nombre de archivo Nombre del archivo. Por ejemplo: Workbook1.xls Vía de acceso de archivo Vía de acceso del archivo. Por ejemplo: C:\excel\Workbook1.xls Tamaño de archivo Tamaño del archivo en bytes. Fecha de última modificación La fecha y la hora en que se modificó por última vez el archivo.
- Propiedades del documento
- La tabla siguiente lista la información que se puede extraer como propiedades de documento:
Tabla 4. Datos que se pueden extraer como propiedades de documento Datos Descripción Autores Autores del documento. Comentarios de documentos Observaciones del documento. Fecha de creación de contenido La fecha y la hora en que se ha creado el documento. Palabras clave Palabras clave del documento. Número de revisión Número de revisión del documento. Asunto Asunto del documento. Título Título del documento. Compañía Valor de propiedad de empresa del documento. Categoría Categoría del documento. Gestor Gestor del documento. Propiedades personalizadas Propiedades personalizadas del documento. Debe especificar el nombre de la propiedad personalizada que se debe extraer.
- Información sobre hojas
- La tabla siguiente lista la información que se puede extraer como información de hoja:
Tabla 5. Datos que se pueden extraer como información de hoja Datos Descripción Nombre de hoja Nombre de la hoja de Microsoft Excel. Cabecera (izquierda, centro, derecha) Cabecera de la posición especificada. Pie de página (izquierda, centro, derecha) Pie de página de la posición especificada.
- Información de fila
- La tabla siguiente lista la información que se puede extraer como información de fila:
Tabla 6. Datos que se pueden extraer como información de fila Datos Descripción Número de fila Número de fila de Microsoft Excel dentro de la hoja. El primer número de fila es el 1. Está oculta Si la fila está oculta o no. Escribe true si la fila o la hoja a la que pertenece esta fila está oculta.
- Información de casilla
- Puede extraer la información de celda basada en la columna de Microsoft Excel o en la posición de la celda. Puede especificar la columna de Microsoft Excel de origen basándose en la posición relativa dentro del rango de datos cuando esté extrayendo la información de la celda basándose en la columna de Microsoft Excel.
Propagación de columnas en tiempo de ejecución
En IBM DataStage, puede configurar un trabajo para propagar columnas adicionales que no están definidas en los metadatos por el resto del trabajo. Este proceso se conoce como propagación de columnas en tiempo de ejecución (RCP).
Cuando la propagación de columnas en tiempo de ejecución está habilitada, la etapa Excel propaga las columnas de Microsoft Excel basándose en el primer rango de datos. Si se utilizan caracteres comodín en el nombre de archivo, se utiliza el primer archivo que coincide con la expresión. El valor de la propiedad de columnas ocultas determina si una columna oculta se propaga. Para cada columna de Microsoft Excel propagada, solo se extraen los valores de celda. Para extraer información como el nombre de archivo, el nombre de hoja o el número de fila, puede definir las columnas adicionales en la ventana de configuración.
Reglas de denominación de columnas
IBM DataStage Las columnas reciben nombres según la letra de la columna de Microsoft Excel del primer rango de datos. El nombre de columna tiene el prefijo " Columna_" seguido de la letra de columna de Microsoft Excel. Por ejemplo, Columna_A, Columna_B, Columna_C, etc.
Si el trabajo ya tiene una columna con el nombre, el trabajo se detiene.
Tipos de datos
Todas las columnas que se añaden mediante la etapa Excel se encuentran en el tipo Unicode Varchar con una longitud no definida.