Los flujos de DataStage® son los activos de tiempo de diseño que contienen lógica de integración de datos.
Puede crear un flujo de DataStage vacío y añadirle conectores y etapas, o puede importar un flujo de DataStage existente desde un archivo ISX o ZIP.
- Orígenes de datos que leen datos
- Etapas que transforman los datos
- Destinos de datos que escriben datos
- Enlaces que conectan los orígenes, etapas y destinos
Los flujos de DataStage y sus objetos asociados se organizan en proyectos. Para empezar, abra un proyecto existente o cree un proyecto nuevo.
Creación de un flujo de DataStage
Para crear un flujo de DataStage , realice los pasos siguientes.
- Abra un proyecto existente o cree un proyecto.
- En la pestaña Activos, haga clic en .
- En la página Crear un flujo de DataStage , utilice uno de los dos métodos siguientes para crear el flujo de DataStage :
- Pulse el separador Nuevo , añada los detalles necesarios para el flujo de DataStage y, a continuación, pulse Crear. El nuevo flujo de DataStage se abre sin objetos en el lienzo del diseñador de DataStage .
- Pulse la pestaña Archivo local y, a continuación, cargue un archivo ISX o ZIP desde el sistema local. A continuación, pulse Crear. Cuando se haya completado el proceso de importación, cierre la página del informe de importación y, a continuación, abra el flujo de DataStage importado desde el separador Activos del proyecto.
- Arrastre conectores o etapas de la paleta al lienzo de diseño de DataStage como nodos y organícelos como desee. Conecte estos nodos en el lienzo pulsando el puntero sobre un nodo para que aparezca una flecha en el nodo y, a continuación, pulse el icono de la flecha y arrástrelo al nodo al que desea conectarse.
Esta acción crea un enlace entre los nodos.
Para conectarse a datos remotos, consulte Conexión a una fuente de datos en DataStage.
- Efectúe una doble pulsación en un nodo para abrir su panel de propiedades, donde puede especificar configuraciones y valores para el nodo.
- Pulse Ejecutar cuando haya terminado de configurar el flujo.
El flujo se guarda, se compila y se ejecuta automáticamente. Puede ver los registros para la compilación y para la ejecución del trabajo.
Edición de un flujo de DataStage
Puede utilizar las acciones siguientes para editar un flujo de DataStage .
- Arrastre una etapa o conector y suéltelo en un enlace entre dos nodos que ya están en el lienzo de diseño de DataStage . Los enlaces se añaden automáticamente para el nuevo nodo y las columnas se propagan automáticamente. Pulse Ejecutar de nuevo para ver los resultados.
- Desconecte y vuelva a conectar manualmente los enlaces de los nodos en el lienzo de DataStage pasando el puntero sobre ellos y pulsando los puntos finales de los enlaces.
- Arrastre una etapa o un conector desde la paleta y suéltelos en un enlace que ya esté en el lienzo. La etapa o el conector se enlazan automáticamente con el nodo de cada lado del mismo y las columnas del flujo de DataStage se propagan automáticamente.
- Haga clic en el icono Reemplazar y seleccione otro flujo para reemplazar su flujo. Esta acción también está disponible para las etapas Build, Custom y Wrapped, así como para los subflujos y las bibliotecas Java.
Vista previa de datos
Puede editar y previsualizar datos en su flujo DataStage. En el lienzo, haga clic con el botón derecho en su conexión y seleccione Vista previa de datos. Puedes previsualizar tus datos con todas las conexiones y conectores de archivos. Para más información sobre los conectores de archivos, consulte ' Conectores de archivos en ' DataStage.
Por ejemplo, puede previsualizar la hora y el microsegundo con la zona horaria. Both time
and microseconds time
data types appear in the standard format: HH:mm:ss
for time, and HH:mm:ss.SSSSSS
for microseconds time.
Input time: 00:00:01-10:00
Local Time: 00:00:01
offset: -10 (which means UTC is 10 hours ahead of local time)
UTC Time: LocalTime + Offset = 00:00:01 + 10 hrs = 10:00:01
donde la zona horaria se convierte y se muestra como ' 10:00:01
en el formato de hora estándar.Consideraciones
- Información confidencial y valores de propiedad cifrados
- No se recomienda especificar valores de propiedad cifrados como, por ejemplo, contraseñas en flujos de DataStage . En su lugar, cree un conjunto de parámetros de tipo Cifrado con un parámetro con nombre y no especifique un valor predeterminado para el parámetro. En el flujo, haga referencia al conjunto de parámetros cifrados y especifique el parámetro con nombre para el valor de propiedad, por ejemplo:
#<parameter set>.<parameter name>#
. Especifique el valor cifrado del parámetro#parameter set.parameter name#
en el trabajo que ejecuta el flujo. - Denominación de archivos en orígenes y destinos para evitar la corrupción de datos
- En la mayoría de los casos, no utilice el mismo nombre de archivo en el origen que en el destino si el origen y el destino apuntan a la misma base de datos o sistema de almacenamiento. Esta regla se aplica a archivos y tablas de base de datos. Si los nombres son los mismos, los datos pueden estar dañados.
- Propagación de cambios de metadatos de columna
- Cuando cambia los metadatos de una columna, los cambios se propagan automáticamente en sentido descendente. Los cambios realizados en sentido ascendente no se aplican a una columna una vez que modifica sus metadatos. Si suprime una columna, la modificación de la columna en una etapa posterior no volverá a añadir la columna.
- Propagación de columnas en tiempo de ejecución
- Cuando se establece RCP, si el trabajo encuentra columnas adicionales que no están definidas en los metadatos cuando se ejecuta, adopta estas columnas adicionales y las propaga a través del resto del trabajo. Esto evita errores debido a que faltan correlaciones.
- Añadir parámetros
- Consulte Adición de parámetros.
Más información
Ejemplos
- Creación de un flujo de DataStage
Vea el siguiente vídeo para ver un ejemplo de cómo crear un flujo de DataStage simple.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
- Importación de un flujo de DataStage en un proyecto
Vea el siguiente vídeo para ver un ejemplo de cómo importar un flujo de DataStage en un proyecto.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.