0 / 0
Volver a la versión inglesa de la documentación
Diseño de flujos DataStage
Última actualización: 09 dic 2024
Diseño de flujos DataStage

Los flujos de DataStage® son los activos de tiempo de diseño que contienen lógica de integración de datos.

Puede crear un flujo de DataStage vacío y añadirle conectores y etapas, o puede importar un flujo de DataStage existente desde un archivo ISX o ZIP.

Los bloques de construcción básicos de un flujo son:
  • Orígenes de datos que leen datos
  • Etapas que transforman los datos
  • Destinos de datos que escriben datos
  • Enlaces que conectan los orígenes, etapas y destinos

Paleta y lienzo en IBM DataStage

Los flujos de DataStage y sus objetos asociados se organizan en proyectos. Para empezar, abra un proyecto existente o cree un proyecto nuevo.

Creación de un flujo de DataStage

Para crear un flujo de DataStage , realice los pasos siguientes.

  1. Abra un proyecto existente o cree un proyecto.
  2. En la pestaña Activos, haga clic en Nuevo activo + > Transformar e integrar datos.
  3. En la página Crear un flujo de DataStage , utilice uno de los dos métodos siguientes para crear el flujo de DataStage :
    • Pulse el separador Nuevo , añada los detalles necesarios para el flujo de DataStage y, a continuación, pulse Crear. El nuevo flujo de DataStage se abre sin objetos en el lienzo del diseñador de DataStage .
    • Pulse la pestaña Archivo local y, a continuación, cargue un archivo ISX o ZIP desde el sistema local. A continuación, pulse Crear. Cuando se haya completado el proceso de importación, cierre la página del informe de importación y, a continuación, abra el flujo de DataStage importado desde el separador Activos del proyecto.
  4. Arrastre conectores o etapas de la paleta al lienzo de diseño de DataStage como nodos y organícelos como desee. Conecte estos nodos en el lienzo pulsando el puntero sobre un nodo para que aparezca una flecha en el nodo y, a continuación, pulse el icono de la flecha y arrástrelo al nodo al que desea conectarse.

    Esta acción crea un enlace entre los nodos.

    Para conectarse a datos remotos, consulte Conexión a una fuente de datos en DataStage.

  5. Efectúe una doble pulsación en un nodo para abrir su panel de propiedades, donde puede especificar configuraciones y valores para el nodo.
  6. Pulse Ejecutar cuando haya terminado de configurar el flujo.

    El flujo se guarda, se compila y se ejecuta automáticamente. Puede ver los registros para la compilación y para la ejecución del trabajo.

Después de compilar el flujo en un trabajo, puede volver a ejecutar el trabajo, establecer una planificación, supervisar el trabajo y actualizar el entorno en el que desea ejecutarlo. Para obtener más información sobre la actualización del entorno DataStage en el que desea que se ejecuten los trabajos, consulte DataStage.

Edición de un flujo de DataStage

Puede utilizar las acciones siguientes para editar un flujo de DataStage .

  • Arrastre una etapa o conector y suéltelo en un enlace entre dos nodos que ya están en el lienzo de diseño de DataStage . Los enlaces se añaden automáticamente para el nuevo nodo y las columnas se propagan automáticamente. Pulse Ejecutar de nuevo para ver los resultados.
  • Desconecte y vuelva a conectar manualmente los enlaces de los nodos en el lienzo de DataStage pasando el puntero sobre ellos y pulsando los puntos finales de los enlaces.
  • Arrastre una etapa o un conector desde la paleta y suéltelos en un enlace que ya esté en el lienzo. La etapa o el conector se enlazan automáticamente con el nodo de cada lado del mismo y las columnas del flujo de DataStage se propagan automáticamente.
  • Haga clic en el icono Reemplazar icono circular de actualización y seleccione otro flujo para reemplazar su flujo. Esta acción también está disponible para las etapas Build, Custom y Wrapped, así como para los subflujos y las bibliotecas Java.

Vista previa de datos

Puede editar y previsualizar datos en su flujo DataStage. En el lienzo, haga clic con el botón derecho en su conexión y seleccione Vista previa de datos. Puedes previsualizar tus datos con todas las conexiones y conectores de archivos. Para más información sobre los conectores de archivos, consulte ' Conectores de archivos en ' DataStage.

Por ejemplo, puede previsualizar la hora y el microsegundo con la zona horaria. Both time and microseconds time data types appear in the standard format: HH:mm:ss for time, and HH:mm:ss.SSSSSS for microseconds time.

Para los tipos de datos de hora, marca de tiempo y microsegundos que contienen la zona horaria, DataStage ajusta la hora en función de la zona horaria y muestra la hora UTC en el formato estándar. Por ejemplo:
Input time: 00:00:01-10:00
Local Time: 00:00:01
offset: -10 (which means UTC is 10 hours ahead of local time)
UTC Time: LocalTime + Offset = 00:00:01 + 10 hrs = 10:00:01
donde la zona horaria se convierte y se muestra como ' 10:00:01 en el formato de hora estándar.

Consideraciones

Información confidencial y valores de propiedad cifrados
No se recomienda especificar valores de propiedad cifrados como, por ejemplo, contraseñas en flujos de DataStage . En su lugar, cree un conjunto de parámetros de tipo Cifrado con un parámetro con nombre y no especifique un valor predeterminado para el parámetro. En el flujo, haga referencia al conjunto de parámetros cifrados y especifique el parámetro con nombre para el valor de propiedad, por ejemplo: #<parameter set>.<parameter name>#. Especifique el valor cifrado del parámetro #parameter set.parameter name# en el trabajo que ejecuta el flujo.
Denominación de archivos en orígenes y destinos para evitar la corrupción de datos
En la mayoría de los casos, no utilice el mismo nombre de archivo en el origen que en el destino si el origen y el destino apuntan a la misma base de datos o sistema de almacenamiento. Esta regla se aplica a archivos y tablas de base de datos. Si los nombres son los mismos, los datos pueden estar dañados.
Propagación de cambios de metadatos de columna
Cuando cambia los metadatos de una columna, los cambios se propagan automáticamente en sentido descendente. Los cambios realizados en sentido ascendente no se aplican a una columna una vez que modifica sus metadatos. Si suprime una columna, la modificación de la columna en una etapa posterior no volverá a añadir la columna.
Propagación de columnas en tiempo de ejecución
Cuando se establece RCP, si el trabajo encuentra columnas adicionales que no están definidas en los metadatos cuando se ejecuta, adopta estas columnas adicionales y las propaga a través del resto del trabajo. Esto evita errores debido a que faltan correlaciones.
Añadir parámetros
Consulte Adición de parámetros.

Más información

Ejemplos

Creación de un flujo de DataStage

Vea el siguiente vídeo para ver un ejemplo de cómo crear un flujo de DataStage simple.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Importación de un flujo de DataStage en un proyecto

Vea el siguiente vídeo para ver un ejemplo de cómo importar un flujo de DataStage en un proyecto.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información