0 / 0
Volver a la versión inglesa de la documentación
Etapas DataStage
Última actualización: 09 dic 2024
Etapas de DataStage

Un flujo de DataStage® consta de etapas que están enlazadas entre sí, que describen el flujo de datos de un origen de datos a un destino de datos. Una etapa describe un origen de datos, un paso de proceso o un sistema de destino. La etapa también define la lógica de proceso que mueve los datos desde los enlaces de entrada a los enlaces de salida.

Funciones de etapa

Una etapa normalmente tiene al menos una entrada de datos o una salida de datos. Sin embargo, algunas etapas pueden aceptar más de una entrada de datos, y una salida en más de una etapa. La tabla siguiente lista las etapas disponibles y proporciona detalles sobre sus funciones:

Tabla 1. Etapas
Etapa Icono Función
Aggregator Icono Agregador Clasifica datos de entrada en grupos, calcula totales y otras funciones de resumen para cada grupo y lo pasa a otra etapa de trabajo.
Bloom Filter Icono Filtro de bloom Busca claves entrantes en relación con valores anteriores.
Change Apply Icono Cambiar aplicación Aplica operaciones de cambio codificadas a un conjunto de datos anterior basado en un conjunto de datos modificado. Los conjuntos de datos anteriores y posteriores proceden de la etapa Capturar cambio.
Change Capture Icono Captura de cambio Compara dos conjuntos de datos y crea un registro de las diferencias.
Checksum Icono de suma de comprobación Genera un valor de suma de comprobación a partir de las columnas especificadas en una fila y añade la suma de comprobación a la fila.
Column Export Icono de suma de comprobación Exporta datos de un número de columnas de distintos tipos de datos a una sola columna de tipos de datos ustring, string o binary.
Column Generator Icono Generador de columnas Añade columnas a los datos de entrada y genera datos falsos para estas columnas para cada fila de datos procesada.
Column Import Icono Importar columna Esta etapa importa datos de una sola columna y genera la salida para una o varias columnas.
Combine Records Icono Combinar registros Combina registros en los que determinados valores de columna de clave son idénticos en vectores de subregistros.
Compare Icono Comparar Realiza una comparación de columnas por columna de registros en dos conjuntos de datos de entrada preseleccionados.
Compress Icono Comprimir Utiliza el programa de utilidad compress o GZIP de UNIX para comprimir un conjunto de datos. Convierte un conjunto de datos de una secuencia de registros en una secuencia de datos binarios sin formato.
Copy Icono Copiar Copia un único conjunto de datos de entrada en numerosos conjuntos de datos de salida.
Decode Icono Decodificar Descodifica un conjunto de datos utilizando un mandato de descodificación UNIX que proporcione.
Difference Icono de diferencia Realiza una comparación registro por registro de dos conjuntos de datos de entrada, que son distintas versiones del mismo conjunto de datos.
Distributed Transaction Icono Transacción distribuida Ejecuta transacciones en varios orígenes de datos.
Encode Icono Codificar Codifica un conjunto de datos utilizando un mandato de codificación UNIX que proporcione.
Expand Icono Expandir Utiliza el programa de utilidad uncompress o GZIP de UNIX para expandir un conjunto de datos. Vuelve a convertir un conjunto de datos previamente comprimido en una secuencia de registros a partir de una secuencia de datos binarios sin formato.
External Filter Icono Filtro externo Permite especificar un mandato de UNIX que actúa como un filtro sobre los datos que se están procesando.
Filter Icono de filtro Transfiere, sin modificar, los registros del conjunto de datos de entrada que satisfacen los requisitos que especifique y filtra todos los demás registros.
Funnel Icono de embudo Copia múltiples conjuntos de datos de entrada en un único conjunto de datos de salida.
Generic Icono genérico Incorpora un operador de Orchestrate ® en su trabajo.
Head Icono de cabecera Selecciona el primer N registro de cada partición de un conjunto de datos de entrada y copia los registros seleccionados en un conjunto de datos de salida.
Join Icono de unión Realiza operaciones de unión en dos o varios conjuntos de datos de entrada en la etapa y, a continuación, genera el conjunto de datos resultante.
Lookup Icono de búsqueda Se utiliza para realizar operaciones de búsqueda en un conjunto de datos leído en la memoria desde cualquier otra etapa de trabajo paralelo que pueda emitir datos o que esté suministrada por una de las etapas de base de datos que soportan enlaces de salida de referencia. También puede realizar una búsqueda en una tabla de búsqueda contenida en una etapa Conjunto de archivos de búsqueda.
Make Subrecords Icono de Combina los vectores especificados de un conjunto de datos de entrada en un vector de subregistros cuyas columnas tienen los nombres y tipos de datos de los vectores originales.
Make Vector Icono Crear vector Combina las columnas especificadas de un registro de datos de entrada en un vector de columnas.
Merge Icono Fusionar Combina un conjunto de datos maestro con uno o varios conjuntos de datos de actualización ordenados.
Modify Icono Modificar Altera el esquema del registro de su conjunto de datos de entrada.
Peek Icono de vista rápida Imprime valores de columna de registro en el registro de trabajo o en un enlace de salida independiente a medida que la etapa copia registros de sus datos de entrada establecidos en uno o más conjuntos de datos de salida.
Pivot Enterprise Icono de empresa dinámica

La etapa Pivot Enterprise es una etapa de proceso que gira los datos horizontal y verticalmente.

El giro horizontal correlaciona un conjunto de columnas en una fila de entrada con una sola columna en varias filas de salida.

El giro vertical correlaciona un conjunto de filas en los datos de entrada con columnas de salida individuales o múltiples.

Promote Subrecords Icono Promocionar subregistros Promociona las columnas de un subregistro de entrada a columnas de nivel superior.
Remove Duplicates Icono Eliminar duplicados Toma un único conjunto de datos ordenado como entrada, elimina todos los registros duplicados y graba los resultados en un conjunto de datos de salida.
Row Generator Icono Generador de filas Genera un conjunto de datos de simulación que se ajustan a los metadatos especificados.
Sample Icono de ejemplo Muestrea un conjunto de datos de entrada.
Slowly Changing Dimension (SCD) Icono Ordenar Funciona en el contexto de una base de datos de esquema en estrella para almacenar y gestionar datos actuales e históricos a lo largo del tiempo.
Sort Icono Ordenar Ordena columnas de entrada.
Split Subrecord Icono Dividir subregistro Separa un campo de subregistro de entrada en un conjunto de columnas de vector de nivel superior.
Split Vector Icono Dividir vector Promociona los elementos de un vector de longitud fija a un conjunto de columnas de nivel superior denominadas de forma parecida.
Surrogate Key Generator stage Icono Generador de claves suplentes Genera columnas de claves sucedáneas y mantiene el origen de clave.
Switch Icono de conmutador Toma un único conjunto de datos como entrada y asigna cada registro de entrada a un conjunto de datos de salida basado en el valor de un campo de selector.
Tail Icono de cola Selecciona los últimos N registros de cada partición de un conjunto de datos de entrada y copia los registros seleccionados en un conjunto de datos de salida.
Transformer Icono de transformador Maneja datos extraídos, realiza las conversiones necesarias y pasa datos a otra etapa activa o a una etapa que graba datos en una base de datos o archivo de destino.
Wave Generator Icono Generador de ciclo Supervisa una secuencia de datos e inserta marcadores de fin de ola donde sea necesario.
Web Service Icono de servicio web Accede a operaciones de servicio web dentro de un flujo o trabajo de DataStage .
Write Range Map Icono Escribir mapa de rango Graba datos en un mapa de rango. La etapa puede tener un único enlace de entrada.

Vea esta serie de vídeos para ver cómo utilizar las etapas más comunes.