Codificar etapa en DataStage
La etapa Encode codifica un conjunto de datos utilizando un mandato de codificación UNIX, como por ejemplo gzip, que proporcione.
La etapa Codificar es una etapa de proceso. La etapa convierte un conjunto de datos de una secuencia de registros en una secuencia de datos binarios sin formato. La etapa complementaria Decode reconvierte el flujo de datos en un conjunto de datos (véase Etapa de decodificación en DataStage).
Un conjunto de datos codificado es similar a uno ordinario y se puede escribir en una etapa de conjunto de datos. No puede utilizar un conjunto de datos codificado como entrada para las etapas que ejecutan un proceso basado en columnas o que reclasifican las filas, pero sí puede utilizarlo como entrada para etapas, tal como Copiar. Puede ver información sobre el conjunto de datos en el visor de conjuntos de datos, pero no sobre los propios datos. No puede reparticionar un conjunto de datos codificado y se le avisará en el tiempo de ejecución si su trabajo intenta hacerlo.
Cuando efectúa una doble pulsación en la etapa Codificar, se abre el panel de propiedades. El panel de propiedades tiene tres pestañas:
- Etapa. Siempre está presente y se utiliza para especificar información general sobre la etapa.
- Entrada. Aquí es donde se especifican los detalles sobre los datos que se agrupan o se agregan.
- Salida. Aquí es donde se especifican los detalles sobre los grupos que se generan desde la etapa.
Pestaña Entrada
La sección Columnas especifica las definiciones de columna de los datos de entrada. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de entrada.
Pestaña Salida
La sección Columnas especifica las definiciones de columna de los datos de entrada. Pulse Editar en la parte inferior de la sección Columnas para especificar definiciones de columna para los datos. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de salida.