0 / 0
Volver a la versión inglesa de la documentación

Comprimir etapa en DataStage

Última actualización: 12 mar 2025
Etapa Comprimir en DataStage

La etapa Comprimir utiliza el programa de utilidad compress o GZIP de UNIX para comprimir un conjunto de datos. Convierte un conjunto de datos de una secuencia de registros en una secuencia de datos binarios sin formato.

La etapa Comprimir es una etapa de proceso. Puede tener un solo enlace de entrada y un solo enlace de salida.

El complemento de la etapa Compress es la etapa Expand, que se describe en Etapa Expand en DataStage.

Un conjunto de datos comprimido es similar a un conjunto de datos ordinario y se puede almacenar con un formato persistente mediante una etapa Conjunto de datos. Sin embargo, un conjunto de datos comprimido no se puede procesar en muchas etapas hasta que se expande, es decir, hasta que sus filas se devuelven a su formato normal. Las etapas que no ejecutan el proceso basado en columnas o reordenan las filas pueden operar en conjuntos de datos comprimidos. Por ejemplo, puede utilizar la etapa Copiar para crear una copia del conjunto de datos comprimido.

Como la compresión de un conjunto de datos elimina sus límites de registro normales, el conjunto de datos comprimido no debe reparticionarse antes de expandirse.

DataStage® coloca el esquema de conjunto de datos existente como un subregistro en un esquema comprimido genérico. Por ejemplo, dado un conjunto de datos con un esquema de:
a:int32;
b:string[50];
El esquema para el conjunto de datos comprimido será:
record
  ( t: tagged {preservePartitioning=no}
    ( encoded: subrec
        ( bufferNumber: dfloat;
          bufferLength: int32;
          bufferData: raw[32000];
         );
      schema: subrec
        ( a: int32;
          b: string[50];
         );
Por lo tanto, cuando desee reutilizar un archivo que se ha comprimido, asegúrese de utilizar el 'esquema comprimido' para leer el archivo, en lugar del esquema que se había incluido en la compresión.

Cuando efectúa una doble pulsación en la etapa Comprimir, se abre el panel de propiedades. El panel de propiedades tiene tres pestañas:

  • Etapa. Siempre está presente y se utiliza para especificar información general sobre la etapa.
  • Entrada. Aquí es donde se especifican los detalles sobre el conjunto de datos que se está comprimiendo.
  • Salida. Aquí se especifican los detalles sobre los datos comprimidos que son la salida de la etapa.

Pestaña Entrada

La sección Columnas especifica las definiciones de columna de los datos de entrada. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de entrada.

Pestaña Salida

La sección Columnas especifica las definiciones de columna de los datos. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de salida.