Fichero fijado en DataStage
Utilice un conjunto de archivos como origen o destino. Puede leer o escribir datos en un conjunto de archivos.
El conjunto de archivos puede tener un único enlace de entrada, un único enlace de salida y un único enlace de rechazo. Solo se ejecuta en modalidad paralela.
IBM® DataStage® puede generar y nombrar archivos exportados, grabarlos en su destino y listar los archivos que ha generado en un archivo cuya extensión es, por convenio, .fs. Los archivos de datos y el archivo que los lista se denominan un conjunto de archivos. Esta funcionalidad es muy útil porque algunos sistemas operativos imponen un límite de 2 GB en el tamaño de un archivo y es necesario distribuir los archivos entre los nodos para evitar sobreejecuciones.
La cantidad de datos que se pueden almacenar en cada archivo de datos de destino está limitada por las características del sistema de archivos y la cantidad de espacio libre de disco disponible. El número de archivos creados por un conjunto de archivos depende de:
- El número de nodos de proceso en la agrupación de nodos predeterminada
- El número de discos en la agrupación de discos predeterminada o de exportación conectados a cada nodo de proceso en la agrupación de nodos predeterminada
- El tamaño de las particiones del conjunto de datos
A diferencia de los conjuntos de datos, los conjuntos de archivos transportan información de formato que describe el formato de los archivos que se van a leer o escribir.
Pestaña Etapa
- Modalidad de ejecución. La etapa se puede ejecutar en modalidad paralela o en modalidad secuencial. En modalidad paralela, los nodos disponibles procesan el contenido del conjunto de datos, tal como se especifica en el archivo de configuración, según las restricciones de nodo especificadas en la pestaña Avanzado. En modalidad secuencial, el nodo conductor procesa todo el contenido del conjunto de datos.
- Modalidad de combinabilidad. Esto es Auto de forma predeterminada, lo que permite a IBM DataStage combinar los operadores que subyacen a las etapas paralelas para que se ejecuten en el mismo proceso si es sensible para este tipo de etapa.
- Conservar particionamiento. Puede seleccionar Propagar, Establecer o Borrar. Si selecciona Establecer, las operaciones de lectura de archivo solicitarán que la siguiente etapa conserve el particionamiento tal cual. La propagación utiliza el valor del distintivo de la etapa anterior.
Pestaña Entrada
La pestaña Entrada permite especificar detalles sobre cómo el conjunto de archivos escribe datos. El conjunto de archivos solo puede tener un enlace de entrada. Consulte Pestaña de entrada (DataStage) para obtener información adicional.
Pestaña Salida
La pestaña Salida permite especificar detalles sobre cómo se leen los datos en un conjunto de archivos. Consulte Pestaña de salida (DataStage) para obtener información adicional.