Fichero secuencial en DataStage
Utilice un archivo secuencial para leer datos de uno o más archivos planos o para escribir datos en ellos. Puede leer y escribir archivos planos en un almacenamiento local o en Google Cloud Storage en sus DataStage® flujos.
El archivo secuencial puede tener un único enlace de entrada o un único enlace de salida, y un único enlace de rechazo. Se ejecuta en modalidad paralela si lee varios archivos, pero se ejecuta secuencialmente si solo lee un archivo. De forma predeterminada, un único nodo leerá un archivo completo (aunque cada nodo puede leer más de un archivo). Sin embargo, para los archivos de anchura fija, puede configurar el conector para que se comporte de forma diferente:
- Puede especificar que varios nodos puedan leer archivos individuales. Esto puede mejorar el rendimiento en sistemas en clúster.
- Puede especificar que varios lectores se ejecuten en un único nodo. Esto significa, por ejemplo, que un único archivo puede particionarse tal como se lee (aunque la etapa esté restringida a ejecutarse secuencialmente en el nodo conductor).
El archivo secuencial se ejecuta en paralelo si se escribe en varios archivos, pero se ejecuta secuencialmente si se escribe en un solo archivo. Cada nodo escribe en un único archivo, pero un nodo puede escribir más de un archivo.
Después de cargar archivos secuenciales como activos, IBM® DataStage utiliza IBM Cloud Object Storage para almacenar los archivos. Todos los archivos leídos desde la etapa Sequential File deben estar presentes en DataStage/files/<path_given_in_stage_properties> a menos que la ruta empiece por cos://, en cuyo caso deben estar en el cubo COS de nivel superior (<path_given_in_stage_properties>). Puede comprobar los archivos fuera del trabajo DataStage en el directorio DataStage/files/<path_given_in_stage_properties>, a menos que la ruta empiece por cos://, en cuyo caso los archivos deberían estar presentes en el bucket COS de nivel superior (<path_given_in_stage_properties>). Si utiliza el navegador de activos, IBM DataStage utiliza el conector COS IBM. No utiliza el archivo secuencial.
Pestaña Etapa
- Modalidad de ejecución. El conector puede ejecutarse en modalidad paralela o en modalidad secuencial. En modalidad paralela, los nodos disponibles procesan el contenido del conjunto de datos, tal como se especifica en el archivo de configuración, según las restricciones de nodo especificadas en la pestaña Avanzado. En modalidad secuencial, el nodo conductor procesa todo el contenido del conjunto de datos.
- Modalidad de combinabilidad. Esto es Auto de forma predeterminada, lo que permite a IBM DataStage combinar los operadores que subyacen a las etapas paralelas para que se ejecuten en el mismo proceso si es sensible para este tipo de etapa.
- Conservar particionamiento. Puede seleccionar Propagar, Establecer o Borrar. Si selecciona Establecer, las operaciones de lectura de archivo solicitarán que la siguiente etapa conserve el particionamiento tal cual. La propagación utiliza el valor del distintivo de la etapa anterior.
Pestaña Entrada
La pestaña Entrada permite especificar detalles sobre cómo el archivo secuencial escribe datos en uno o varios archivos sin formato. El archivo secuencial solo puede tener un enlace de entrada, pero puede escribir en varios archivos. Puede especificar el formato de archivo secuencial o parquet en Formato de archivo.
La categoría Destino define el archivo, la modalidad de actualización de archivos y el método de escritura. A continuación, se muestran los parámetros de categoría de destino:- Archivo
- Esta propiedad define el archivo sin formato en el que se escribirán los datos de entrada. Puede escribir un nombre de vía de acceso. Puede especificar varios archivos repitiendo la propiedad Archivo. Para ello, seleccione el elemento Propiedades en la parte superior del árbol y pulse Archivo en el recuadro Propiedades disponibles que se van a añadir. Haga esto para cada archivo adicional que desee especificar.
- Modalidad de actualización de archivos
Esta propiedad define cómo se actualizan el archivo o los archivos especificados. Se aplica el mismo método a todos los archivos donde se está escribiendo. Puede elegir Anexar, para anexar a los archivos existentes; Sobrescribir, para sobrescribir los archivos existentes; o Crear, para crear un archivo nuevo. Si especifica la propiedad Crear para un archivo que ya existe, obtendrá un error en tiempo de ejecución.
De forma predeterminada, esta propiedad se establece en Sobrescribir.
- Método de escritura
Esta propiedad especifica si la salida se escribe en los archivos especificados o los archivos generados. De forma predeterminada, esta propiedad se establece en Archivos específicos.
La propiedad Generar varios archivos permite especificar propiedades adicionales para los archivos generados. En la propiedad Generar varios archivos, la propiedad Excluir serie de partición afecta al nombre de los archivos generados. La propiedad Forzar ejecución secuencial cambia el tipo de proceso.
Bajo la propiedad Generar varios archivos también se encuentra la propiedad Clave. Utilice la propiedad Clave para especificar una columna de clave. Puede utilizar la columna de clave para desencadenar la creación de un nuevo archivo cuando cambia el valor de clave. Si no se especifica una clave, el tamaño de archivo desencadena la creación de un nuevo archivo. (El tamaño máximo de archivo se especifica en la categoría Opciones).
Puede utilizar los valores predeterminados para la propiedad Clave. Si elige cambiar el valor predeterminado y establece Utilizar valor en nombre de archivo en Sí, la etapa aplica el valor de columna de clave al nombre de archivo. El uso de la opción Utilizar valor en nombre de archivo no afecta al comportamiento de otras opciones de clave como, por ejemplo, Orden de clasificación o Posición de nulos.
- Limpiar en caso de error
- Se establece en True de forma predeterminada y especifica que la etapa suprimirá todos los archivos escritos parcialmente si la etapa falla por algún motivo. Establezca esta opción en False para especificar que deben dejarse los archivos escritos parcialmente.
- La primera línea son los nombres de las columnas
- Especifica que la primera línea del archivo contiene nombres de columna. Esta propiedad es false de forma predeterminada.
- Modalidad de rechazo
Especifica qué sucede con los registros de datos que no se escriben en un archivo por alguna razón. Puede elegir Continuar, para continuar con la operación y descartar las filas rechazadas; Error, para dejar de escribir si se rechazan filas; o Guardar, para enviar las filas rechazadas a un enlace de rechazo.
Se establece en Continuar de forma predeterminada.
- Archivo de esquema
- Se trata de una propiedad opcional. De forma predeterminada, la etapa utiliza las definiciones de columna definidas en las pestañas Columnas y Formato como esquema para escribir en el archivo. No obstante, puede especificar un archivo que contenga un esquema en su lugar (tenga en cuenta que si tiene columnas definidas en la pestaña Columnas, debe asegurarse de que estas coincidan con el archivo de esquema). Escriba un nombre de vía de acceso o busque un archivo de esquema.
- Tamaño máximo de archivo
Se trata de una propiedad opcional. Esta propiedad especifica el tamaño máximo de un archivo de destino en megabytes (MB). Cuando se alcanza el tamaño máximo especificado, se genera otro archivo de destino. De forma alternativa, puede especificar una columna de clave en la categoría Propiedades para desencadenar la generación de un nuevo archivo.
Esta propiedad está disponible cuando la propiedad de etapa Método de escritura está establecida en Generar varios archivos. Si no se especifica un tamaño máximo de archivo, el tamaño del archivo es ilimitado.
Pestaña Salida
La pestaña Salida permite especificar detalles sobre cómo el archivo secuencial lee datos en uno o varios archivos sin formato. Puede especificar el formato de archivo secuencial o parquet en Formato de archivo.
La lista desplegable Nombre de salida permite elegir si está buscando los detalles del enlace de salida principal (el enlace de secuencias) o el enlace de rechazo. La pestaña Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de salida.
- Archivo específico
- fileName
- El nombre de archivo. Puede escribir un nombre de vía de acceso.
Los nombres de archivo que incluyen caracteres especiales como, por ejemplo, dos puntos (:), ampersands (&) o espacios en blanco pueden provocar avisos, errores u otros problemas.
- Patrón de archivos
- Especifique un prefijo de los nombres de archivo que se van a seleccionar.
- Mantener las particiones de archivo
- Establezca esta opción en True para particionar el conjunto de datos importado de acuerdo con la organización del archivo o archivos de entrada. Por ejemplo, si está leyendo tres archivos, tendrá tres particiones. El valor predeterminado es False.
- Modalidad de archivo inexistente
- Indica la acción que debe realizarse si una de las propiedades Archivo ha especificado un archivo que no existe. Puede elegir Error, para detener el trabajo; Aceptar, para omitir el archivo; o Depende, que indica que el valor predeterminado es Error, a menos que el archivo tenga un prefijo de nombre de nodo *:, en cuyo caso es Aceptar. El valor predeterminado es Depende.
- Modalidad de rechazo
- Permite especificar el comportamiento si un registro de lectura no coincide con el esquema esperado. Puede elegir Continuar, para continuar con la operación y descartar las filas rechazadas; Error, para dejar de leer si se rechazan filas; o Guardar, para enviar las filas rechazadas a un enlace de rechazo. El valor predeterminado es Continuar.
- Informar del progreso
- Seleccione Sí o No para habilitar o inhabilitar la creación de informes. De forma predeterminada, la etapa muestra un informe de progreso en cada intervalo del 10 % cuando puede determinar el tamaño del archivo. La creación de informes solo se realiza si el archivo tiene más de 100 KB, los registros son de longitud fija y no hay ningún filtro en el archivo.
- La primera línea son los nombres de las columnas
- Especifica que la primera línea del archivo contiene nombres de columna. Esta propiedad es false de forma predeterminada.
Formato
La sección Formato de la pestaña Salida permite proporcionar información sobre el formato del archivo o los archivos sin formato que está leyendo.
Si no modifica ninguno de los valores de Formato, la etapa genera un archivo con el formato siguiente:
- El archivo está formado por columnas de longitud variable escritas entre comillas dobles.
- Todas las columnas están delimitadas por una coma, excepto la columna final de una fila.
- Las filas están delimitadas por una nueva línea de UNIX.
Nivel de registro
Estas propiedades definen detalles sobre cómo se formatean los registros de datos en el archivo sin formato. Cuando puede especificar un carácter, normalmente puede ser un carácter ASCII o un carácter Unicode de varios bytes (si tiene habilitado el soporte multilingüístico). Las propiedades disponibles son:
- Carácter de relleno. No se aplica a los enlaces de salida.
- Serie de delimitador final. Especifique la serie escrita después de la última columna de un registro en lugar del delimitador de columna. Especifique uno o varios caracteres; precederán al delimitador de registro si se utiliza uno. Es mutuamente excluyente con el delimitador final, que es el valor predeterminado. Por ejemplo, si establece Delimitador en coma y Serie de delimitador final en `, ` (espacio de coma; no es necesario especificar las comas invertidas), todos los campos están delimitados por una coma, excepto el campo final, que está delimitado por una coma seguida de un carácter de espacio ASCII. DataStage omite la serie de delimitador especificada al leer el archivo.
- Delimitador final. Especifique el carácter individual escrito después de la última columna de un registro en lugar del delimitador de campo. Escriba un carácter o seleccione uno de los siguientes: espacio en blanco, final, ninguno, nulo, tabulación o coma. DataStage omite la serie de delimitador especificada al leer el archivo. Consulte el siguiente diagrama para ver una ilustración.
- espacio en blanco. La última columna de cada registro no incluirá ningún espacio en blanco final que se encuentre al final del registro.
- final. La última columna de cada registro no incluye el delimitador de campo. Este es el valor predeterminado.
- none. La última columna de cada registro no tiene un delimitador; se utiliza para campos de anchura fija.
- nulo. La última columna de cada registro está delimitada por el carácter nulo ASCII.
- coma. La última columna de cada registro está delimitada por el carácter de coma ASCII.
- tabulación. La última columna de cada registro está delimitada por el carácter de tabulación ASCII.
- Intacta. La propiedad intacta especifica un identificador de un esquema parcial. Un esquema parcial especifica que la etapa solo puede modificar las columnas nombradas en el esquema. Las demás columnas de la fila se pasan sin modificar. El archivo que contiene el esquema parcial se especifica en la propiedad Archivo de esquema en la pestaña Salidas. Esta propiedad tiene una propiedad dependiente:
- Comprobar intacta. Seleccione esta opción para forzar la validación del esquema parcial cuando el archivo o los archivos se importan. Tenga en cuenta que esta opción puede degradar el rendimiento.
- Serie de delimitador de registro. Especifique la serie al final de cada registro. Especifique uno o más caracteres. Se excluye mutuamente con el delimitador de registro, que es el valor predeterminado, con el tipo de registro y con el prefijo de registro.
- Delimitador de registro. Especifique el carácter único al final de cada registro. Escriba un carácter o seleccione uno de los siguientes:
- UNIX Newline (el valor predeterminado)
- nulo
Para especificar una nueva línea de DOS, utilice la propiedad de serie de Delimitador de registro establecida en "\r" o "\n".
El delimitador de registro se excluye mutuamente con la serie de delimitador de registro, el prefijo de registro y el tipo de registro.
- Longitud de registro. Seleccione Fijo donde se leen los campos de longitud fija. DataStage calcula la longitud adecuada para el registro. Como alternativa, especifique la longitud de los registros fijos como número de bytes. No se utiliza de forma predeterminada (los archivos predeterminados están delimitados por comas).
- Prefijo de registro. Especifica que un registro de longitud variable tiene un prefijo de longitud de 1, 2 o 4 bytes. Está establecido en 1 de forma predeterminada. Se excluye mutuamente con el delimitador de registro, que es el valor predeterminado, con la serie de delimitador de registro y con el tipo de registro.
- Tipo de registro. Especifica que los datos constan de registros bloqueados de longitud variable (variables) o de registros implícitos (implícitos). Si elige la propiedad implícita, los datos se graban como una secuencia sin límites de registro explícitos. El final del registro se infiere cuando se han analizado todas las columnas definidas por el esquema. La propiedad variable permite especificar uno de los siguientes formatos bloqueados o distribuidos de IBM: V, VB, VS, VBS o VR. Los datos se importan utilizando uno de estos formatos. Estos formatos no están disponibles para la exportación.
Esta propiedad se excluye mutuamente con la longitud de registro, el delimitador de registro, la serie de delimitador de registro y el prefijo de registro, y no se utiliza de forma predeterminada.
Valores predeterminados del campo
Define las propiedades predeterminadas para las columnas leídas en el archivo o los archivos. Se aplican a todas las columnas, pero se pueden alterar temporalmente para columnas individuales en la pestaña Columnas utilizando el recuadro de diálogo Editar metadatos de columna. Una razón común para alterar temporalmente una propiedad para una columna individual se produce al leer archivos de valores separados por comas (CSV). Los archivos CSV suelen incluir campos entre comillas, donde los campos pueden contener un carácter especial como, por ejemplo, el delimitador de campo. En este caso, la propiedad Quote para las columnas en cuestión debe alterarse temporalmente.
Cuando puede especificar un carácter, normalmente puede ser un carácter ASCII o un carácter Unicode de varios bytes (si tiene habilitado el soporte multilingüístico). Las propiedades disponibles son:
- Longitud real del campo. Especifica el número real de bytes que se deben omitir si la longitud del campo es igual al valor de la propiedad de longitud de campo nula.
- Delimitador. Especifica el delimitador final de todos los campos del registro. Escriba un carácter ASCII o seleccione uno de los siguientes: espacio en blanco, final, ninguno, nulo, coma o tabulador. DataStage omite el delimitador al leer.
- espacio en blanco. Los caracteres de espacio en blanco al final de una columna se ignoran, es decir, no se tratan como parte de la columna.
- final. El final de un campo se toma como delimitador, es decir, no hay ningún delimitador separado. No es lo mismo que un valor "None", que se utiliza para campos con columnas de anchura fija.
- none. Sin delimitador (utilizado para la anchura fija).
- nulo. Se utiliza el carácter nulo ASCII.
- coma. Se utiliza el carácter de coma ASCII.
- tabulación. Se utiliza el carácter de tabulación ASCII.
- Serie de delimitador. Especifique la serie al final de cada campo. Especifique uno o más caracteres. Se excluye mutuamente con el Delimitador, que es el valor predeterminado. Por ejemplo, si especificar `, ` (espacio de coma; no es necesario especificar las comas invertidas) especifica que cada campo está delimitado por `, ` a menos que se altere temporalmente para campos individuales. DataStage omite la serie de delimitador al leer.
- Longitud de campo nula. La longitud en bytes de un campo de longitud variable que contiene un valor nulo. Cuando se lee un campo de longitud variable, una longitud de campo nula en el campo de origen indica que contiene un valor nulo. Esta propiedad se excluye mutuamente con un valor de campo nulo.
- Valor de campo nulo. Especifica el valor proporcionado a un campo nulo si el origen se establece en nulo. Puede ser un número, una serie o un carácter de escape literal de tipo C. Por ejemplo, puede representar un valor de byte mediante \ooo, donde cada o es un dígito octal del 0 al 7, y el primer o es < 4, o mediante \xhh, donde cada h es un dígito hexadecimal de 0 a F. Debe utilizar este formulario para codificar valores de bytes no imprimibles.
Esta propiedad se excluye mutuamente con la longitud del campo nula y la longitud real. Para una representación de datos de ancho fijo, puede utilizar el carácter de relleno (en la sección general de valores predeterminados de tipo) para especificar un carácter de cola repetido si el valor que especifica es más corto que la anchura fija del campo.
Puede especificar la lista de valores nulos que puede contener una columna que representan un valor nulo. Para ello, especifique un carácter separador en la propiedad Separador de valor de campo nulo dependiente y, a continuación, utilice este separador para delimitar los valores nulos de la propiedad Valor de campo nulo. Por ejemplo, si establece Separador de valor de campo nulo para que contenga el carácter de barra inclinada (/), puede especificar NULL/null/NUL/nul para especificar que cualquiera de estas series puede representar un valor nulo en esta columna.
- Separador de valor de campo nulo
Esta es una propiedad dependiente de Valor de campo nulo. Puede especificar un separador que se puede utilizar en la propiedad Valor de campo nulo para especificar el rango de valores que pueden representar el valor nulo. Puede especificar un número, una serie o un carácter de escape literal de tipo C (como para Valor de campo nulo) como separador, pero un solo carácter como una coma (,) o una barra inclinada (/) es la mejor opción. Solo debe especificar un separador si especifica varios valores en Valor de campo nulo; si especifica un separador y no se utiliza, se genera un error de tiempo de ejecución.
- Bytes de prefijo. Puede utilizar esta opción con campos de longitud variable. Los campos de longitud variable pueden estar delimitados por un carácter o precedidos por un prefijo de 1, 2 o 4 bytes que contiene la longitud de campo. DataStage lee el prefijo de longitud pero no incluye el prefijo como un campo independiente en el conjunto de datos que lee del archivo.
Esta propiedad se excluye mutuamente con las propiedades Delimitador, Cuota y Delimitador final, que se utilizan de forma predeterminada.
- Campo de impresión. Esta propiedad está indicada para utilizarse al depurar trabajos. Establézcalo para que DataStage genere un mensaje para cada campo que lea. El mensaje tiene el formato:
Importing N: D
donde:- N es el nombre del campo.
- D son los datos importados del campo. Los caracteres no imprimibles contenidos en D tienen como prefijo un carácter de escape y se escriben como literales de serie C; si el campo contiene datos binarios, se genera en formato octal.
- Comilla. Especifica que los campos de longitud variable se escriben entre comillas simples, comillas dobles u otro carácter o par de caracteres. Elija Simple o Doble o entre un carácter. Se establece en comillas dobles de forma predeterminada.
Al leer, DataStage ignora el carácter de comilla inicial y lee todos los bytes hasta el carácter de comilla final, pero sin incluirlo.
- Prefijo vectorial. Para los campos que son vectores de longitud variable, especifica que un prefijo de 1, 2 o 4 bytes contiene el número de elementos del vector. Puede alterar temporalmente este prefijo predeterminado para los vectores individuales.
Los vectores de longitud variable deben utilizar un prefijo en el vector o un enlace a otro campo para especificar el número de elementos en el vector. Si el vector de longitud variable tiene un prefijo, utilice esta propiedad para indicar la longitud del prefijo. DataStage lee el prefijo de longitud pero no lo incluye como un campo independiente en el conjunto de datos. De forma predeterminada, se supone que la longitud del prefijo es de un byte.
Valores predeterminados del tipo
Son propiedades que se aplican a todas las columnas de un tipo de datos específico a menos que se alteren temporalmente específicamente a nivel de columna. Se dividen en un varios subgrupos según el tipo de datos.
General
- Orden de bytes. Especifica cómo se ordenan los tipos de datos de varios bytes (excepto los tipos de serie y los tipos de datos sin formato). Seleccione entre:
- little-endian. El byte alto está a la derecha.
- big-endian. El byte alto está a la izquierda.
- native-endian. Según lo definido por el formato nativo de la máquina. Esta es la opción predeterminada.
- Formato de datos. Especifica el formato de representación de datos de un campo. Se aplica a los campos de todos los tipos de datos, excepto a los campos de serie, ustring y sin formato; y a los campos de registro, subregistro o etiquetado que contienen al menos un campo que no es de serie ni sin formato. Seleccione entre:
- binario
- texto (el valor predeterminado)
Un valor binario tiene significados diferentes cuando se aplica a tipos de datos diferentes:
- Para los decimales, binarios significa empaquetado.
- Para otros tipos de datos numéricos, binario significa "sin texto".
- Para las fechas, binario equivale a especificar la propiedad juliana del campo de fecha.
- Para el tiempo, binario es equivalente a midnight_seconds.
- Para la indicación de fecha y hora, binario especifica que el primer entero contiene un recuento de días juliano para la parte de fecha de la indicación de fecha y hora, y el segundo entero especifica la parte de tiempo de la indicación de fecha y hora como el número de segundos desde medianoche. Una indicación de fecha y hora binaria especifica que se escriben dos enteros de 32 bits.
De forma predeterminada, los datos se formatean como texto, de la siguiente manera:
- Para el tipo de datos de fecha, el texto especifica que los datos leídos contienen una fecha basada en texto con el formato %yyyy-%mm-%dd o el formato de fecha predeterminado, si ha definido uno nuevo en un sistema NLS.
- Para el tipo de datos decimal: un campo representa un decimal en un formato de serie con un espacio inicial o '-' seguido de dígitos decimales con un punto decimal incorporado si la escala es distinta de cero. El formato de la serie de destino es: [+ | -]ddd.[ddd] y se ignoran los argumentos de precisión y escala.
- Para campos numéricos (int8, int16, int32, uint8, uint16, uint32, sfloat y dfloat): DataStage presupone que los campos numéricos se representan como texto.
- Para el tipo de datos de hora: el texto especifica que el campo representa la hora con un formato basado en texto %hh:%nn:%ss o un formato de fecha predeterminado, si ha definido uno nuevo en un sistema NLS.
- Para el tipo de datos de indicación de fecha y hora: el texto especifica una indicación de fecha y hora basada en texto con el formato %aaaa-%mm-%dd %hh: %nn:%ss o con el formato de fecha predeterminado si ha definido uno nuevo en un sistema NLS.
- Anchura máxima de campo. El número máximo de bytes en una columna representada como una serie. Especifique un número. Esto es útil cuando se están almacenando números como texto. Si utiliza un juego de caracteres de anchura fija, puede calcular la longitud exactamente. Si utiliza un juego de caracteres de longitud variable, calcule una anchura máxima adecuada para los campos. Se aplica a los campos de todos los tipos de datos excepto la fecha, hora, indicación de fecha y hora y sin formato; y registro, subregistro o etiquetado si contienen al menos un campo de este tipo.
- Anchura de campo. El número de bytes en un campo representado como una serie. Especifique un número. Esto es útil cuando se están almacenando números como texto. Si utiliza un conjunto de caracteres de anchura fija, puede calcular el número de bytes exactamente. Si se trata de una codificación de longitud variable, base el cálculo en la anchura y la frecuencia de los caracteres de anchura variable. Se aplica a los campos de todos los tipos de datos excepto la fecha, hora, indicación de fecha y hora y sin formato; y registro, subregistro o etiquetado si contienen al menos un campo de este tipo.
Si no especifica una anchura de campo ni una anchura máxima de campo, los campos numéricos escritos como texto tienen el siguiente número de bytes como su anchura máxima:
- enteros con signo o sin signo de 8 bits: 4 bytes
- enteros con signo o sin signo de 16 bits: 6 bytes
- enteros con signo o sin signo de 32 bits: 11 bytes
- enteros con signo o sin signo de 64 bits: 21 bytes
- flotante de precisión simple: 14 bytes (signo, dígito, punto decimal, fracción 7, "E", signo, exponente 2)
- flotante de precisión doble: 24 bytes (signo, dígito, punto decimal, fracción 16, "E", signo, exponente 3)
- Carácter de relleno. Esta propiedad se ignora para los enlaces de salida.
- Juego de caracteres. Especifica el juego de caracteres. Elija entre ASCII o EBCDIC. El valor predeterminado es ASCII. Se aplica a todos los tipos de datos excepto sin formato y ustring; y a los tipos de datos de registro, subregistro o etiquetado que no contienen campos distintos de sin formato o ustring.
Serie
- Exportar EBCDIC como ASCII. No es relevante para los enlaces de salida.
- Importar ASCII como EBCDIC. Seleccione esta opción para especificar que los caracteres ASCII se leen como caracteres EBCDIC.
Decimal
- Permitir todos los ceros. Especifica si se debe tratar campo decimal empaquetado que contiene todo ceros (lo que normalmente no es válido) como una representación válida de cero. Seleccione Sí o No. El valor predeterminado es No.
- Separador decimal. Especifique el carácter que actúa como separador decimal (el punto, de forma predeterminada).
- Empaquetado. Seleccione una opción para especificar lo que contienen las columnas decimales; elija uno de los siguientes:
- Sí, para especificar que los campos decimales contienen datos en formato decimal empaquetado (el valor predeterminado). Tiene las siguientes subpropiedades:
Comprobar. Seleccione Sí para verificar que los datos están empaquetados o No para no verificar.
Con signo. Seleccione Sí para utilizar el signo existente al leer campos decimales. Seleccione No para escribir un signo positivo (0xf) independientemente del valor de signo real de los campos.
- No (aparte) para especificar que contienen un decimal desempaquetado con un byte de signo separado. Tiene la siguiente subpropiedad:
Posición de signo. Elija el principio o el final según corresponda.
- No (delimitado) para especificar que contienen un decimal desempaquetado en texto ASCII o EBCDIC. Tiene la siguiente subpropiedad:
Posición de signo. Elija el principio o el final según corresponda.
- No (perforación de zona) para especificar que el campo tiene un byte inicial o final que contiene un carácter que especifica tanto el valor numérico de ese byte como si el número en su conjunto tiene un signo negativo o positivo. Tiene la siguiente subpropiedad:
Posición de signo. Elija el principio o el final según corresponda.
- Sí, para especificar que los campos decimales contienen datos en formato decimal empaquetado (el valor predeterminado). Tiene las siguientes subpropiedades:
- Precisión. Especifica la precisión de un decimal empaquetado. Especifique un número.
- Redondeo. Especifica cómo redondear el campo de origen para que se ajuste al decimal de destino al leer un campo de origen con un decimal. Seleccione entre:
- hacia arriba (máximo). Trunque la columna de origen hacia el infinito positivo. Esta modalidad corresponde a la modalidad de redondeo hacia arriba IEEE 754. Por ejemplo, 1.4 se convierte en 2, -1.6 se convierte en -1.
- hacia abajo (mínimo). Trunque la columna de origen hacia el infinito negativo. Esta modalidad corresponde a la modalidad de redondeo hacia abajo IEEE 754. Por ejemplo, 1.6 se convierte en 1, -1.4 se convierte en -2.
- valor más próximo. Redondee la columna de origen hacia el valor representable más cercano. Esta modalidad corresponde a la modalidad COBOL REDONDEADO. Por ejemplo, 1.4 se convierte en 1, 1.5 se convierte en 2, -1.4 se convierte en -1, -1.5 se convierte en -2.
- truncar hacia cero. Esta es la opción predeterminada. Descarte los dígitos fraccionales a la derecha del dígito fraccional más a la derecha soportado en el destino, independientemente del signo. Por ejemplo, si el destino es un entero, se truncan todos los dígitos fraccionales. Si el destino es otro decimal con una escala más pequeña, trunque el tamaño de escala del decimal de destino. Esta modalidad corresponde a la función INTEGER-PART de COBOL. Utilizando este método 1,6 se convierte en 1, -1,6 se convierte en -1.
- Escala. Especifica la escala de un decimal empaquetado de origen.
Numérico
- C_format. Realiza una conversión no predeterminada de datos de serie a un entero o coma flotante. Esta propiedad especifica una serie de formato de lenguaje C que se utiliza para leer series de series de entero o coma flotante. Esto se pasa a sscanf(). Por ejemplo, si especifica un formato C de %x y una anchura de campo de 8, se asegura de que un entero de 32 bits se formatee como una serie hexadecimal de 8 bytes.
- In_format. Serie de formato utilizada para la conversión de datos de serie a datos enteros o de coma flotante. Se pasa a sscanf(). De forma predeterminada, DataStage invoca la función C sscanf() para convertir un campo numérico formateado como una serie a datos enteros o de coma flotante. Si esta función no genera datos en un formato satisfactorio, puede especificar la propiedad in_format para pasar los argumentos de formato a sscanf().
- Out_format. Esta propiedad no es relevante para los enlaces de salida.
Fecha
- Días desde. Las fechas se escriben como un entero firmado que contiene el número de días desde la fecha especificada. Especifique una fecha con el formato %aaaa-%mm-%dd o en el formato de fecha predeterminado si ha definido uno nuevo en un sistema NLS.
- Serie de formato. El formato de serie de una fecha. De forma predeterminada, es %aaaa-%mm-%dd.
- Es juliana. Seleccione esta opción para especificar que las fechas se escriben como un valor numérico que contiene el día del calendario juliano. Un día de calendario juliano especifica la fecha como el número de días desde el 1 de enero de 4713 a.C, 12:00 horas (mediodía) GMT.
Hora
- Serie de formato. Especifica el formato de las columnas que representan la hora como una serie. De forma predeterminada, es %hh-%mm-%ss.
- Es segundos desde medianoche. Seleccione esta opción para especificar que las horas se escriben como un entero binario de 32 bits que contiene el número de segundos transcurridos desde la medianoche anterior.
Indicación de fecha y hora
- Serie de formato. Especifica el formato de una columna que representa una indicación de fecha y hora como una serie. El formato combina el formato de series de fecha y series de hora.
Lectura de un archivo completo como una sola columna de salida
Puede establecer las propiedades de formato del conector de archivo secuencial para generar el contenido de un archivo completo en forma de una columna de datos. Por ejemplo, en lugar de que el conector de archivo secuencial analice las columnas y filas de un archivo CSV, lee la totalidad del archivo como una serie VARCHAR larga. Esta característica es útil si desea alimentar un archivo XML completo como un único registro a la etapa Jerárquica para su proceso.
- Abra el panel de propiedades para el conector de archivo secuencial que se encuentra en el flujo de DataStage .
- Pulse la pestaña Salida y, a continuación, abra la sección Formato de las propiedades.
- Seleccione el recuadro de selección Leer todo el archivo como una columnay, a continuación, guarde los cambios.