Volver a la versión inglesa de la documentación
Etapa Filtro bloom en DataStage: Pestaña Etapa
Etapa del filtro de Bloom: Ficha Etapa (DataStage®)
Última actualización: 12 mar 2025
La pestaña Etapa de la etapa Filtro bloom permite controlar los distintos aspectos de la etapa Filtro bloom.
Efectúe una doble pulsación en la etapa para abrir el panel de propiedades de la etapa. La sección Propiedades permite especificar lo que hace la etapa. La sección Avanzado permite especificar cómo se ejecuta la etapa. Especifique una descripción opcional de la etapa.
Sección Propiedades
Utilice las secciones Propiedades y Opciones para definir lo que hace realmente la etapa.
- Modalidad
- Seleccione Crear o Proceso. La propiedad de método se establece en Crear de forma predeterminada.
- Crear
- Esta opción especifica que la etapa se ejecuta en modalidad de creación. Las claves del conjunto de datos de entrada se añaden a un filtro bloom y se graban en la memoria después del último registro del conjunto de datos. Esta opción se puede utilizar para crear filtros bloom a partir de datos estáticos antiguos que eventualmente se utilizarán en trabajos futuros que utilicen el filtro bloom en modalidad
-process
. - Proceso
- Esta opción especifica que la etapa se ejecutará en modalidad de proceso. Las claves del conjunto de datos de entrada se comparan con los filtros bloom que se cargan en la memoria.
- Conjunto de archivos
- Especifique la vía de acceso y el nombre del conjunto de archivos que se utiliza para almacenar la información del filtro bloom.
- Tamaño
- Especifique el número de entradas exclusivas que espera insertar en el filtro bloom. Sobrestime el número total de entradas cuando especifique el valor de esta opción.
- Editar
- Pulse Editar para especificar una clave. Esta opción especifica la clave que se debe utilizar para la búsqueda con la opción
-create
o-process
. Se necesita al menos un-key
. - Propiedades adicionales (Crear)
- Fecha: esta opción especifica la serie de fecha en el formato yyyy-mm-dd con la que está asociado el conjunto de datos de entrada. Este número se añade al nombre de archivo del filtro bloom asociado que se utiliza para descartar filtros más antiguos. Si no especifica esta opción en la modalidad de creación, la opción
-previous_days
no se puede utilizar en la modalidad de proceso. - Fases: esta opción especifica el número de índices hash que generará cada grupo de claves. Un mayor número de fases reduce el porcentaje de falsos positivos, pero aumenta los requisitos de memoria. El número de fases que utilice debe coincidir con el número de fases que se utiliza para crear filtros estáticos.
- Truncar: esta opción trunca el conjunto de archivos.
- Fecha: esta opción especifica la serie de fecha en el formato yyyy-mm-dd con la que está asociado el conjunto de datos de entrada. Este número se añade al nombre de archivo del filtro bloom asociado que se utiliza para descartar filtros más antiguos. Si no especifica esta opción en la modalidad de creación, la opción
- Propiedades adicionales (Proceso)
- Fecha: esta opción especifica la serie de fecha en el formato yyyy-mm-dd con la que está asociado el conjunto de datos de entrada. Este número se añade al nombre de archivo del filtro bloom asociado que se utiliza para descartar filtros más antiguos. Si no especifica esta opción en la modalidad de creación, la opción -previous_days no se puede utilizar en la modalidad de proceso.
- Descartar antigua: esta opción especifica que los filtros bloom más antiguos que el recuento de -previous_days se eliminarán del conjunto de archivos.
- Distintivo duplicado: esta opción especifica que desea marcar los duplicados cuando ejecuta la etapa.
- Fases: esta opción especifica el número de índices hash que generará cada grupo de claves. Un mayor número de fases reduce el porcentaje de falsos positivos, pero aumenta los requisitos de memoria. El número de fases que utilice debe coincidir con el número de fases que se utiliza para crear filtros estáticos.
- Días anteriores: esta opción especifica el número de días de filtros bloom antiguos que se utilizan para la búsqueda. Si no se especifica, se utilizarán todos los filtros existentes.
- Fecha de referencia: esta opción es la fecha de referencia para la opción -previous_days. Especifique esta variable en formato yyyy-mm-dd.
- Truncar: esta opción trunca el conjunto de archivos.
Propiedades avanzadas
La sección de propiedades avanzadas permite especificar las siguientes opciones:- Modalidad de ejecución. La etapa se puede ejecutar en modalidad paralela o en modalidad secuencial. En modalidad paralela, el conjunto de datos de entrada se procesa en los nodos disponibles, tal como se especifica en el archivo de configuración, y según las restricciones de nodo especificadas en la sección Avanzado. En la modalidad secuencial, el nodo conductor procesa el conjunto de datos completo.
- Modalidad de combinabilidad. Es Automática de forma predeterminada, lo que permite a IBM DataStage combinar los operadores que subyacen en las etapas paralelas para que se ejecuten en el mismo proceso si es sensible a este tipo de etapa.
- Conservar particionamiento. Es Establecer de forma predeterminada. Puede seleccionar Establecer o Borrar. Si selecciona Establecer, la etapa solicitará que la siguiente etapa del trabajo intente mantener el particionamiento.
¿Fue útil el tema?
0/1000