Ejecución de trabajos de flujo de enmascaramiento

Última actualización: 28 ene 2025
Ejecución de trabajos de flujo de enmascaramiento

Al enmascarar trabajos de flujo, los usuarios de datos definen el destino de destino para las copias de datos enmascaradas. Se pueden planificar trabajos y al finalizar un trabajo satisfactorio, puede ver el resumen del informe de trabajo.

Hay dos formas de crear trabajos de enmascaramiento de flujo:

  • Después de crear un flujo de enmascaramiento, pulse Configurar trabajo.
  • Pulse el menú Opciones de un activo de datos individual para omitir la creación de un flujo de enmascaramiento y para configurar un trabajo de enmascaramiento directamente para ese activo de datos.
Nota: durante un trabajo de flujo de enmascaramiento, se pueden producir errores cuando no hay suficiente memoria para dar soporte al trabajo. Para evitar errores, el tamaño máximo de los datos no puede ser mayor que 12 GBs.

Creación de un entorno de flujo de enmascaramiento

Permisos necesarios

Para crear una plantilla de entorno, deben cumplirse las dos condiciones siguientes:

  • Debe tener el rol de Admin o Editor en el proyecto.
  • Debe pertenecer a la cuenta IBM Cloud del creador del proyecto.

Para crear una plantilla de entorno para su proyecto:

  1. En su proyecto, haga clic en la pestaña Gestionar y, a continuación, en la página Entornos.
  2. En la página Entornos, haga clic en la pestaña Plantillas y, a continuación, en Nueva plantilla.
  3. Defina los detalles del entorno introduciendo un nombre y una descripción (opcional).
  4. En Tipo, haga clic en Chispa.
  5. En Configuración de hardware, especifique la configuración del controlador y del ejecutor en función del tamaño de la tabla del trabajo de flujo de enmascaramiento.
  6. En Número de ejecutores, aumente el número de ejecutores para mejorar el rendimiento del flujo de enmascaramiento cuando los trabajos estén configurados para ejecutarse con particiones. Para obtener más información, consulte la sección Prácticas recomendadas del tema Gestión del rendimiento laboral.
  7. En la lista Versión de software, seleccione Enmascarar flujo Spark.
  8. Pulse Crear.

Cómo trabajar con trabajos

Para configurar un trabajo:

  1. Especifique el nombre del trabajo y añada una descripción opcional del trabajo.
  2. Añada la conexión de destino en la que desea insertar una copia de datos enmascarada. La conexión de origen se utiliza para leer datos.
  3. Pulse + para añadir una nueva conexión. El esquema correlaciona la tabla fuente con la tabla de destino. Las definiciones de tabla ya deben estar configuradas en el esquema de destino.
Sugerencia: Cuando el activo de origen es Apache Hive, utilice Apache HDFS como conexión de destino.
  1. (Opcional) Desde la página Partición, puede editar opcionalmente los detalles de la partición para el activo:
    • Si crea flujos de enmascaramiento con Establecer muestreo, puede ignorar con seguridad la edición de la página Partición estableciendo la opción Editar detalles de partición en Desactivado.
    • Si tiene tablas con grandes cantidades de datos, considere editar los detalles de la partición especificando una columna como columna de partición. Para mejorar el rendimiento del trabajo, puede aumentar el número de particiones. Para obtener más información, consulte la sección Prácticas recomendadas del tema Gestión del rendimiento laboral.
  2. (Opcional) Planificar un trabajo o planificar un trabajo recurrente.
  3. Revise y ejecute el trabajo.

Más información

Tema padre: Enmascaramiento de datos con flujo de enmascaramiento