0 / 0

Esecuzione dei lavori di mascheramento del flusso

Ultimo aggiornamento: 28 gen 2025
Esecuzione dei lavori di mascheramento del flusso

Nei lavori di mascheramento del flusso, gli utenti di dati definiscono la destinazione per le copie di dati mascherati. I lavori possono essere pianificati e, al completamento di un lavoro riuscito, è possibile visualizzare il riepilogo del report del lavoro.

Esistono due modi per creare lavori di mascheramento del flusso:

  • Dopo aver creato un flusso di mascheramento, fare clic su Configura lavoro.
  • Fare clic sul menu Opzioni su un singolo asset di dati per ignorare la creazione di un flusso di mascheramento e configurare un job di mascheramento direttamente per tale asset di dati.
Nota: durante un lavoro di flusso di mascheramento, potrebbero verificarsi errori quando la memoria non è sufficiente per supportare il lavoro. Per evitare errori, la dimensione massima dei dati non può essere superiore a 12GBs.

Creazione di un ambiente di flusso di mascheratura

Autorizzazioni richieste

Per creare un modello di ambiente, entrambe le condizioni seguenti devono essere vere:

  • È necessario avere il ruolo di amministratore o di redattore nel progetto.
  • È necessario appartenere all'account IBM Cloud del creatore del progetto.

Per creare un modello di ambiente per il vostro progetto:

  1. Dal progetto, fare clic sulla scheda Gestione e quindi sulla pagina Ambienti.
  2. Dalla pagina Ambienti, fare clic sulla scheda Modelli e poi su Nuovo modello.
  3. Definire i dettagli dell'ambiente inserendo un nome e una descrizione (opzionale).
  4. In Tipo, fare clic su Spark.
  5. In Configurazione hardware, specificare la configurazione del driver e dell'esecutore in base alle dimensioni della tabella nel lavoro di flusso di mascheramento.
  6. In Numero di esecutori, aumentare il numero di esecutori per migliorare le prestazioni del flusso di mascheramento quando i lavori sono configurati per essere eseguiti con partizioni. Per ulteriori informazioni, consultare la sezione Buone pratiche dell'argomento Gestione delle prestazioni lavorative.
  7. Dall'elenco delle versioni del software, selezionare Masking Flow Spark.
  8. Fare clic su Crea.

Gestione dei lavori

Per configurare un lavoro:

  1. Immettere il nome del lavoro e aggiungere una descrizione facoltativa del lavoro.
  2. Aggiungere la connessione di destinazione in cui si desidera inserire la copia dei dati mascherati. La connessione di origine viene utilizzata per leggere i dati.
  3. Fare clic su + per aggiungere una nuova connessione. Lo schema associa la tabella di origine alla tabella di destinazione. Le definizioni di tabella devono essere già configurate nello schema di destinazione.
Suggerimento : quando l'asset di origine è Apache Hive, utilizzare Apache HDFS come connessione di destinazione.
  1. (Opzionale) Dalla pagina Partizione, è possibile modificare i dettagli della partizione per l'asset:
    • Se si creano flussi di mascheratura con Imposta campionamento, si può tranquillamente ignorare la modifica della pagina Partizione impostando la voce Modifica dettagli partizione su Off.
    • Se si dispone di tabelle con grandi quantità di dati, si consiglia di modificare i dettagli della partizione specificando una colonna come colonna della partizione. Per migliorare le prestazioni del lavoro, è possibile aumentare il numero di partizioni. Per ulteriori informazioni, consultare la sezione Buone pratiche dell'argomento Gestione delle prestazioni lavorative.
  2. (Facoltativo) Pianificare un lavoro o pianificare un lavoro ricorrente.
  3. Esaminare ed eseguire il lavoro.

Ulteriori informazioni

Argomento principale: Flusso di mascheramento dei dati con mascheramento