Esecuzione dei lavori di mascheramento del flusso
Ultimo aggiornamento: 28 gen 2025
Nei lavori di mascheramento del flusso, gli utenti di dati definiscono la destinazione per le copie di dati mascherati. I lavori possono essere pianificati e, al completamento di un lavoro riuscito, è possibile visualizzare il riepilogo del report del lavoro.
Esistono due modi per creare lavori di mascheramento del flusso:
- Dopo aver creato un flusso di mascheramento, fare clic su Configura lavoro.
- Fare clic sul menu Opzioni su un singolo asset di dati per ignorare la creazione di un flusso di mascheramento e configurare un job di mascheramento direttamente per tale asset di dati.
Nota: durante un lavoro di flusso di mascheramento, potrebbero verificarsi errori quando la memoria non è sufficiente per supportare il lavoro. Per evitare errori, la dimensione massima dei dati non può essere superiore a 12GBs.
Creazione di un ambiente di flusso di mascheratura
Autorizzazioni richieste
Per creare un modello di ambiente, entrambe le condizioni seguenti devono essere vere:
- È necessario avere il ruolo di amministratore o di redattore nel progetto.
- È necessario appartenere all'account IBM Cloud del creatore del progetto.
Per creare un modello di ambiente per il vostro progetto:
- Dal progetto, fare clic sulla scheda Gestione e quindi sulla pagina Ambienti.
- Dalla pagina Ambienti, fare clic sulla scheda Modelli e poi su Nuovo modello.
- Definire i dettagli dell'ambiente inserendo un nome e una descrizione (opzionale).
- In Tipo, fare clic su Spark.
- In Configurazione hardware, specificare la configurazione del driver e dell'esecutore in base alle dimensioni della tabella nel lavoro di flusso di mascheramento.
- In Numero di esecutori, aumentare il numero di esecutori per migliorare le prestazioni del flusso di mascheramento quando i lavori sono configurati per essere eseguiti con partizioni. Per ulteriori informazioni, consultare la sezione Buone pratiche dell'argomento Gestione delle prestazioni lavorative.
- Dall'elenco delle versioni del software, selezionare Masking Flow Spark.
- Fare clic su Crea.
Gestione dei lavori
Per configurare un lavoro:
- Immettere il nome del lavoro e aggiungere una descrizione facoltativa del lavoro.
- Aggiungere la connessione di destinazione in cui si desidera inserire la copia dei dati mascherati. La connessione di origine viene utilizzata per leggere i dati.
- Fare clic su + per aggiungere una nuova connessione. Lo schema associa la tabella di origine alla tabella di destinazione. Le definizioni di tabella devono essere già configurate nello schema di destinazione.
Suggerimento : quando l'asset di origine è Apache Hive, utilizzare Apache HDFS come connessione di destinazione.
- (Opzionale) Dalla pagina Partizione, è possibile modificare i dettagli della partizione per l'asset:
- Se si creano flussi di mascheratura con Imposta campionamento, si può tranquillamente ignorare la modifica della pagina Partizione impostando la voce Modifica dettagli partizione su Off.
- Se si dispone di tabelle con grandi quantità di dati, si consiglia di modificare i dettagli della partizione specificando una colonna come colonna della partizione. Per migliorare le prestazioni del lavoro, è possibile aumentare il numero di partizioni. Per ulteriori informazioni, consultare la sezione Buone pratiche dell'argomento Gestione delle prestazioni lavorative.
- (Facoltativo) Pianificare un lavoro o pianificare un lavoro ricorrente.
- Esaminare ed eseguire il lavoro.
Ulteriori informazioni
- Creazione e gestione di lavori
- Creazione di flussi di mascheramento
- Gestione delle prestazioni del lavoro
- Data masking avanzato
Argomento principale: Flusso di mascheramento dei dati con mascheramento
L'argomento è stato utile?
0/1000