Impostazioni del progetto per la qualità dei dati

Ultimo aggiornamento: 05 apr 2025
Impostazioni del progetto per la qualità dei dati

Per un'impostazione coerente delle regole di qualità dei dati, è possibile configurare impostazioni predefinite che possono essere applicate a qualsiasi regola di qualità dei dati nel progetto.

Autorizzazioni richieste
Per configurare le impostazioni predefinite della qualità dei dati, è necessario avere il ruolo di amministratore nel progetto. Qualsiasi collaboratore del progetto può visualizzare le impostazioni.

Per accedere alle impostazioni predefinite, accedere alla pagina Gestione del progetto e selezionare Strumenti > Qualità dei dati.

Tabelle di output

Per un'impostazione coerente delle tabelle di output per le regole di qualità dei dati, è possibile definire una configurazione predefinita.

Tipo e posizione dell'output

Definire una nuova tabella di output o selezionare una tabella esistente in cui scrivere l'output della regola. Per i tipi di database supportati, vedere Sorgenti di dati supportate per la cura e la qualità dei dati.

Quando si definisce una nuova tabella, il nome della tabella può essere un nome definito dall'utente, un parametro per la creazione dinamica di un nome, una combinazione di nome e parametro definiti dall'utente o una combinazione di parametri.

I nomi delle tabelle definiti dall'utente devono seguire questa convenzione:

  • Il primo carattere del nome deve essere un carattere alfabetico.
  • Il resto del nome può essere composto da caratteri alfabetici, numerici o caratteri di sottolineatura.
  • Il nome non deve contenere spazi.

Per la creazione di nomi dinamici, è possibile utilizzare questi parametri:

  • #execution_id#
  • #rule_id#
  • #rule_id#
  • #rule_name#
  • #project_id#
  • #job_id#
  • #job_run_id#
  • #rule_id#

Per i parametri con valori variabili, potrebbe essere creata una nuova tabella:

  • Per #job_run_id# per ogni regola eseguire
  • Per #execution_id# se la regola viene eseguita dall'interfaccia utente delle regole di qualità dei dati o tramite chiamata API

Inoltre, è possibile selezionare queste opzioni:

  • Crea tabella solo quando vengono trovati problemi

    Questa opzione evita che vengano create tabelle vuote nei casi in cui una regola non produce record di output. Tuttavia, se una tabella con quel nome esiste già perché è stata generata per un'esecuzione precedente della regola, la tabella rimane invariata.

  • Importa la tabella di output generata come asset di progetto

    Per facilitare l'accesso all'output delle regole, aggiungere al progetto nuove tabelle di output delle regole come risorse di dati. Invece di eseguire una query del database, è possibile visualizzare i dati aprendo l'asset di dati dalla pagina Assets del progetto o dalla cronologia delle esecuzioni della regola.

    Questa opzione è attivata per impostazione predefinita.

Per rendere questa configurazione disponibile per l'uso nelle regole di qualità dei dati, salvarla. La tabella configurata viene visualizzata come Corrente.

È possibile aggiornare questa configurazione in qualsiasi momento. Questi aggiornamenti vengono quindi applicati alle nuove regole e alle nuove esecuzioni di regole esistenti, configurate per ereditare le impostazioni del progetto.

Ulteriori informazioni

Argomento principale: Gestione della qualità dei dati