Google BigQuery configuración del linaje
Para importar metadatos de linaje desde Google BigQuery, cree una conexión, una definición de fuente de datos y un trabajo de importación de metadatos.
Para importar metadatos de linaje para Google BigQuery, siga estos pasos:
- Cree una definición de fuente de datos.
- Crear una conexión con la fuente de datos en un proyecto.
- Crear una importación de metadatos.
Creación de una definición de fuente de datos
Cree una definición de fuente de datos. Seleccione Google BigQuery como tipo de fuente de datos.
Crear una conexión con Google BigQuery
Crear una conexión con la fuente de datos en un proyecto. Para más detalles sobre la conexión, consulte Google BigQuery connection.
Creación de una importación de metadatos
Crear una importación de metadatos. Más información sobre las opciones específicas de la fuente de datos Google BigQuery :
Listas de inclusión y exclusión
Puede incluir o excluir activos hasta el nivel de conjunto de datos. Proporcione los proyectos y los conjuntos de datos en el formato proyecto/conjunto de datos. Cada parte se evalúa como una expresión regular. Los activos que se añadan posteriormente en la fuente de datos también se incluirán o excluirán si cumplen las condiciones especificadas en las listas. Valores de ejemplo:
myProject/
: todos los conjuntos de datos enmyProject
,myProject2/.*
: todos los conjuntos de datos enmyProject2
,myProject3/myDataset1
:myDataset1
demyProject3
,myProject4/myDataset[1-5]
: cualquier conjunto de datos de mimyProject4
cuyo nombre empiece pormyDataset
y termine con un dígito entre 1 y 5
Entradas externas
Si utiliza Google BigQuery SQL externo o scripts de trabajo, puede añadirlos en un archivo.zip como entrada externa. Puede organizar la estructura de un archivo .zip como subcarpetas que representen proyectos y conjuntos de datos. Una vez analizados los scripts, se añaden a los proyectos correspondientes del catálogo o proyecto seleccionado. El archivo.zip puede tener la siguiente estructura:
<project_id>
<dataset_name>
<script_name.sql>
<project_id>
<script_name.sql>
jobs
<job_name.json>
<script_name.sql>
replace.csv
connectionsConfiguration.prm
El archivo replace.csv
contiene sustituciones de marcadores de posición para las secuencias de comandos que se añaden en el archivo.zip. Para obtener más información sobre el formato, consulte Sustitución de marcadores de posición.
El archivo connectionsConfiguration.prm
contiene las definiciones de los recursos de conexión a la base de datos utilizados en las consultas federadas. El fichero puede tener la siguiente estructura:
[{Shortcut_Name}] Type={connection_type}
Connection_String={connection_string}
Server_Name={server_name}
Database_Name={database_name}
Schema_Name={schema_name}
User_Name={user_name}
Más información
Tema principal: Conectores compatibles para la importación de linajes