Ejecute un análisis de claves primarias para identificar claves primarias únicas o compuestas en los activos de datos en una base de datos relacional. Una clave primaria identifica de forma exclusiva cada registro de un activo de datos. Cada activo de datos sólo puede tener una clave primaria.
Valide las claves primarias que ya están definidas en los datos e identifique las columnas que son candidatas para las claves primarias. Una clave primaria debe ser exclusiva y no puede contener valores nulos.
Este tipo de análisis identifica las claves primarias de una sola columna para un activo de datos localizando una columna que se califica como identificador exclusivo para los datos. Para identificar una clave primaria de varias columnas o compuesta , el análisis determina qué combinaciones de columnas contienen valores exclusivos, convirtiéndolas en candidatas para claves primarias. Se evalúan los valores para diferentes combinaciones de columnas y se calcula la exclusividad de los valores concatenados. Sólo se comprueban las columnas adyacentes.
Solo se sugieren como claves primarias las columnas y combinaciones de columnas con una confianza que supere el umbral definido, ya sea en los valores de enriquecimiento o para una ejecución individual. Si ya hay una clave primaria definida en los datos, esta clave se asigna automáticamente. Esta información debe incluirse explícitamente en una importación de metadatos. Todavía puede utilizar los resultados de un análisis de clave primaria para validar las claves primarias definidas.
- Requisitos previos
- Establecimiento manual de claves primarias
- Ejecución de un análisis de claves primarias
- Comprobación de los resultados del análisis y asignación de claves
- Desasignación o eliminación de claves
- Acceso a los detalles de ejecución del trabajo
Requisitos previos
El servicio DataStage se debe desplegar para ejecutar el análisis de claves primarias.
Todas las operaciones que se ejecutan como parte de un enriquecimiento de metadatos requieren credenciales para la autorización segura. Normalmente, la clave de API de usuario se utiliza para ejecutar estas operaciones de larga ejecución sin interrupción. Si las credenciales no están disponibles cuando intenta ejecutar un análisis de clave primaria, se le solicitará que cree una clave de API. A continuación, dicha clave de API se guarda como credenciales de tarea. Consulte Gestión de la clave de API de usuario.
Si alguna de las conexiones con los orígenes de datos está bloqueada, se le solicitará que especifique sus credenciales personales. Este es un paso único que desbloquea de forma permanente las conexiones.
Puede ejecutar el análisis de claves primarias sin crear primero perfiles de activo. El análisis no se basa en información de perfil como, por ejemplo, la distribución de frecuencia de los valores de columna. En su lugar, los datos de columna se analizan directamente.
Establecimiento manual de claves primarias
Si los datos ya se han analizado con la opción Datos de perfil , puede establecer una clave primaria sin ejecutar un análisis de clave o relación, o puede cambiar una asignación. Abra la vista de columna de un activo pulsando el nombre del activo o seleccionando Ver columnas en el menú de desbordamiento.
- Para establecer una clave primaria de una sola columna, seleccione una columna y seleccione Más > Asignar como clave primaria en la barra de herramientas.
- Para establecer una clave primaria de varias columnas, seleccione las columnas que desea que constituya la clave y seleccione Más > Asignar como clave primaria compuesta en la barra de herramientas.
Cuando sustituye una clave primaria, las relaciones para la clave primaria antigua no se asignan. Debe establecer nuevas relaciones.
Ejecución de un análisis de claves primarias
Para ejecutar un análisis de clave primaria para uno o varios activos:
Abra el activo de enriquecimiento de metadatos.
En la ficha Activos , seleccione los activos según sea necesario.
Seleccione Enriquecer > Identificar claves primarias en la barra de herramientas.
De forma predeterminada, este análisis se ejecuta en una sola columna. Sin embargo, es posible que una sola columna no satisfaga los criterios de una clave primaria. En este caso, puede seleccionar ejecutar el análisis en varias columnas para crear una clave primaria compuesta. El análisis concatena los valores para diferentes combinaciones de columnas, calcula la exclusividad de los valores concatenados y, por lo tanto, determina qué combinaciones de columnas contienen valores exclusivos, convirtiéndolos en candidatos de clave primaria. Este tipo de análisis puede consumir mucho tiempo en función del tamaño de un activo de datos.
Pulse Ejecutar. Se le notificará cuando se complete el análisis, pero es posible que tenga que renovar los resultados del enriquecimiento para ver las nuevas claves primarias.
De forma predeterminada, todas las claves primarias que se identifican durante el análisis tienen un estado de candidato, lo que significa que se visualizan como claves sugeridas, a menos que los datos ya contengan claves primarias definidas. En este caso, estas columnas se asignan como claves primarias durante el análisis.
La ejecución de otro análisis de claves primarias suprime todas las claves primarias sugeridas anteriormente que no se han encontrado durante el análisis actual. Por ejemplo, la ejecución de un análisis de clave primaria de una sola columna elimina todos los candidatos de clave primaria compuesta que se identificaron en un análisis anterior.
Comprobación de los resultados del análisis y asignación de claves
Revise las claves de un activo en la pestaña Claves del panel de detalles del activo. Si los datos ya contienen una clave primaria, se muestran aquí como asignados. Además, las claves sugeridas se listan aquí. Para cambiar la clave primaria asignada, haga clic en el icono Editar .
La lista completa de claves proporciona la siguiente información:
- El nombre de una columna que se sugiere o se asigna como clave primaria o una lista de nombres de columna para una clave primaria compuesta
- El número de columnas que componen la clave primaria asignada o candidata
- El tipo de datos de la columna o columnas que componen la clave primaria asignada o candidata
- La puntuación de confianza para asignar o sugerir una clave
- El número y el porcentaje de valores distintos, exclusivos y nulos para cada clave
- El estado de la clave, que puede ser Asignado o Sugerido
- La fecha en la que se modificó por última vez la columna
Para asignar una clave primaria o sustituir la clave asignada, seleccione Asignar en el menú de desbordamiento de la clave. Si sustituye la clave primaria existente, las relaciones para la clave primaria antigua no se asignarán. A continuación, puede establecer nuevas relaciones.
Desasignación o eliminación de claves
Puede desasignar una clave asignada. En este caso, las relaciones para esta clave primaria también se desasignan y el estado de la clave se establece en sugerido. A continuación, puede asignar una nueva clave primaria y establecer las relaciones correspondientes.
También puede eliminar por completo una clave asignada o sugerida. Las relaciones para esta clave no están asignadas. Una clave eliminada puede ser sugerida o asignada de nuevo cuando vuelva a ejecutar el análisis de clave primaria.
Acceso a los detalles de ejecución del trabajo
Aunque puede acceder a los detalles de trabajo para el enriquecimiento de metadatos general desde el panel lateral, debe ir a la pestaña Trabajos del proyecto para ver los trabajos para el análisis de clave primaria. El trabajo es del tipo Análisis clave para activos de enriquecimiento de metadatos. El nombre de trabajo sigue el patrón metadata_enriquement_name (PK Detection).
Más información
Tema principal: Enriquecimiento de los activos de datos