Cada origen de datos o activo debe correlacionarse y publicarse en el modelo de datos antes de que se pueda utilizar en funciones de IBM Match 360 como, por ejemplo, la coincidencia.
- Permisos necesarios
- Para añadir, correlacionar y publicar activos de datos en una instancia de datos maestros, debe ser miembro del grupo de usuarios DataEngineer para el servicio IBM Match 360 .
- Si está trabajando con un catálogo gobernado, sólo puede ver o añadir activos de catálogo de los que es propietario del activo de datos.
IBM Match 360 incluye una potente prestación de correlación automática que elimina la necesidad de que los ingenieros de datos correlacionen manualmente cada columna de datos en el modelo. La característica de correlación automática detecta, analiza y clasifica cada columna de datos con los atributos o campos correspondientes del modelo de datos. Para poder ejecutar la correlación automática, debe crear un perfil de sus datos. La creación de perfiles analiza y clasifica los datos para que se pueda llevar a cabo el proceso de correlación automática.
El perfilado y la correlación automática solo están soportados en los tipos de registro de persona y organización. Para otros tipos de registros, correlacione manualmente las columnas con el modelo de datos.
Contenido de este tema:
- Adición de datos de registro desde un archivo de datos sin formato
- Añadir datos u orígenes mediante el proyecto
- Correlacionar los datos en el modelo de datos
- Aplicar un patrón de correlación a un activo de datos
- Adición de datos de relación desde un archivo de datos sin formato
- Publicación de datos de ejemplo
Adición de datos de registro desde un archivo de datos sin formato
Para añadir datos de registro a IBM Match 360 desde un archivo de datos CSV o TSV:
En el menú de navegación Datos maestros, haga clic en el icono Activos ' .
En la barra de acciones, haga clic en Añadir datos o en el icono Cargar activo al proyecto ' .
En el panel Datos que se abre, seleccione si desea añadir datos cargándolos desde el proyecto o desde el catálogo. Para cargar un archivo de datos, seleccione Carga.
En la máquina local, seleccione un archivo de datos sin formato, en formato CSV o TSV, y arrástrelo al panel Datos. Cuando finaliza la carga del archivo, este se añade a la lista de resumen de activos.
En la pestaña Activos, utilice la tabla resumen de activos para revisar los detalles de su activo recién añadido y de los demás activos de datos del sistema.
Si su activo no tiene ninguna información en la columna Contenido del activo, debe definir el tipo de datos que contiene el activo, como un tipo de registro específico. Es importante asignar el tipo de contenido correcto a cada activo para que IBM Match 360 pueda encontrar la parte del modelo de datos que mejor se ajuste a los datos. Los activos que no tienen un tipo de contenido de activo definido tienen un estado Tipo de datos de activo ausente. No se puede asignar un activo sin definir primero su tipo de contenido.
Para definir el tipo de contenido de un activo, selecciónelo en la lista desplegable de la columna Contenido del activo del registro. El estado del activo cambia a Listo para mapear.
Si un tipo de datos apropiado no se encuentra en la lista de contenido de activos, es posible que tenga que personalizar su modelo de datos. Para obtener más información, consulte Personalización del modelo de datos.
Paso siguiente: Correlacione los datos en el modelo de datos
Añadir datos u orígenes mediante el proyecto
Puede añadir activos de datos, orígenes o conexiones a IBM Match 360 a través del proyecto.
Puede utilizar IBM Match 360 como origen o destino de datos conectado. Para obtener información sobre cómo configurar y utilizar la conexión IBM Match 360 , consulte ConexiónIBM Match 360.
Los archivos de activos de datos que desee cargar en IBM Match 360 deben incluir una extensión de archivo de un tipo soportado, como .csv
o .tsv
. Este requisito incluye activos que ya están en el proyecto. Si un nombre de activo del proyecto no incluye una extensión de archivo soportada, aparecerá en gris cuando intente añadirlo. Para editar el nombre de un activo en el proyecto, vaya a la pestaña Activos del proyecto, seleccione el activo y, a continuación, edite el nombre en el panel Acerca de este activo .
Vea este vídeo para saber cómo crear una conexión y añadir datos conectados a un proyecto.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Transcripción de vídeo Hora Transcripción 00:00 Este vídeo muestra cómo configurar una conexión a una fuente de datos y añadir datos conectados a un proyecto. 00:08 Si tiene datos almacenados en un origen de datos, puede configurar una conexión con ese origen de datos desde cualquier proyecto. 00:16 Desde aquí, puede añadir diferentes elementos al proyecto. 00:20 En este caso, desea añadir una conexión. 00:24 Puede crear una nueva conexión a un servicio de IBM , como por ejemplo IBM Db2 y Cloud Object Storage, o a un servicio de terceros, como Amazon, Microsoft o Apache. 00:39 Y puede filtrar la lista basándose en servicios compatibles. 00:45 También puede añadir una conexión que se ha creado a nivel de plataforma, que se puede utilizar entre proyectos y catálogos. 00:54 O bien, puede crear una conexión con uno de los servicios de IBM Cloud suministrados. 00:59 En este caso, seleccione el servicio IBM Cloud suministrado para Db2 Warehouse on Cloud. 01:08 Si las credenciales no se han rellenado previamente, puede obtener las credenciales de la instancia de la página de inicio del servicio de IBM Cloud. 01:17 En primer lugar, pruebe la conexión y, a continuación, cree la conexión. 01:25 La nueva conexión ahora se muestra en la lista de activos de datos. 01:30 A continuación, añada activos de datos conectados a este proyecto. 01:37 Seleccione el origen; en este caso, es la conexión de Db2 Warehouse on Cloud que acaba de crear. 01:43 Luego seleccione el esquema y la tabla. 01:50 Puede ver que esto añadirá una referencia a los datos de esta conexión e incluirá la referencia en el proyecto de destino. 01:58 Proporcione un nombre y una descripción y pulse "Crear". 00:06 Los datos ahora se muestran en la lista de activos de datos. 02:09 Abra el conjunto de datos para obtener una vista previa; y desde aquí puede pasar directamente a refinar los datos. 02:17 Busque más vídeos en la documentación de Cloud Pak for Data as a Service.
Para obtener más información sobre cómo añadir datos directamente al proyecto, consulte Adición de datos a un proyecto.
Después de añadir datos, debe correlacionarlos con el modelo de datos IBM Match 360 . Para obtener detalles, consulte Correlacionar los datos con el modelo de datos.
Correlacionar los datos en el modelo de datos
Para poder publicar un activo de datos que se utilizará en IBM Match 360, debe correlacionarlo. Cada una de las columnas de un activo debe asignarse a un atributo correspondiente del modelo de datos o excluirse.
Para correlacionar un activo de datos, tiene varias opciones:
- Puede correlacionar manualmente cada columna.
- Puede asignar cada columna con la ayuda de la creación de perfiles y la asignación automática.
- Puede aplicar un patrón de correlación.
Recuerde: Para utilizar las funciones de creación de perfiles y asignación automática de IBM Match 360, su implementación de IBM Cloud Pak for Data debe incluir IBM Knowledge Catalog.
Para más detalles sobre la asignación manual o automática, lea el siguiente procedimiento. Para obtener detalles sobre cómo aplicar un patrón de correlación, consulte Aplicación de un patrón de correlación a un activo de datos.
Para correlacionar un activo de datos en el modelo de datos IBM Match 360 :
En la pantalla de resumen de Activos, haga clic en la pestaña Asignación.
En la lista Activo, pulse el activo de datos que desea correlacionar con el sistema.
Para ayudarle a encontrar el activo que busca, puede buscar por nombre de activo o filtrar en función del número de columnas, el tipo de registro, el estado de asignación, el estado de publicación o los patrones de asignación disponibles. Haga clic en el icono Filtro ' ' para aplicar un filtro.
Los datos del activo que seleccione se muestran en formato tabular con un número de filas y columnas. Cada columna representa un atributo que se debe correlacionar con un tipo de atributo correspondiente en el modelo de datos. Cuando abre por primera vez un origen de datos o un activo, cada columna se marca con una etiqueta No correlacionado.
Sugerencia: puede correlacionar manualmente cada columna si lo desea, pero puede acelerar enormemente el proceso de correlación aprovechando la característica de correlación automática.En el panel de detalles cartográficos, revise las estadísticas cartográficas de este activo. De un vistazo, puede ver cuántas columnas de datos de este activo se han asignado, si las hay.
Para habilitar la correlación automática de este origen o activo, en primer lugar debe crear perfiles de los datos. Haz clic en Datos de perfil.
La creación de perfiles analiza y clasifica los datos para que se pueda llevar a cabo el proceso de correlación automática. La creación de perfiles puede tardar un tiempo tiempo en completarse, por lo que se ejecuta en segundo plano para que pueda continuar trabajando. Es posible que desee comenzar a revisar y correlacionar manualmente algunas columnas.
La correlación automática nunca sobrescribirá ninguna correlación manual que haya realizado.
Cuando finalice la creación de perfiles, haga clic en Automap asset. IBM Match 360 with Watson analiza sus datos y correlaciona automáticamente tantas columnas como sea posible en el modelo de datos. Incluso si no puede correlacionar una columna determinada, la función de correlación automática puede sugerir algunas de las selecciones de correlación más probables.
Revise los resultados de la correlación automática. Si alguna de las correlaciones es incorrecta o si una columna continúa sin estar correlacionada, correlaciónela de forma manual correctamente. Alternativamente, si una columna específica no es necesaria, puede excluirla para que no se cargue en IBM Match 360 seleccionando Excluir columna.
Para correlacionar manualmente una columna, selecciónela y, a continuación, utilice el panel Destinos de correlación para buscar y seleccionar el atributo o campo adecuado del modelo de datos. Haga clic en Correlacionar y guardar en modelo de datos.
Si no existe un atributo o campo adecuado en el modelo de datos, puede crear uno desde el panel Destinos de correlación. Haga clic en Nuevo > Crear atributo o Nuevo > Crear campo para definir y proporcionar los detalles de un nuevo atributo o campo.
Si elige crear un Atributo simple en lugar de asignar un tipo de atributo existente, el nuevo atributo simple se añade directamente al tipo de registro en la pestaña Modelado . No está categorizado bajo Tipos de atributo.
Desplácese horizontalmente por las columnas para asegurarse de que cada columna del origen o del activo de datos esté correlacionada. Si ninguna de las columnas se ha correlacionado, se ha correlacionado automáticamente ni se ha excluido explícitamente de la correlación, el activo de datos permanece en un estado Correlación en curso.
Para excluir una columna de la carga en IBM Match 360, seleccione la columna y, a continuación, Excluir columna.
Importante: Si el atributo
record_source
se correlaciona con cualquier campo del activo, dicho campo debe rellenarse en todos los registros del activo. Si a algún registro le falta un valor para el camporecord_source
, el activo no se puede cargar correctamente. Si no correlaciona el atributorecord_source
con un campo existente, se obtiene un nombre de origen de registro predeterminado utilizando el nombre de activo.Cuando termine de correlacionar el activo de datos, estará preparado para publicar los datos en el sistema.
- Si su modelo de datos es nuevo o ha cambiado, publique primero su modelo haciendo clic en el icono de publicar modelo ' de la barra de acciones. Espere a que se complete el trabajo de publicación.
- Para publicar sus datos, haga clic en el icono de publicación de datos ' de la barra de acciones. Espere a que se complete el trabajo de publicación.
Vuelva a la página de visión general de configuración seleccionando Visión general de configuración en el menú de navegación.
En la página de visión general de la configuración, confirme que tiene al menos un origen de datos o un activo que se ha añadido y correlacionado.
Aplicación de un patrón de correlación a un activo de datos
Los patrones de correlación le ayudan a mantener la coherencia entre activos de datos similares facilitando la repetición de las selecciones de correlación de datos para activos compatibles.
Se crea automáticamente un patrón de correlación cuando se correlaciona manualmente un activo de datos. El patrón guarda las selecciones de correlación de columnas para que puedan ser reutilizadas por otros activos de datos que comparten el mismo formato de columna y tipo de registro. Al aplicar un patrón de correlación, puede evitar correlacionar manualmente los activos de datos que son similares a los activos existentes que ya ha correlacionado.
IBM Match 360 identifica cuándo un nuevo activo es compatible con un patrón de correlación existente en el sistema y, a continuación, le notifica que puede utilizar un patrón para evitar el trabajo de correlación manual.
Los patrones de correlación se pueden crear correlacionando manualmente activos de datos o se pueden importar utilizando instantáneas de configuración.
Para obtener información sobre cómo gestionar y aplicar patrones de correlación utilizando instantáneas de configuración, consulte Guardar y cargar instantáneas de configuración.
Para aplicar un patrón de correlación a un activo de datos correlacionado o no correlacionado:
En la pantalla de resumen de Activos, haga clic en la pestaña Asignación.
En la lista Activo, localice uno o más activos de datos a los que desea aplicar un patrón de correlación.
Para ayudarle a encontrar los activos que busca, puede buscar por nombre o filtrar en función del número de columnas, el tipo de registro, el estado de asignación, el estado de publicación o los patrones de asignación disponibles. Haga clic en el icono Filtro ' ' para aplicar un filtro.
Seleccione los activos de datos a los que desea aplicar un patrón de correlación.
- Para aplicar un patrón de asignación a un único activo de datos, haga clic en el icono " Aplicar patrón de asignación " " " situado junto al nombre del activo.
- Para aplicar un patrón de correlación a uno o más activos de datos, seleccione el recuadro de selección situado junto al nombre del activo y, a continuación, pulse Aplicar correlación en la lista Activos. Los activos de datos seleccionados deben compartir la misma estructura y el mismo formato de columna para poder compartir un patrón de correlación.
La página Aplicar patrones de correlación muestra una lista de patrones de correlación disponibles. Si existe un patrón de coincidencia recomendado para este activo, tiene un icono de insignia ' ' junto a él.
Revise los patrones de correlación. Puede ver a qué otros activos se aplica actualmente el patrón de correlación, junto con el tipo de registro aplicable, la fecha de última actualización y el origen original.
Para obtener más detalles y comparar patrones de correlación entre sí, seleccione un patrón de correlación primario y, a continuación, pulse Comparar patrones de correlación. Desplácese horizontalmente por los patrones para compararlos con el que ha seleccionado. Desplácese verticalmente por la página para ver más detalles como, por ejemplo, detalles de instantánea y correlaciones de columnas.
Seleccione el patrón de correlación que desea aplicar a los activos de datos seleccionados y, a continuación, pulse Siguiente.
Revise los cambios de correlación que ha seleccionado. Confirme que ha elegido los activos correctos y el patrón de correlación.
La aplicación de un patrón de correlación puede cambiar el tipo de registro de un activo. Tenga cuidado de no cambiar erróneamente el tipo de registro. Los cambios de correlación realizados al aplicar un patrón de correlación no se pueden deshacer sin volver a correlacionar manualmente el activo.
Pulse Finalizar para aplicar el patrón de correlación.
Después de aplicar el patrón de correlación, está preparado para publicar los datos en el sistema.
- Si su modelo de datos es nuevo o ha cambiado, publique primero su modelo haciendo clic en el icono de publicar modelo ' de la barra de acciones. Espere a que se complete el trabajo de publicación.
- Para publicar sus datos, haga clic en el icono de publicación de datos ' de la barra de acciones. Espere a que se complete el trabajo de publicación.
Adición de datos de relación desde un archivo de datos sin formato
Para poder cargar un activo de datos de relación en IBM Match 360, primero debe definir el tipo de relación correspondiente en el modelo de datos. Para obtener detalles, consulte Personalización del modelo de datos.
Los activos de datos de relación se formatean en filas delimitadas (CSV o TSV). Hay varias columnas de datos necesarias:
- ID de registro para ambas partes en cada relación
- Tipos de registro para ambas partes en cada relación
- Orígenes de registro para ambas partes en cada relación
Puede crear el activo de datos de relación manualmente, a través de un proceso ETL, o utilizando la aplicación donde se almacenan las relaciones.
Para añadir datos de relación a IBM Match 360 desde un archivo de datos CSV o TSV:
En el menú de navegación Datos maestros, haga clic en el icono Activos ' .
Cargue, correlacione y publique los activos de datos de registro en IBM Match 360. Estos activos de datos deben contener los datos de registro que desea asociar utilizando relaciones. Para obtener detalles, consulte Adición de datos de registro desde un archivo de datos sin formato y Correlación de los datos en el modelo de datos.
Cargue el archivo de activo de datos de relación:
a. En la barra de acciones, haga clic en Añadir datos o en el icono Cargar activo al proyecto ' .
b. En el panel Datos que se abre, seleccione si desea añadir datos cargándolos desde el proyecto o desde el catálogo. Para cargar un archivo de datos, seleccione Carga.
Nota: Si los datos incluyen catálogos gobernados, es posible que no pueda ver o añadir algunos activos de catálogo. En función de sus permisos, es posible que solo pueda ver los activos de catálogo que posee o gestiona.c. En el sistema local, seleccione un archivo de datos sin formato que contenga datos de relación en formato CSV o TSV y arrástrelo al panel Datos. Cuando finaliza la carga del archivo, este se añade a la lista de resumen de activos.
Revise los detalles del activo de relaciones recién añadido.
Pase el cursor por encima de la fila del activo de relaciones en la lista de resumen de activos y pulse el menú de desbordamiento de tres puntos.
Haga clic en Establecer propiedades de activos.
Seleccione Relaciones en la lista Categoría de datos de activo .
Seleccione el tipo de relación correcto en la lista Tipo de datos de activo y pulse Guardar.
Si el tipo de relación adecuado no está en la lista de tipos de datos de activo, es posible que tenga que personalizar el modelo de datos. Para obtener más información, consulte Personalización del modelo de datos.
Correlacione y publique el activo de datos de relación. Para obtener detalles, consulte Correlación de los datos en el modelo de datos. Asegúrese de correlacionar cada una de las columnas de datos necesarias:
from record ID
,to record ID
,from record type
,to record type
,from record source
yto record source
.Restricción: Los datos de relación no dan soporte a la creación de perfiles ni a la correlación automática. Correlacione manualmente las columnas con el modelo de datos.
Publicación de datos de ejemplo
Si no tiene sus activos de datos preparados pero desea comenzar a utilizar el servicio de IBM Match 360 en su lugar, cargue los datos de ejemplo y el modelo que se proporcionan.
Para cargar los datos de ejemplo de IBM Match 360:
- Vaya a la página de inicio de datos maestros.
- En el mosaico Datos maestros, pulse Publicar modelo de ejemplo.
- Una vez completada la publicación del modelo de ejemplo, pulse Publicar datos de ejemplo.
- Opcionalmente, vaya a la página Trabajos para ver el progreso de sus trabajos de carga de muestras. Si no desea ver el progreso, puede ir a otra pantalla y los trabajos seguirán trabajando en segundo plano.
Próximos pasos
Más información
- Guardar y cargar instantáneas de configuración
- Trabajar con datos gobernados en IBM Match 360
- Guía de aprendizaje deMaster Data Management : Configurar una vista de 360 grados
Tema principal: Configuración de datos maestros