0 / 0
Volver a la versión inglesa de la documentación
Conceptos de datos en IBM Match 360
Última actualización: 26 nov 2024
Conceptos de datos en IBM Match 360

IBM Match 360 crea entidades de datos maestros ejecutando un algoritmo de coincidencia en registros proporcionados por uno o varios activos de datos. Las entidades y registros se definen y componen basándose en el modelo de datos personalizable de IBM Match 360 .

Contenido de este tema:

Registros y entidades

Cada entidad es un objeto de datos maestros que proporciona una vista de 360 grados de una persona, organización u otra entidad. Uno o más registros de datos pueden contribuir a una sola entidad.

  • Un registro es un conjunto de información demográfica que representa un único punto de vista de una persona u organización, tomado de un único origen de datos. Si la misma persona u organización aparece en varios orígenes de datos, el algoritmo de comparación enlazará cada uno de los registros juntos como una sola entidad. Los registros están formados por atributos y valores de campo que describen la persona u organización.

  • Una entidad de datos maestros es una composición de registros que IBM Match 360 determina que coinciden. El modelo de datos puede definir dos categorías de entidad: identidad o asociación. Cada entidad incluye uno o varios registros de miembro que el algoritmo de coincidencia ha enlazado. IBM Match 360 determina de forma inteligente el conjunto más probable de atributos y valores de campo que describen correctamente la entidad representada, y los muestra en la vista del área de trabajo de datos maestros.

Uno o varios registros de miembro pueden contribuir a una vista de entidad. Los registros de miembro que forman una entidad pueden cambiar si el algoritmo coincidente se vuelve a ejecutar con valores diferentes, como por ejemplo con un umbral de enlace automático diferente o un conjunto diferente de selecciones de atributos coincidentes.

Una entidad puede estar compuesta de un solo registro. Cuando esto sucede, la entidad se conoce como singleton.

Cada entidad se crea alrededor de un registro central. El registro más antiguo de una entidad se considera el registro central. Los registros de centro son la base de la entidad y no se pueden desenlazar o mover a una entidad diferente.

Cada registro que contribuye a una entidad se representa como un borde de gráfico entre los registros y la entidad, según lo determine el proceso de coincidencia. Cuando vuelva a ejecutar el algoritmo de coincidencia, se actualizarán los bordes que representan los enlaces.

Tipos de entidades

Al definir un nuevo tipo de entidad en el modelo de datos, debe decidir cuál es la finalidad de esta entidad:

  • Las entidades de identidad enlazan registros que parecen representar a la misma persona, organización u objeto del mundo real. Comparten una identidad común. Por ejemplo, una entidad de Business Partners se puede utilizar para comparar registros de organización dentro de los datos que representan la misma empresa del mundo real.

  • Las entidades Asociación enlazan registros que se deben asociar por otro motivo, como una dirección compartida, un empleador o una decisión de compra. Un ejemplo común de un tipo de entidad de asociación es una unidad familiar. Puede crear un tipo de entidad Hogares que coincida con miembros de una unidad familiar determinada en una sola entidad. Mediante el uso de entidades de mantenimiento, puede realizar un seguimiento y analizar el comportamiento y la actividad por unidad familiar.

Entidades de mantenimiento

Vea el siguiente vídeo para ver cómo utilizar entidades de asociación para identificar hogares dentro de los datos de IBM Match 360 .

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Cuando crea un tipo de entidad de asociación para ayudarle a realizar un seguimiento e identificar los registros de persona que comparten una unidad familiar, hay algunos factores importantes a tener en cuenta. El establecimiento de sus criterios de hogar es un primer paso fundamental en la gestión y formación de los hogares. Los hogares pueden definirse mediante criterios explícitos, criterios expresados o una combinación de los dos.

Los criterios explícitos pueden incluir cualquier atributo en el modelo de datos. Los siguientes son ejemplos de criterios explícitos que puede tener en cuenta en la estrategia de mantenimiento:

  • Las partes comparten la misma dirección de un tipo de dirección determinado, como por ejemplo la misma dirección inicial.
  • Las partes comparten un apellido.
  • Las partes se encuentran dentro de un rango de edad definido.
  • Las partes comparten un método de contacto, como un número de teléfono particular.
  • Las partes tienen cierto tipo de relación, como una relación familiar.
  • Las partes tienen roles específicos en el contexto de un contrato. Por ejemplo, un padre puede tener un rol de representante legal para una cuenta propiedad de un hijo.

Utilice criterios explícitos para crear hogares con el algoritmo de coincidencia. Para habilitar IBM Match 360 para crear las entidades de la unidad familiar de forma algorítmica, seleccione los criterios explícitos seleccionados como atributos coincidentes para este tipo de entidad. Para obtener información sobre cómo configurar el algoritmo de coincidencia, consulte Coincidencia de datos para crear entidades de datos maestros.

Criterios expresados incluye otra información que no forma parte del modelo de datos. Los criterios expresados pueden haber sido comunicados verbalmente por un miembro de la familia o un agente. Los siguientes son ejemplos de criterios expresados que puede tener en cuenta en la estrategia de mantenimiento:

  • Las partes han comunicado que están dentro del mismo hogar.
  • Un agente ha recopilado información de unidad familiar durante la configuración inicial de una cuenta de cliente.

Para crear una entidad de unidad familiar basada en criterios expresados, debe enlazar manualmente los registros para formar una entidad. Puede crear enlaces manuales de registros utilizando el área de trabajo de datos maestros para editar las reglas de enlace de un registro. Para obtener más información, consulte Exploración de entidades y registros de datos maestros en IBM Match 360 with Watson.

Determinación de los valores de atributo de una entidad

Una entidad de datos maestros puede incluir dos categorías de atributos:

  • Atributos cuyos valores se componen a partir de los registros de miembros de una entidad.
  • Atributos cuyos valores se almacenan directamente en la entidad, conocidos como atributos de entidad.
Atributos compuestos
Las entidades derivan muchos de sus valores de atributo de los valores definidos en sus registros de miembro. Los valores de atributo de una entidad se seleccionan de sus registros de miembros utilizando un conjunto de reglas de composición de atributos. Puede definir y personalizar reglas de composición de atributos para cada tipo de entidad en el modelo de datos. Para obtener más información sobre la composición de atributos, consulte Definición de reglas de composición de atributos en IBM Match 360.
Atributos de entidad
Los atributos de entidad se definen directamente en la entidad, en lugar de estar compuestos a partir de sus registros de miembro. Defina atributos de entidad en el modelo de datos de los tipos de entidad. Para obtener información sobre cómo modificar el modelo de datos, consulte Personalización del modelo de datos.
  • Para cambiar el valor de un atributo de entidad, edite la entidad directamente. La edición de registros de miembro no afecta al valor de un atributo de entidad. Para obtener información sobre cómo editar una entidad, consulte Adición y edición de registros y entidades en IBM Match 360.
  • Cuando una entidad se crea por primera vez mediante el algoritmo de coincidencia, no tiene ningún valor de atributo de entidad definido. Edite la entidad en el área de trabajo de datos maestros para proporcionar valores a los atributos de la entidad.
  • Si una entidad con valores de atributo de entidad rellenados se suprime como resultado de un cambio en su composición, ya sea a través de una acción link o unlink manual o a través de un cambio en el algoritmo coincidente, sus valores de atributo de entidad se transfieren a cualquier entidad superviviente.
  • Si se fusionan dos entidades que tienen ambos atributos de entidad (coincidentes o enlazados manualmente), los valores de atributo de entidad del ID de entidad superviviente tienen prioridad. Si el atributo en cuestión consta de una lista de valores, el sistema fusiona las listas de ambas entidades. La fusión garantiza que la lista no contenga valores duplicados. Si las dos listas incluyen el mismo valor, ese valor sólo aparece una vez en la lista fusionada.

Persistencia de entidades

Al definir el modelo de datos, puede configurar si las vistas compuestas de cada tipo de entidad se guardan en la base de datos o se componen bajo demanda a partir de sus registros miembros. Cuando un tipo de entidad está configurado para persistir, los atributos compuestos de cada entidad se almacenan en la base de datos de forma similar a como se almacenan los atributos de los registros, lo que significa que los datos de la entidad son más estables y resistentes.

Cuando las entidades están configuradas para persistir, los administradores de datos y los usuarios empresariales pueden buscar directamente en los datos de la entidad, incluidos los atributos complementarios, los atributos de auditoría y las propiedades del sistema, como el recuento de registros y el ID de la entidad. Los usuarios pueden buscar entidades persistentes utilizando los mecanismos de búsqueda simple o avanzada de la interfaz del explorador de datos maestros.

Dependiendo del volumen de entidades en sus datos maestros, almacenar vistas compuestas de entidades en la base de datos puede hacer que el tamaño de la base de datos aumente significativamente.

Para obtener más información sobre la definición de tipos de entidad, consulte Personalización del modelo de datos.

El modelo de datos IBM Match 360

El modelo de datos define los metadatos asociados con los datos que se cargan en IBM Match 360.

El modelo de datos contiene propiedades y reglas que se utilizan en IBM Match 360 para identificar y categorizar la información presente en los datos. El modelo de datos consta de distintos tipos de metadatos:

Puede definir sus propios tipos de registro, tipos de atributo y tipos de relación para que se ajusten a los requisitos de su organización. Las propiedades del sistema generalmente no se pueden personalizar.

Propiedades del sistema (atributos de auditoría)

Las propiedades del sistema en el modelo de datos mejoran la capacidad de auditar los datos en IBM Match 360 para ayudar a garantizar el cumplimiento de las reglas de gobierno de datos. El sistema define, captura y almacena las propiedades del sistema y no están disponibles para su personalización o modificación. Hay propiedades del sistema asociadas con cuatro elementos diferentes del modelo de datos: tipos de registro, tipos de entidad, tipos de atributo y tipos de relación.

  • Las propiedades del sistema Tipo de registro almacenan información del sistema a nivel de registro. Por ejemplo:

    • record_last_updated realiza un seguimiento de la hora en que se actualizó por última vez cada registro.
    • record_number almacena un número de identificación generado por el sistema para cada registro.
  • Las propiedades del sistema Tipo de entidad almacenan información del sistema a nivel de entidad. Por ejemplo:

    • created_date almacena la hora y la fecha en que se ha creado una entidad.
    • link_last_updated_date realiza un seguimiento de la fecha y hora en que se modificaron por última vez los registros de miembros de una entidad.
    • last_updated_date almacena la hora y la fecha en que se modificaron por última vez los atributos suplementarios de una entidad.
    • last_updated_user realiza un seguimiento del usuario que ha realizado los cambios más recientes en los atributos suplementarios de una entidad.
  • Las propiedades del sistema Tipo de atributo almacenan información del sistema a nivel de atributo. Por ejemplo, attribute_last_updated realiza un seguimiento de la hora en que se actualizó por última vez cada atributo.

  • Las propiedades del sistema Tipo de relación almacenan información del sistema en el nivel de relación. Por ejemplo:

    • relationship_last_updated realiza un seguimiento de la hora en que se actualizó por última vez cada relación.
    • relationship_number almacena un número de identificación generado por el sistema para cada relación.

Vea el siguiente vídeo para ver cómo ver los atributos de auditoría generados por el sistema que crea IBM Match 360 al añadir o editar datos de registro.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Tipos de registros

Los tipos de registro del modelo de datos definen varios tipos de registros relevantes para los dominios y los casos de uso que necesita su organización. Cada tipo de registro consta de las propiedades u objetos siguientes:

  • label es la etiqueta del tipo de registro.
  • description es una descripción breve del tipo de registro.
  • entity_types contiene los objetos para todos los tipos de entidad que se incluyen en este tipo de registro. Cada objeto entity_type contiene una etiqueta, una descripción y, opcionalmente, un tipo de entidad (identidad o asociación).
  • attributes es un objeto que contiene todos los atributos asociados al tipo de registro. Cada atributo definido contiene las propiedades siguientes:
    • label -Una etiqueta para el atributo.
    • description -Una descripción del atributo.
    • attribute_type : el tipo de atributo de este atributo.
    • cardinality -La cardinalidad del atributo (lista o única). La cardinalidad define cuántos valores puede tener este atributo.
    • indexed -Un campo booleano que indica si el atributo se indexa para dar soporte a búsquedas de texto libre de su contenido.

Tipos de atributo

Los tipos de atributo del modelo de datos definen los tipos de atributos que se pueden asociar con un tipo de registro o tipo de relación. Cada entrada de tipo de atributo consta de las propiedades u objetos siguientes:

  • label es la etiqueta del tipo de atributo.
  • description es una breve descripción del tipo de atributo.
  • matching_types indica el tipo de función coincidente a aplicar en todos los atributos de este tipo de atributo.
  • fields contiene definiciones de todos los campos que forman parte de este tipo de atributo. Cada campo consta de las propiedades label, descriptiony indexed .

Tipos de relaciones

Los tipos de relación en el modelo de datos definen los tipos de relaciones disponibles que se asignarán en estos datos. Cada tipo de relación definido incluye las siguientes propiedades y objetos:

  • label es una etiqueta para el tipo de relación.
  • description es una breve descripción del tipo de relación.
  • label_from_source es la etiqueta de la relación, tal como se visualiza desde el punto de vista del origen. Por ejemplo: "Gestiona".
  • label_from_target es la etiqueta de la relación, tal como se visualiza desde el punto de vista del destino. Por ejemplo: "Informes a".
  • cardinality define la cardinalidad de la relación (por ejemplo, de uno a muchos o de uno a uno).
  • directional indica si las relaciones de este tipo son direccionales (diferentes en función del lado de la relación que esté visualizando, como por ejemplo una relación médico-paciente) o bidireccionales (las mismas de ambos lados de la relación, como por ejemplo una relación de igual).
  • attributes es un objeto que contiene definiciones de todos los atributos que forman parte de este tipo de relación. El objeto attributes tiene la misma estructura que el de un atributo de un tipo de registro.
  • rules es un objeto que define las reglas de origen y destino para este tipo de relación.
    • El objeto para una regla de origen contiene la lista de tipos de registro y tipos de entidad que se pueden utilizar como origen al crear una relación de este tipo.
    • El objeto para una regla de destino contiene la lista de tipos de registro y tipos de entidad que se pueden utilizar como destino al crear una relación de este tipo.

Más información

Tema principal: Gestión de datos maestros

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información