0 / 0
Volver a la versión inglesa de la documentación
Clases de datos de Knowledge Accelerators
Última actualización: 21 jun 2024
¿Cuáles son las clases de datos de Knowledge Accelerators ?

Los Knowledge Accelerators amplían el conjunto de clases de datos proporcionadas en IBM Knowledge Catalog con clases de datos que describen tipos de datos que se encuentran habitualmente en activos de varios sectores, además de clases de datos basadas en estándares del sector como ISO, FHIR y CIM. Estas nuevas clases de datos describen información de uso común en Energía y programas de utilidad, Servicios financieros, Sanidad, Segurosy otros orígenes de datos de varios sectores .

Las clases de datos describen el tipo y las características de los datos contenidos en los activos de datos. Se utilizan durante el enriquecimiento de metadatos de IBM Knowledge Catalog para crear perfiles de datos. Los Knowledge Accelerators incluyen clases de datos específicas del sector que utilizan los códigos de conjuntos de datos de referencia o listas de valores válidos, añaden expresiones regulares para identificar patrones de datos o criterios de coincidencia de nombres de columna.

Las clases de datos de Knowledge Accelerators mejoran la capacidad del proceso de enriquecimiento de IBM Knowledge Catalog para reconocer datos específicos del sector. Las clases de datos existentes de IBM Knowledge Catalog y las nuevas clases de datos proporcionadas por Knowledge Accelerators se combinan en una nueva jerarquía de categorías basada en temas como Demographics, Finance y Location. Esta subcategorización permite que se incluyan de forma selectiva en diferentes enriquecimientos de metadatos para mejorar la precisión de la coincidencia. A medida que las clases de datos se correlacionan previamente con términos en el Vocabulario de núcleo empresarial, el enriquecimiento de metadatos también asigna automáticamente el término empresarial cuando hace coincidir los datos de un activo con una clase de datos.

Las clases de datos que son relevantes para los datos personales también tienen una clasificación de Información personal (PI) o Información personal sensible (SPI) en función de la sensibilidad de los datos que describe. Esta clasificación ayuda en la identificación de datos personales en activos de datos y da soporte a la aplicación de reglas de protección de datos para controlar el acceso a los datos.

Las clases de datos son totalmente personalizables y, si es necesario, se pueden ajustar para centrarse en los conjuntos de datos de referencia específicos del cliente o en las restricciones de coincidencia de nombres de columna.
Nota:

El conjunto de clases de datos que se proporcionan con IBM Knowledge Catalog se mantienen en la categoría 'Sin categorizar' de nivel superior. La importación de cualquiera de los Knowledge Accelerators crea una copia de estas clases de datos, con clasificaciones PI/SPI añadidas y colocadas en subcategorías de la nueva jerarquía de categorías 'Clases de datos', junto con las nuevas clases de datos de Knowledge Accelerators .

Las clases de datos duplicadas se pueden eliminar de 'Sin categorizar' después de una revisión de las relaciones existentes con los términos de negocio o asignaciones a activos de datos, que pueden tener que transferirse a las nuevas copias importadas con Knowledge Accelerators.

Tabla 1. Ejemplos de clases de datos
Industrial Clase de datos Descripción Categoría principal Método de búsqueda de coincidencias Conjunto de datos de referencia Valores de datos de referencia Términos empresariales
Sectores cruzados Número de teléfono internacional La recopilación de información que identifica un número de teléfono específico definido por los servicios de telecomunicaciones ... Clases de datos comunes Comparar con criterio en expresión regular Expresión regular Ejemplos:
  • +14655551212
  • +4402079460111
  • 003530209138764
Número de teléfono
Energía y servicios públicos Tipo de edificio El tipo de estructura de edificio que se ha construido. Clases de datos comunes Comparar con lista de valores válidos Valores válidos
  • Desconectada
  • bungalow
  • Cabaña
  • Rancho
  • Casa
  • ...
Tipo de edificio
Servicios financieros Código de moneda Código estándar para representar una moneda, utilizando un código numérico o alfabético. Esta clase de datos contiene contenido de códigos de moneda ISO 4217. Clases de datos financieros Comparar con lista de valores válidos Valores válidos
  • Dólares
  • EUR
  • Libras esterlinas (GBP)
  • Euro
  • Yen
  • ...
Código de moneda
Salud Tipo de grupo sanguíneo Clasifica los tipos de sangre según el estado ABO/Rh. Clases de datos biométricos y de salud Comparar con lista de valores válidos Valores válidos
  • A +
  • A-
  • B +
  • B-
  • O +
  • O-
  • ...
Grupo sanguíneo
Seguro Tipo de vehículo El tipo o categorización asociada con el modelo de vehículo. KAIN-Información del vehículo y clases de datos de accidentes Comparar con datos referenciados Tipo de vehículo
  • Coche
  • Ciclo de pedal
  • Vehículo agrícola
  • Motocicleta sobre 500cc
  • Mercancías 7.5 toneladas de peso mgw y más
  • ..
Tipo de vehículo
Nota: Muchas de las clases de datos listadas en los ejemplos anteriores son relevantes para más de un sector, por lo que se comparten entre los Knowledge Accelerators cuando corresponda.

Más información

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información