Las clases de datos se asignan a nivel de activo y a nivel de columna.
En el nivel de activo, las clases de datos asignadas representan las clases de datos seleccionadas por el análisis, o manualmente, como la mejor coincidencia para una columna.
En el nivel de columna, las clases de datos se asignan basándose en el nombre de columna (ámbito columna) o en los datos de columna (ámbito valor) en función de la definición de clase de datos:
- Ámbito columna
- La clasificación sólo se basa en el análisis y en el análisis del nombre de columna, es decir, solo en los metadatos. En función de cómo coincida la columna con la clase de datos, el clasificador devuelve un valor de confianza entre 0.0 y 1.0, donde 0.0 significa que no hay coincidencia, y 1.0 significa una coincidencia perfecta. De forma alternativa, el clasificador puede devolver false en lugar de 0.0 y true en lugar de 1.0.
- Ámbito valor
- La clasificación se basa en el análisis de los valores de datos encontrados en una columna. En función de si el valor coincide con la clase, el clasificador devuelve true o false. Cuando se evalúan todos los valores, el porcentaje de valores de una columna que no son nulos y que coinciden con la clase de datos representa la confianza de la clase de datos para la columna.
Además de la confianza, la prioridad de la clase de datos se tiene en cuenta cuando se asignan clases de datos. A menos que se indique lo contrario en los detalles de clase de datos, la prioridad predeterminada para las clases de datos con el ámbito coincidente valor es 10. Para las clases de datos con el ámbito coincidente columna, la prioridad predeterminada es 0.
Cada clase de datos predefinida utiliza un tipo específico de clasificador para aplicar la lógica de clasificación:
- Los clasificadores Java pueden evaluar el nombre de columna o los valores de datos de una columna para determinar la clase de datos (ámbito columna).
- Un clasificador de regex evalúa los valores de datos de una columna aplicando una expresión regular que se utiliza para determinar si cada valor pertenece a la clase de datos (ámbito valor).
- Un clasificador de lista de valores evalúa los valores de datos de una columna basándose en una lista específica de valores válidos para determinar la clase de datos (ámbito valor).
Para obtener más información sobre los ámbitos, los clasificadores y los criterios de coincidencia, consulte Coincidencia de datos.
Detalles de cada clase de datos
Busque el tipo de clasificación y el ámbito, los criterios de evaluación y un ejemplo para cada clase de datos predefinida.
Número de cuenta
Ámbito
Valor
Criterios de coincidencia
Expresión regular: .
Filtro de nombre de columna: ^acc(ount)?([ _\-])?(num(ber)?|id|no(\.)?){1}$
Valor de datos de ejemplo
123456
Línea 1 de dirección
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.AddressLineClassifier
Tipo de datos: string
Longitud mínima de los datos: 4
Longitud máxima de los datos: 100
Filtro de nombre de columna: addr.{0,15}(1|one)$
Prioridad por defecto: 12
Valor de datos de ejemplo
Segunda línea de la dirección
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.AddressLineClassifier
Tipo de datos: string
Longitud mínima de los datos: 4
Longitud máxima de los datos: 100
Filtro de nombre de columna: addr.{0,15}(2|two)$
Prioridad por defecto: 12
Valor de datos de ejemplo
Línea de dirección 3
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.AddressLineClassifier
Tipo de datos: string
Longitud mínima de los datos: 4
Longitud máxima de los datos: 100
Filtro de nombre de columna: addr.{0,15}(3|three)$
Prioridad por defecto: 12
Valor de datos de ejemplo
Nota: Debe especificar los nombres de clase de datos exactamente. En el caso de los
Address Line 3
nombre de clase, existen dos espacios entre Address
y Line
.
Código de aeropuerto
Ámbito
Valor
Criterios de coincidencia
List of airport codes; case-sensitive
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 3
Valor de datos de ejemplo
Licencia de conducción del estado de Alabama
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[a-zA-Z]{1}\d{6}$|^\d{7}$
Tipo de datos: string
Longitud mínima de datos: 7
Longitud máxima de de datos: 7
Valor de datos de ejemplo
1234567
Licencia de conducción del estado de Alaska
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{7}$
Tipo de datos: string
Longitud mínima de datos: 7
Longitud máxima de de datos: 7
Valor de datos de ejemplo
1234567
Licencia del conductor de la provincia de Alberta
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{6}[-]?\d{3}$
Tipo de datos: numeric, string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 10
Valor de datos de ejemplo
123456-123
Tarjeta American Express
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.AMEXClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 16
Longitud máxima de de datos: 18
Valor de datos de ejemplo
3400-000000-00009
Licencia de conducción del estado de Arizona
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[abdyABDY]\d{8}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A12345678
Licencia de conducción del estado de Arkansas
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{9}$
Tipo de datos: string
Longitud mínima de datos: 9
Longitud máxima de de datos: 9
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
012345678
BIC
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.BICClassifier
Tipo de datos: string
Longitud mínima de datos: 9
Longitud máxima de de datos: 9
Valor de datos de ejemplo
DEUTDEDBDUE
Booleano
Ámbito
Valor
Criterios de coincidencia
Lista de valores: 0, 1, True, False, Yes, No
Tipo de datos: numérico o serie
Prioridad predeterminada: 16
Valor de datos de ejemplo
Sí
Licencia del conductor de la provincia de Columbia Británica
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{7}$
Tipo de datos: numeric, string
Longitud mínima de datos: 7
Longitud máxima de de datos: 7
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
1234567
Licencia de conducción del estado de California
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[a-zA-Z]{1}[0-9]{7}$
Tipo de datos: string
Longitud mínima de datos: 8
Longitud máxima de de datos: 8
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
C1234567
Código postal de Canadá
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[A-Z]\d[A-Z][ \-]?\d[A-Z]\d$
Tipo de datos: string
Longitud mínima de los datos: 6
Longitud máxima de los datos: 6
Valor de datos de ejemplo
H3A 0B1
Código de provincia de Canadá
Ámbito
Valor
Criterios de coincidencia
Lista de códigos de provincia de Canadá; distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 2
Longitud máxima de datos: 2
Prioridad predeterminada: 14
Valor de datos de ejemplo
QC
Nombre de provincia de Canadá
Ámbito
Valor
Criterios de coincidencia
Lista de nombres de provincia de Canadá; no distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 2
Longitud máxima de datos: 25
Prioridad predeterminada: 12
Valor de datos de ejemplo
Quebec
Número de seguridad social (SIN) canadiense
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.CanadianSINClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 9
Longitud máxima de de datos: 20
Valor de datos de ejemplo
046-454-286
Ciudad
Ámbito
Valor
Criterios de coincidencia
Lista de nombres de ciudad; no distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 2
Longitud máxima de datos: 58
Umbral de confianza predeterminado: 50%
Prioridad predeterminada: 7
Valor de datos de ejemplo
Los Angeles
Código
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.CodeClassifier
Prioridad por defecto: -10
Valor de datos de ejemplo
Licencia de conducción del estado de Colorado
Ámbito
Valor
Criterios de coincidencia
Expresión regular: (?:(^[0-9]{2}\-?[0-9]{3}\-?[0-9]{4}$)|(^[a-zA-Z]{1}[0-9]{3,6}$))
Tipo de datos: string
Longitud mínima de datos: 4
Longitud máxima de de datos: 11
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
12-345-2222
Color
Ámbito
Valor
Criterios de coincidencia
List of colors; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 41
Valor de datos de ejemplo
Azul
Código de entidad comercial y de gobierno
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.CAGECodeClassifier
Tipo de datos: string
Longitud mínima de datos: 5
Longitud máxima de de datos: 5
Filtro de nombre de columna : cage|fscm|nscm|entity|code
Valor de datos de ejemplo
1ASDY
Nombre de host del sistema
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.HostNameClassifier
Tipo de datos: string
Longitud mínima de datos: 4
Longitud máxima de de datos: 255
Valor de datos de ejemplo
www.example.com
Licencia de conducción del estado de Connecticut
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ' ^[0-9]{9}$
'
Tipo de datos: numérico, cadena
Longitud mínima de los datos: 9
Longitud máxima de los datos: 9
Filtro de nombre de columna: ' d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456789
Código de país
Ámbito
Valor
Criterios de coincidencia
Lista de códigos de país; distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 2
Longitud máxima de datos: 3
Prioridad predeterminada: 13
Valor de datos de ejemplo
EE.UU.
Nombre de país
Ámbito
Valor
Criterios de coincidencia
Lista de nombres de país; no distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 2
Longitud máxima de datos: 50
Prioridad predeterminada: 12
Valor de datos de ejemplo
India
Fecha de caducidad de la tarjeta de crédito
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.CreditCardExpDateAndValidationNumberClassifier
Valor de datos de ejemplo
12/2018
Número de tarjeta de crédito
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.CreditCardClassifier
Tipo de datos: numeric, string
Longitud mínima de los datos: 13
Longitud máxima de los datos: 20
Valor de datos de ejemplo
4146 6643 9004 5458
Número de validación de tarjeta de crédito
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.CreditCardExpDateAndValidationNumberClassifier
Valor de datos de ejemplo
1234
Moneda
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.CurrencyClassifier
Tipo de datos: string
Longitud mínima de datos: 2
Longitud máxima de de datos: 25
Valor de datos de ejemplo
$12,345.67
Terminología de procedimientos actual
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.CPTClassifier
Tipo de datos: string
Longitud mínima de datos: 5
Longitud máxima de de datos: 5
Filtro de nombre de columna : CPT|medical procedure code|medical procedure|medicalcode|current procedural terminology
Valor de datos de ejemplo
Número de cliente
Ámbito
Valor
Criterios de coincidencia
Expresión regular: .
Filtro de nombre de columna: ^cust(omer)?([ _\-])?(num(ber)?|id|no(\.)?){1}$
Valor de datos de ejemplo
3141596
Fecha
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.DateTimeClassifier
Valor de datos de ejemplo
12-30-2015
Fecha de nacimiento
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.DOBClassifier
Filtro de nombre de columna: dob$|birth(day)?|geburtsdatum|na(issance|cimiento|scita)|urodzenia|(生ま(れた日)?|誕生日)|出生(年月)?
Valor de datos de ejemplo
12-30-2015
Licencia de conducción del estado de Delaware
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[0-9]{1,7}$
Tipo de datos: numeric, string
Longitud mínima de datos: 1
Longitud máxima de de datos: 7
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
1234567
Tarjeta Diners Club
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.DinersClubClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 15
Longitud máxima de de datos: 18
Valor de datos de ejemplo
5520111111111121
Tarjeta Discover
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.DiscoverClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 17
Longitud máxima de de datos: 18
Valor de datos de ejemplo
6220264390045758
Permiso de conducir
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[ a-zA-Z0-9*-]{1,19}$
Tipo de datos: string
Longitud mínima de datos: 1
Longitud máxima de de datos: 19
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
1234567
DUNS
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^(\d{2})([ \-]?)(\d{3})([ \-]?)(\d{4})$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: duns|universal number|universal_number
Valor de datos de ejemplo
12-345-6789
Dirección de correo electrónico
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.EmailClassifier
Tipo de datos: string
Longitud mínima de datos: 6
Longitud máxima de de datos: 254
Valor de datos de ejemplo
Situación laboral
Ámbito
Valor
Criterios de coincidencia
List of employment statuses; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 2
Longitud máxima de de datos: 50
Valor de datos de ejemplo
empleado
Origen étnico
Ámbito
Valor
Criterios de coincidencia
List of ethnicities; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 22
Valor de datos de ejemplo
Hispano
Color de ojos
Ámbito
Valor
Criterios de coincidencia
Lista de colores de ojos; no distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 3
Longitud máxima de datos: 14
Filtro de nombre de columna: eye|eye_color|eyecolor
Valor de datos de ejemplo
Castaño
Nombre
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.GNMFirstNameClassifier
Tipo de datos: string
Filtro de nombre de columna: ^(?i)(given|f(irst)?)([ _.\-])?name$
Umbral de confianza por defecto: 50%
Prioridad por defecto: 10
Valor de datos de ejemplo
James
Licencia de conducción del estado de Florida
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{1}[0-9]{3}\-[0-9]{3}\-[0-9]{2}\-[0-9]{3}\-[0-1]{1}$|^[a-zA-Z]{1}[0-9]{12}$
Tipo de datos: string
Longitud mínima de los datos: 13
Longitud máxima de los datos: 17
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
X123-123-33-229-0
Empresa Fortune 1000
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.Fortune1000Classifier
Tipo de datos : string
Longitud mínima de datos: 2
Longitud máxima de de datos: 50
Valor de datos de ejemplo
Número de INSEE francés
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.FranceINSEEClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 15
Longitud máxima de de datos: 15
Valor de datos de ejemplo
151022A10204375
Género
Ámbito
Valor
Criterios de coincidencia
Lista de valores: M, F, Hombre, Mujer
Tipo de datos: serie
Longitud mínima de datos: 1
Longitud máxima de datos: 6
Prioridad predeterminada: 16
Valor de datos de ejemplo
F
Coordenadas geográficas
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.GeographicCoordinatesClassifier
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 44
Valor de datos de ejemplo
49° 13" N; 1°10’00.012" E
Licencia de conducción del estado de Georgia
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[0-9]{7,9}$
Tipo de datos: numeric, string
Longitud mínima de los datos: 7
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123-45-6789
Número de registro de vehículo de Alemania
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.GermanyCarClassifier
Tipo de datos: string
Longitud mínima de datos: 4
Longitud máxima de de datos: 9
Valor de datos de ejemplo
BB-XY1066
Color de pelo
Ámbito
Valor
Criterios de coincidencia
List of hair colors; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 14
Filtro de nombre de columna : hair|hair_color|haircolor
Valor de datos de ejemplo
Negro
Licencia de conducción del estado de Hawái
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[hH]{1}[0-9]{8}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
H12345678
Número de seguridad social
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.HICNClassifier
Tipo de datos: string
Longitud mínima de datos: 6
Longitud máxima de de datos: 15
Valor de datos de ejemplo
WD-000-00-0000
Afición/actividad de ocio
Ámbito
Valor
Criterios de coincidencia
List of hobbies; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 38
Filtro de nombre de columna : hobb(y$|ies$)|leisure([ _])activit(y$|ies$)
Valor de datos de ejemplo
Tenis
Tratamiento
Ámbito
Valor
Criterios de coincidencia
List of honorifics; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 1
Longitud máxima de de datos: 38
Valor de datos de ejemplo
Sr
IBAN
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.IBANClassifier
Tipo de datos: string
Longitud mínima de datos: 14
Longitud máxima de de datos: 42
Valor de datos de ejemplo
GB87 BARC 2065 8244 9716 55
ICD-10
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.ICD10Classifier
Longitud mínima de de datos: 3
Longitud máxima de de datos: 7
Valor de datos de ejemplo
D36.7
Licencia de conducción del estado de Idaho
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{2}[0-9]{6}[a-zA-Z]{1}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
AA123456X
Identificador
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.IdentifierClassifier
Prioridad por defecto: -10
Valor de datos de ejemplo
Licencia de conducción del estado de Illinois
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[a-zA-Z]{1}[0-9]{3}\-[0-9]{4}\-[0-9]{4}$|^[a-zA-Z]{1}[0-9]{11}$
Tipo de datos: string
Longitud mínima de datos: 12
Longitud máxima de de datos: 14
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A123-4567-8999
Términos de INCO (Términos comerciales internacionales)
Ámbito
Valor
Criterios de coincidencia
List of INCO terms; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 3
Valor de datos de ejemplo
FCA
Licencia de conducción del estado de Indiana
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[0-9]{4}\-[0-9]{2}\-[0-9]{4}$|^[a-zA-Z]{1}[0-9]{9}$|^[0-9]{10}$
Tipo de datos: string
Longitud mínima de datos: 10
Longitud máxima de de datos: 12
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
1234-56-7890
Indicador
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.IndicatorClassifier
Prioridad por defecto: -10
Valor de datos de ejemplo
Número de identificación de contribuyente individual (ITIN)
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^(9\d{2})([ \-]?)(?!93|89)([789][0-9])([ \-]?)(\d{4})$
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: itin|tax
Valor de datos de ejemplo
913-72-2222
Identidad de equipo móvil internacional (IMEI)
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.IMEINumberClassifier
Tipo de datos: string
Longitud mínima de datos: 15
Longitud máxima de de datos: 15
Filtro de nombre de columna : imei
Valor de datos de ejemplo
490154203237518
Número de identificación de valores internacionales (ISIN)
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.ISINClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 10
Longitud máxima de de datos: 20
Valor de datos de ejemplo
GB0002634946
Número de libro estándar internacional (ISBN)
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.ISBNClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 10
Longitud máxima de de datos: 20
Valor de datos de ejemplo
978 0 306 40615 7
Clasificación industrial estándar internacional
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.ISICClassifier
Tipo de datos: string
Longitud mínima de datos: 5
Longitud máxima de de datos: 5
Filtro de nombre de columna : ^(unsic)$|^(isic)$|^((industr(ial|ies|y))[ ._-]?(code))$
Valor de datos de ejemplo
C3319
Dirección de Protocolo Internet
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\s*(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\s*$
Tipo de datos: string
Longitud mínima de datos: 7
Longitud máxima de de datos: 15
Valor de datos de ejemplo
127.127.127.002
Dirección de Protocolo Internet Versión 6
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\s*((([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:))|(([0-9A-Fa-f]{1,4}:){6}(:[0-9A-Fa-f]{1,4}|((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){5}(((:[0-9A-Fa-f]{1,4}){1,2})|:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4}){1,3})|((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){1,4})|((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){1,5})|((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){1,6})|((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(:(((:[0-9A-Fa-f]{1,4}){1,7})|((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:)))(%.+)?\s*$
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 39
Valor de datos de ejemplo
fe80:0:0:0:204:61ff:fe9d:f156
Licencia de conducción del estado de Iowa
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[0-9]{3}[a-zA-Z]{2}[0-9]{4}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123XX4567
Código de ubicación de Irlanda
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[ACD-FHKNPRTV-Y]\d[\dW][ \-]?[\dACD-FHKNPRTV-Y]{4}$
Tipo de datos: string
Longitud mínima de los datos: 7
Longitud máxima de los datos: 8
Valor de datos de ejemplo
D02 NY52
Código ISO 3166-2
Ámbito
Valor
Criterios de coincidencia
List of ISO 3166-2 codes of states or provinces; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 4
Longitud máxima de de datos: 6
Valor de datos de ejemplo
IN-KA
Código fiscal italiano
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([A-Z]{3})([ \-]?)([A-Z]{3})\2([0-9L-NP-V]{2})([A-EHLMPRST])([0-9LNP-V]{2})\2([A-ILMZ][0-9L-NP-V]{3})([A-Z])$
Tipo de datos: string
Longitud mínima de los datos: 16
Longitud máxima de los datos: 16
Valor de datos de ejemplo
MRTMTT25D09F205Z
Japan Credit Bureau (JCB)
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.JapanCBClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 17
Longitud máxima de de datos: 18
Valor de datos de ejemplo
35283095185620637
Licencia de conducción del estado de Kansas
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[kK]{1}[0-9]{2}\-[0-9]{2}\-[0-9]{4}$|^[kK]{1}[0-9]{8}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
K94-12-3456
Licencia de conducción del estado de Kentucky
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{1}[0-9]{2}\-[0-9]{3}\-[0-9]{3}$|^[a-zA-Z]{1}[0-9]{8}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A23-145-678
Código o nombre de idioma
Ámbito
Valor
Criterios de coincidencia
List of languages; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 2
Longitud máxima de de datos: 37
Filtro de nombre de columna : lang|locale|language
Valor de datos de ejemplo
EN
Apellido
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.GNMLastNameClassifier
Tipo de datos: string
Filtro de nombre de columna: ^l(ast)?([ \-_])?name$|^surname$|^family(([ \-_])?)name$
Umbral de confianza por defecto: 50%
Prioridad por defecto: 7
Valor de datos de ejemplo
Smith
Latitud
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.LatitudeClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 1
Longitud máxima de de datos: 20
Filtro de nombre de columna : ^lat$|^lat_|_lat$|latitud(ine|e|o)?|breitengrad|breddekreds|breedtegraad|breiddegrad|breiddargráða|enlem|πλάτος|широт(ы|a)|קו רוחב|عرض جغرافي|緯度|纬度
Valor de datos de ejemplo
49° 13"
Estado civil/civil legal.
Ámbito
Valor
Criterios de coincidencia
List of marital statuses; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 6
Longitud máxima de de datos: 23
Valor de datos de ejemplo
Único
Nota: Debe especificar los nombres de clase de datos exactamente. En el caso del nombre de clase Legal Marital/Civil Status.
, se debe utilizar la parada completa al final del nombre.
Longitud
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.LongitudeClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 1
Longitud máxima de de datos: 21
Filtro de nombre de columna: ^long$|^long_|_long$|longitud(ine|e|o)?|längengrad|laengengrad|længdekreds|laengdekreds|lengtegraad|lengdegrad|lengdargráða|boylam|μήκος|долгот(ы|a)|קו אורך|طول جغرافي|経度|经度
Valor de datos de ejemplo
1°10’00.012" E
Licencia de conducción del estado de Louisiana
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^00[0-9]{7}$
Tipo de datos: string
Longitud mínima de datos: 9
Longitud máxima de de datos: 9
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
003456789
Dirección Mac
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^(?:[0-9A-Fa-f]{2}([:-]))(?:[0-9A-Fa-f]{2}\1){4}[0-9A-Fa-f]{2}$|(?:^([0-9A-Fa-f]{4}\.){2}[0-9A-Fa-f]{4}$
Longitud mínima de datos: 14
Longitud máxima de de datos: 17
Valor de datos de ejemplo
12:34:56:78:9F
Licencia de conducción del estado de Maine
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[0-9]{7}$
Tipo de datos: numeric, string
Longitud mínima de datos: 7
Longitud máxima de de datos: 7
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
1234567
Licencia de conducción de la provincia de Manitoba
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{9}$
Tipo de datos: numeric, string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 9
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456789
Licencia de conducción del estado de Maryland
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{1}\-[0-9]{3}\-[0-9]{3}\-[0-9]{3}\-[0-9]{3}$|^[a-zA-Z]{1}[0-9]{12}$
Tipo de datos: string
Longitud mínima de los datos: 13
Longitud máxima de los datos: 17
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A-123-456-789-999
Licencia de conducción del estado de Massachusetts
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[sS]{1}[0-9]{8}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
S12345678
Master Card
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.MasterCardClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 17
Longitud máxima de de datos: 18
Valor de datos de ejemplo
5285696282092972
Licencia de conducción del estado de Michigan
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{1}\d{12}$|^[a-zA-Z]{1} [0-9]{3} [0-9]{3} [0-9]{3} [0-9]{3}$
Tipo de datos: string
Longitud mínima de los datos: 13
Longitud máxima de los datos: 17
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A012345678912
Segundo apellido
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.GNMFirstNameClassifier
Tipo de datos: string
Filtro de nombre de columna: ^m(iddle)?([ _.\-])?name$
Umbral de confianza por defecto: 50%
Prioridad por defecto: 10
Valor de datos de ejemplo
James
Licencia de conducción del estado de Minnesota
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{1}\d{12}$|^[a-zA-Z]{1}-[0-9]{3}-[0-9]{3}-[0-9]{3}-[0-9]{3}$
Tipo de datos: string
Longitud mínima de los datos: 13
Longitud máxima de los datos: 17
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A012345678912
Licencia de conducción del estado de Missouri
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{9}$|^[a-zA-Z]{1}[0-9]{5,9}$
Tipo de datos: string
Longitud mínima de los datos: 6
Longitud máxima de los datos: 10
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
012345678
Licencia de conducción del estado de Montana
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{9}$|^\d{13}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 13
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
0123456789123
Mes
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.MonthClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 1
Longitud máxima de de datos: 10
Valor de datos de ejemplo
Enero
Sufijo de nombre
Ámbito
Valor
Criterios de coincidencia
List of name suffixes; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 2
Longitud máxima de de datos: 16
Valor de datos de ejemplo
PhD
Licencia de conducción del estado de Nebraska
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{1}[0-9]{3,8}$
Tipo de datos: string
Longitud mínima de los datos: 4
Longitud máxima de los datos: 9
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
C12345678
Licencia de conducción del estado de Nevada
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[xX]{1}\d{8}$|^\d{10}$|^\d{12}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 12
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
0123456789
Licencia de conducción de la provincia de Nuevo Brunswick
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[0-9]{1,7}$
Tipo de datos: string
Longitud mínima de datos: 1
Longitud máxima de de datos: 7
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
0123456
Licencia de conducción del estado de New Hampshire
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{2}[a-zA-Z]{3}\d{5}$
Tipo de datos: string
Longitud mínima de los datos: 10
Longitud máxima de los datos: 10
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
01ABC56789
Licencia de conducción del estado de Nueva Jersey
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{1}\d{14}$|^[a-zA-Z]{1}\d{4} \d{5} \d{5}$|^[a-zA-Z]{1}\d{4}-\d{5}-\d{5}$
Tipo de datos: string
Longitud mínima de los datos: 15
Longitud máxima de los datos: 17
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A01234567891234
Licencia de conducción del estado de Nuevo México
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{9}$
Tipo de datos: string
Longitud mínima de datos: 9
Longitud máxima de de datos: 9
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
012345678
Licencia de conducción del estado de Nueva York
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{9}$|^[a-zA-Z]{1}\d{18}$|^\d{3} \d{3} \d{3}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 19
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
012345678
Licencia de conducir del estado de la provincia de Newfoundland y Labrador
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[a-zA-Z]{1}\d{9}$
Tipo de datos: string
Longitud mínima de los datos: 10
Longitud máxima de los datos: 10
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A012345678
NoClassDetected
Ámbito
Criterios de coincidencia
Ni el nombre de columna ni los valores de columna coinciden con ninguna de las clases de datos disponibles.
Valor de datos de ejemplo
Licencia de conducción del estado de Carolina del Norte
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[0-9]{1,12}$
Tipo de datos: string
Longitud mínima de datos: 1
Longitud máxima de de datos: 12
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456789999
Licencia de conducción del estado de Dakota del Norte
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{3}\-[0-9]{2}\-[0-9]{4}$|^[a-zA-Z]{3}[0-9]{6}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
XYZ-11-2222
Licencia de conducción de la provincia de Nueva Escocia
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[a-zA-Z]{2}[0-9]{6}$
Tipo de datos: string
Longitud mínima de datos: 8
Longitud máxima de de datos: 8
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
XY123456
Licencia de conducción del estado de Ohio
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[a-zA-Z]{2}[0-9]{6}$
Tipo de datos: string
Longitud mínima de datos: 8
Longitud máxima de de datos: 8
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
XY123456
Licencia de conducción del estado de Oklahoma
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{1}[0-9]{9}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
X123456789
Licencia del conductor de la provincia de Ontario
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([a-zA-Z]{1}\d{4})([-]?)(\d{5})\2(\d{5})$
Tipo de datos: string
Longitud mínima de los datos: 15
Longitud máxima de los datos: 17
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A1234-56123-99999
Licencia de conducción del estado de Oregon
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{1,9}$
Tipo de datos: string
Longitud mínima de los datos: 1
Longitud máxima de los datos: 9
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
012345678
Nombre de organización
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.GNMOrganizationClassifier
Tipo de datos: string
Umbral de confianza por defecto: 60%
Prioridad por defecto: 7
Valor de datos de ejemplo
IBM
Número de pasaporte
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[A-Z0-9<]{9}[0-9]{1}[A-Z]{3}[0-9]{7}[A-Z]{1}[0-9]{7}[A-Z0-9<]{14}[0-9]{2}$
Tipo de datos: string
Longitud mínima de los datos: 6
Longitud máxima de los datos: 254
Valor de datos de ejemplo
L898902C<3UTO6908061F9406236ZE184226B<<<<<14
Licencia de conducción del estado de Pennsylvania
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{8}$|^\d{2} \d{3} \d{3}$
Tipo de datos: string
Longitud mínima de los datos: 8
Longitud máxima de los datos: 10
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
01234567
Porcentaje
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\(?[+-]? ?[0-9]{1,10}[,.]?[0-9]{0,10} ?(%|percent|pct)\)?$
Tipo de datos: string
Longitud mínima de los datos: 2
Longitud máxima de los datos: 25
Valor de datos de ejemplo
45%
Nombre de persona
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.GNMFullNameClassifier
Tipo de datos: string
Filtro de nombre de columna: _?name|नाम|名称|nom|nome|όνομα|nomine|имя|이름|име|naam
Umbral de confianza por defecto: 50%
Prioridad por defecto: 7
Valor de datos de ejemplo
John Doe
Partido político
Ámbito
Valor
Criterios de coincidencia
List of poitical parties; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 2
Longitud máxima de de datos: 99
Filtro de nombre de columna : politic
Valor de datos de ejemplo
PDP
Licencia de conducción del estado de la provincia Isla del Príncipe Eduardo
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{6}$
Tipo de datos: numeric, string
Longitud mínima de los datos: 6
Longitud máxima de los datos: 6
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456
Cantidad
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.QuantityClassifier
Prioridad por defecto: -10
Valor de datos de ejemplo
100
Licencia del conductor de la provincia de Quebec
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([a-zA-Z]{1}\d{4})([-]?)(\d{6})(\2)(\d{2})$
Tipo de datos: string
Longitud mínima de los datos: 13
Longitud máxima de los datos: 15
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A1234-222222-00
Relación
Ámbito
Valor
Criterios de coincidencia
List of relationship types; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 26
Valor de datos de ejemplo
Amistad
Religión
Ámbito
Valor
Criterios de coincidencia
List of religions; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 3
Longitud máxima de de datos: 19
Valor de datos de ejemplo
Católica
Licencia de conducción del estado de Rhode Island
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{7}$|^[vV]{1}\d{6}$
Tipo de datos: string
Longitud mínima de datos: 7
Longitud máxima de de datos: 7
Valor de datos de ejemplo
0123456
Número de tránsito de direccionamiento
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.RTNClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 9
Longitud máxima de de datos: 9
Valor de datos de ejemplo
121000358
Licencia de conducir del estado de la provincia de Saskatchewan
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{8}$
Tipo de datos: string
Longitud mínima de datos: 8
Longitud máxima de de datos: 8
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
12345678
Licencia de conducción del estado de Carolina del Sur
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{9}$
Tipo de datos: string
Longitud mínima de datos: 9
Longitud máxima de de datos: 9
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456789
Licencia de conducción del estado de Dakota del Sur
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([\-\.]?)(\d{2})\2(\d{4})$|^\d{6}$|^\d{8}$
Tipo de datos: string
Longitud mínima de datos: 6
Longitud máxima de de datos: 11
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456
Número de identificación fiscal español
Ámbito
Valor
Criterios de coincidencia
RegularExpression: (X?)[ \-]?(\d{7})[ \-]?([A-HJ-NP-TV-Z])
Tipo de datos: string
Longitud mínima de los datos: 8
Longitud máxima de los datos: 11
Valor de datos de ejemplo
3124124N
Nombre de estado/provincia
Ámbito
Valor
Criterios de coincidencia
List of state and province names; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 2
Longitud máxima de de datos: 43
Valor de datos de ejemplo
San Salvador
Temperatura
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.TemperatureClassifier
Tipo de datos: string
Longitud mínima de datos: 2
Longitud máxima de de datos: 25
Valor de datos de ejemplo
20°C
Licencia de conducción del estado de Tennessee
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{8,9}$
Tipo de datos: string
Longitud mínima de los datos: 8
Longitud máxima de los datos: 9
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456789
Licencia de conducción del estado de Texas
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{8}$
Tipo de datos: string
Longitud mínima de datos: 8
Longitud máxima de de datos: 8
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
12345678
Texto
Ámbito
Columna
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.TextClassifier
Prioridad por defecto: -10
Valor de datos de ejemplo
Ponga la visualización de su TV a toda velocidad con escenas que saltan fuera de su pantalla añadiendo 3D HDTV a su sistema de home cinema.
Número de la seguridad social del Reino Unido
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([A-CEGHJ-PR-TW-Z][A-CEGHJ-NPR-TW-Z])([ \-\.]?)(\d{2})\2?(\d{2})\2?(\d{2})(\2([ABCD]))?$
Tipo de datos: string
Longitud mínima de los datos: 8
Longitud máxima de los datos: 13
Valor de datos de ejemplo
CA 123456 A
Código postal de Reino Unido
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^[A-Z][A-Z]?\d[A-Z\d]?[ \-]?\d[ABD-HJLNP-UW-Z]{2}$
Tipo de datos: string
Longitud mínima de los datos: 5
Longitud máxima de los datos: 8
Valor de datos de ejemplo
L1 8LW
Código de provincia de Reino Unido
Ámbito
Valor
Criterios de coincidencia
List of UK province codes; case-sensitive
Tipo de datos: string
Longitud mínima de datos: 2
Longitud máxima de de datos: 3
Valor de datos de ejemplo
HAW
Localizador de recursos uniforme
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.URLClassifier
Tipo de datos: string
Longitud mínima de datos: 10
Longitud máxima de de datos: 1000
Valor de datos de ejemplo
Código de producto universal (UPC)
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.UPCClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 12
Longitud máxima de de datos: 12
Valor de datos de ejemplo
123456789999
Condado de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Lista de nombres de condado de EE.UU.; no distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 3
Longitud máxima de datos: 35
Prioridad predeterminada: 8
Valor de datos de ejemplo
Adams
Número de identificación de la empresa de EE. UU.
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^(0[1-6]|1[0-6]|2[0-7]|[35][0-9]|[468][0-8]|7[1-7]|9[0-589])[ \-]?\d{7}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 10
Filtro de nombre de columna: EMPLOYER|EIN
Valor de datos de ejemplo
99-1234567
Código Nacional de Drogas de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.USNDCClassifier
Tipo de datos: string
Longitud mínima de datos: 10
Longitud máxima de de datos: 20
Filtro de nombre de columna : DRUG|NDC
Valor de datos de ejemplo
1234-5678-90
Número de teléfono de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^(\+?1\s*[-\/\.]?)?(\((\d{3})\)|(\d{3}))\s*[-\/\.]?\s*(\d{3})\s*[-\/\.]?\s*(\d{4})\s*(([xX]|[eE][xX][tT])\.?\s*(\d+))*$
Tipo de datos: string
Longitud mínima de datos: 9
Longitud máxima de datos: 16
Valor de datos de ejemplo
1 (234) 567-8901
Número de seguridad social de EE. UU.
Ámbito
Valor
Criterios de coincidencia
b>RegularExpression:** ' ^([1-578]\d{2}|0[1-9]\d|00[1-9]|6[0-57-9]\d|66[0-57-9])([ \-\.]?)([1-9]\d|0[1-9])\2([1-9]\d{3}|0[1-9]\d{2}|00[1-9]\d|000[1-9])$
'
Tipo de datos: numérico, cadena
Longitud mínima de los datos: 9
' Longitud máxima de los datos: 11
Valor de datos de ejemplo
123-45-6789
Últimos 4 dígitos del número de la seguridad social de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^([1-9]\d{3}|0[1-9]\d{2}|00[1-9]\d|000[1-9])$
Longitud mínima de datos: 4
Longitud máxima de de datos: 4
Filtro de nombre de columna : ssn(4)?$|(ssn|social(.?security)?|socsec)(.*4)?
Valor de datos de ejemplo
Clasificación industrial estándar de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.USSICClassifier
Longitud mínima de datos: 3
Longitud máxima de datos: 4
Filtro de nombre de columna: SIC|USSIC|Standard Industrial Classification
Valor de datos de ejemplo
1234
Nombre de capital de estado de EE. UU.
Ámbito
Valor
Criterios de coincidencia
List of US state capital names; case-insensitive
Tipo de datos: string
Longitud mínima de datos: 5
Longitud máxima de de datos: 14
Valor de datos de ejemplo
Montgomery
Código de estado de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Lista de códigos de estado de EE.UU.; distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 2
Longitud máxima de datos: 2
Prioridad predeterminada: 14
Valor de datos de ejemplo
DE
Nombre del estado de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Lista de nombres de estado de EE.UU.; no distingue entre mayúsculas y minúsculas
Tipo de datos: serie
Longitud mínima de datos: 4
Longitud máxima de datos: 20
Prioridad predeterminada: 12
Valor de datos de ejemplo
Massachusetts
Nombre de calle de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.StreetClassifier
Tipo de datos: string
Longitud mínima de datos: 7
Longitud máxima de de datos: 50
Valor de datos de ejemplo
8475 NW St
Código postal de EE. UU.
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.USZipCodeClassifier
Tipo de datos: numeric, string
Longitud mínima de datos: 5
Longitud máxima de de datos: 10
Valor de datos de ejemplo
02201-1020
Licencia de conducción del estado de Utah
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{4,9}$
Tipo de datos: numeric, string
Longitud mínima de datos: 4
Longitud máxima de de datos: 9
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456789
Número de identificación de vehículo (VIN)
Ámbito
Valor
Criterios de coincidencia
Clase Java: com.ibm.infosphere.classification.impl.VehicleIdNumber
Tipo de datos: string
Longitud mínima de datos: 17
Longitud máxima de de datos: 17
Valor de datos de ejemplo
1JCCM85E5BT001312
Licencia de conducción del estado de Vermont
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{8}$|^\d{7}A$
Tipo de datos: string
Longitud mínima de datos: 8
Longitud máxima de de datos: 8
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
1234567A
Licencia de conducción del estado de Virginia
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([\-\.]?)(\d{2})\2(\d{4})$|^[A-Za-z]{1}\d{8}$
Tipo de datos: string
Longitud mínima de los datos: 9
Longitud máxima de los datos: 11
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A12345678
Tarjeta VISA
Ámbito
Valor
Criterios de coincidencia
b>Clase Java:** com.ibm.infosphere.classification.impl.VisaClassifier
Tipo de datos: numérico, cadena
' Longitud mínima de los datos: 17
' Longitud máxima de los datos: 18
Valor de datos de ejemplo
4024007121595481
Licencia de conducción del estado de Washington DC
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^\d{7}$|^\d{9}$
Tipo de datos: numeric, string
Longitud mínima de datos: 7
Longitud máxima de de datos: 9
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
1234567
Licencia de conducción del estado de Washington
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^(?=.*[A-Za-z]{2})([a-zA-Z]{2}[A-Za-z*]{5}\d{3}[A-Za-z0-9]{2})$
Tipo de datos: string
Longitud mínima de datos: 12
Longitud máxima de de datos: 12
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
DOE**MJ501A1
Licencia de conducción del estado de Virginia Occidental
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[a-zA-Z]{1}\d{6}$|^\d{7}$
Tipo de datos: string
Longitud mínima de datos: 7
Longitud máxima de de datos: 7
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
A123456
Licencia de conducción del estado de Wisconsin
Ámbito
Valor
Criterios de coincidencia
Expresión regular: ^[a-zA-Z]{1}\d{3}-\d{4}-\d{4}-\d{2}$
Tipo de datos: string
Longitud mínima de datos: 17
Longitud máxima de de datos: 17
Filtro de nombre de columna : d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
Z123-1234-5678-12
Licencia de conducción del estado de Wyoming
Ámbito
Valor
Criterios de coincidencia
RegularExpression: ^\d{6}-\d{3}$
Tipo de datos: string
Longitud mínima de los datos: 10
Longitud máxima de los datos: 10
Filtro de nombre de columna: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Valor de datos de ejemplo
123456-123
Tema principal: Clases de datos predefinidas