Datenklassen werden auf Asset-und Spaltenebene zugeordnet.
Auf der Assetebene stellen die zugeordneten Datenklassen die Datenklassen dar, die bei der Analyse oder manuell als beste Übereinstimmung für eine Spalte ausgewählt wurden.
Auf Spaltenebene werden Datenklassen abhängig von der Datenklassendefinition basierend auf dem Spaltennamen (Bereich Spalte) oder Spaltendaten (Bereich Wert) zugeordnet:
- Bereich Spalte
- Die Klassifikation basiert nur auf dem Parsing und der Analyse des Spaltennamens, das heißt, nur auf den Metadaten. Abhängig davon, wie exakt die Spalte mit der Datenklasse übereinstimmt, gibt das Klassifikationsmerkmal einen Konfidenzwert zwischen 0,0 und 1,0 zurück. Dabei steht 0,0 für keine Übereinstimmung und 1,0 für eine vollständige Übereinstimmung. Das Klassifikationsmerkmal kann anstelle von 0,0 auch 'false' (falsch) und anstelle von 1,0 auch 'true' (wahr) zurückgeben.
- Bereich Wert
- Die Klassifikation basiert auf den in einer Spalte gefundenen Datenwerten. Abhängig davon, ob der Wert mit der Klasse übereinstimmt, gibt das Klassifikationsmerkmal 'true' oder 'false' zurück. Nach der Auswertung aller Werte entspricht der Prozentsatz der Werte einer Spalte, die nicht Null sind und die mit der Datenklasse übereinstimmen, der Konfidenz der Datenklasse für die Spalte.
Zusätzlich zur Konfidenz wird die Priorität der Datenklasse berücksichtigt, wenn Datenklassen zugeordnet werden. Sofern in den Datenklassendetailsnicht anders angegeben, ist die Standardpriorität für Datenklassen mit dem übereinstimmenden Bereich Wert 10. Für Datenklassen mit dem übereinstimmenden Bereich Spalteist die Standardpriorität 0.
Jede vordefinierte Datenklasse verwendet einen bestimmten Typ von Klassifikationsmerkmal, um die Klassifikationslogik anzuwenden:
- Ein Java-Klassifikationsmerkmal kann den Spaltennamen oder die Datenwerte einer Spalte auswerten, um die Datenklasse (Bereich Spalte) zu bestimmen.
- Ein Regex-Klassifikationsmerkmal wertet die Datenwerte einer Spalte aus, indem ein regulärer Ausdruck angewendet wird, um festzustellen, ob der jeweilige Wert zur Datenklasse (Bereich Wert) gehört.
- Ein auf einer Werteliste basierendes Klassifikationsmerkmal wertet die Datenwerte einer Spalte auf der Basis einer vorgegebenen Liste mit gültigen Werten aus, um die Datenklasse zu ermitteln (Bereich Wert).
Weitere Informationen zu Bereichen, Klassifikationsmerkmalen und Übereinstimmungskriterien finden Sie unter Daten abgleichen.
Details der einzelnen Datenklassen
Im Folgenden finden Sie den Klassifikationstyp und den Bereich, die Auswertungskriterien sowie ein Beispiel für jede vordefinierte Datenklasse.
Kontonummer
Bereich
Wert
Übereinstimmungskriterien
RegularExpression: .
Filter für Spaltennamen: ^acc(ount)?([ _\-])?(num(ber)?|id|no(\.)?){1}$
Beispieldatenwert
123456
Address Line 1
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.AddressLineClassifier
Datentyp: string
Mindestlänge der Daten: 4
Maximale Länge der Daten: 100
Filter für Spaltennamen: addr.{0,15}(1|one)$
Standardpriorität: 12
Beispieldatenwert
Address Line 2
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.AddressLineClassifier
Datentyp: string
Mindestlänge der Daten: 4
Maximale Länge der Daten: 100
Filter für Spaltennamen: addr.{0,15}(2|two)$
Standardpriorität: 12
Beispieldatenwert
Address Line 3
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.AddressLineClassifier
Datentyp: string
Mindestlänge der Daten: 4
Maximale Länge der Daten: 100
Filter für Spaltennamen: addr.{0,15}(3|three)$
Standardpriorität: 12
Beispieldatenwert
Hinweis: Sie müssen die Datenklassennamen exakt angeben. Im Falle der
Address Line 3
Klassenname, zwischen Address
und Line
sind zwei Leerzeichen vorhanden
Airport Code
Bereich
Wert
Übereinstimmungskriterien
Liste der Flughafencodes; Groß-/Kleinschreibung muss beachtet werden
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 3
Beispieldatenwert
Alabama State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}\d{6}$|^\d{7}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 7
Beispieldatenwert
1234567
Alaska State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{7}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 7
Beispieldatenwert
1234567
Alberta Province Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{6}[-]?\d{3}$
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 10
Beispieldatenwert
123456-123
American Express Card
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.AMEXClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 16
Maximale Länge der Daten: 18
Beispieldatenwert
3400-000000-00009
Arizona State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[abdyABDY]\d{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A12345678
Arkansas State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{9}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
012345678
BIC
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.BICClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 9
Beispieldatenwert
DEUTDEDBDUE
Boolesch
Bereich
Wert
Übereinstimmungskriterien
Liste der Werte: 0, 1, True, False, Yes, No
Datentyp: numerisch oder Zeichenfolge
Standardpriorität: 16
Beispieldatenwert
Ja
British Columbia Province Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{7}$
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 7
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
1234567
California State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}[0-9]{7}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 8
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
C1234567
Canada Post Code
Bereich
Wert
Übereinstimmungskriterien
RegularExpression: ^[A-Z]\d[A-Z][ \-]?\d[A-Z]\d$
Datentyp: string
Mindestlänge der Daten: 6
Maximale Länge der Daten: 6
Beispieldatenwert
H3A 0B1
Canada Province Code
Bereich
Wert
Übereinstimmungskriterien
Liste der Codes für kanadische Provinzen; Groß-/Kleinschreibung muss beachtet werden
Datentyp: Zeichenfolge
Mindestdatenlänge: 2
Maximale Datenlänge: 2
Standardpriorität: 14
Beispieldatenwert
QC
Canada Province Name
Bereich
Wert
Übereinstimmungskriterien
Liste der Namen von Provinzen in Kanada; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestdatenlänge: 2
Maximale Datenlänge: 25
Standardpriorität: 12
Beispieldatenwert
Quebec
Canadian Social Insurance Number (SIN)
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.CanadianSINClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 20
Beispieldatenwert
046-454-286
Ort
Bereich
Wert
Übereinstimmungskriterien
Liste der Ortsnamen; von der Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestdatenlänge: 2
Maximale Datenlänge: 58
Standardkonfidenzschwellenwert: 50%
Standardpriorität: 7
Beispieldatenwert
Los Angeles
Code erstellen
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.CodeClassifier
Standardpriorität: -10
Beispieldatenwert
Colorado State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: (?:(^[0-9]{2}\-?[0-9]{3}\-?[0-9]{4}$)|(^[a-zA-Z]{1}[0-9]{3,6}$))
Datentyp: Zeichenfolge
Mindestlänge der Daten: 4
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
12-345-2222
Farbe
Bereich
Wert
Übereinstimmungskriterien
Liste mit Farben; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 41
Beispieldatenwert
Blau
Commercial and Government Entity Code
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.CAGECodeClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 5
Maximale Datenlänge: 5
Filter für Spaltenname : cage|fscm|nscm|entity|code
Beispieldatenwert
1ASDY
Computer Host Name
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.HostNameClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 4
Maximale Datenlänge: 255
Beispieldatenwert
www.example.com
Connecticut State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
RegularExpression: ' ^[0-9]{9}$
'
Datentyp: numerisch, String
Datenmindestlänge: 9
Datenhöchstlänge: 9
Spaltennamenfilter: ' d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456789
Country Code
Bereich
Wert
Übereinstimmungskriterien
Liste der Landescodes; Groß-/Kleinschreibung muss beachtet werden
Datentyp: Zeichenfolge
Mindestdatenlänge: 2
Maximale Datenlänge: 3
Standardpriorität: 13
Beispieldatenwert
:NONE.
Country Name
Bereich
Wert
Übereinstimmungskriterien
Liste der Landesnamen; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestdatenlänge: 2
Maximale Datenlänge: 50
Standardpriorität: 12
Beispieldatenwert
India
Credit Card Expiration Date
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.CreditCardExpDateAndValidationNumberClassifier
Beispieldatenwert
12/2018
Kreditkartennummer
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.CreditCardClassifier
Datentyp: numeric, string
Mindestlänge der Daten: 13
Maximale Länge der Daten: 20
Beispieldatenwert
4146 6643 9004 5458
Credit Card Validation Number
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.CreditCardExpDateAndValidationNumberClassifier
Beispieldatenwert
1234
Währung
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.CurrencyClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Datenlänge: 25
Beispieldatenwert
$12,345.67
Current Procedural Terminology
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.CPTClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 5
Maximale Datenlänge: 5
Filter für Spaltenname: CPT|medical procedure code|medical procedure|medicalcode|current procedural terminology
Beispieldatenwert
Customer Number
Bereich
Wert
Übereinstimmungskriterien
RegularExpression: .
Filter für Spaltennamen: ^cust(omer)?([ _\-])?(num(ber)?|id|no(\.)?){1}$
Beispieldatenwert
3141596
Datum
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.DateTimeClassifier
Beispieldatenwert
12-30-2015
Date of Birth
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.DOBClassifier
Filter für Spaltenname: dob$|birth(day)?|geburtsdatum|na(issance|cimiento|scita)|urodzenia|(生ま(れた日)?|誕生日)|出生(年月)?
Beispieldatenwert
12-30-2015
Delaware State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
RegularExpression: ^[0-9]{1,7}$
Datentyp: numeric, string
Mindestlänge der Daten: 1
Maximale Länge der Daten: 7
Filter für Spaltennamen: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
1234567
Diners Club Card
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.DinersClubClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 15
Maximale Datenlänge: 18
Beispieldatenwert
5520111111111121
Discover Card
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.DiscoverClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 17
Maximale Datenlänge: 18
Beispieldatenwert
6220264390045758
Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[ a-zA-Z0-9*-]{1,19}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 1
Maximale Datenlänge: 19
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
1234567
DUNS
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^(\d{2})([ \-]?)(\d{3})([ \-]?)(\d{4})$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: duns|universal number|universal_number
Beispieldatenwert
12-345-6789
E-Mail-Adresse
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.EmailClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 6
Maximale Länge der Daten: 254
Beispieldatenwert
Employment Status
Bereich
Wert
Übereinstimmungskriterien
Liste mit Angaben zum Beschäftigungsstatus; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 50
Beispieldatenwert
employee
Ethnicity
Bereich
Wert
Übereinstimmungskriterien
Liste ethnischer Zugehörigkeiten; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 22
Beispieldatenwert
Hispanic
Eye Color
Bereich
Wert
Übereinstimmungskriterien
Liste mit Augenfarben; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 14
Filter für Spaltenname : eye|eye_color|eyecolor
Beispieldatenwert
Hazel
Vorname
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.GNMFirstNameClassifier
Datentyp: string
Filter für Spaltennamen: ^(?i)(given|f(irst)?)([ _.\-])?name$
Standard-Konfidenzschwelle: 50%
Standardpriorität: 10
Beispieldatenwert
James
Florida State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}[0-9]{3}\-[0-9]{3}\-[0-9]{2}\-[0-9]{3}\-[0-1]{1}$|^[a-zA-Z]{1}[0-9]{12}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 13
Maximale Länge der Daten: 17
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
X123-123-33-229-0
Fortune 1000 Company
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.Fortune1000Classifier
Datentyp : Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 50
Beispieldatenwert
French INSEE Number
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.FranceINSEEClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 15
Maximale Länge der Daten: 15
Beispieldatenwert
151022A10204375
Geschlecht
Bereich
Wert
Übereinstimmungskriterien
Liste von Werten: M, F, Männlich, Weiblich
Datentyp: Zeichenfolge
Mindestdatenlänge: 1
Maximale Datenlänge: 6
Standardpriorität: 16
Beispieldatenwert
F
Geographic Coordinates
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.GeographicCoordinatesClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 44
Beispieldatenwert
49° 13" N; 1°10’00.012" E
Georgia State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[0-9]{7,9}$
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123-45-6789
Germany Vehicle Registration Number
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.GermanyCarClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 4
Maximale Länge der Daten: 9
Beispieldatenwert
BB-XY1066
Hair Color
Bereich
Wert
Übereinstimmungskriterien
Liste mit Haarfarben; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 14
Filter für Spaltenname: hair|hair_color|haircolor
Beispieldatenwert
Black
Hawaii State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[hH]{1}[0-9]{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
H12345678
Health Insurance Claim Number
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.HICNClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 6
Maximale Länge der Daten: 15
Beispieldatenwert
WD-000-00-0000
Hobby/Leisure Activity
Bereich
Wert
Übereinstimmungskriterien
Liste mit Hobbys; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 38
Filter für Spaltenname: hobb(y$|ies$)|leisure([ _])activit(y$|ies$)
Beispieldatenwert
Tennis
Titel
Bereich
Wert
Übereinstimmungskriterien
Liste mit Titeln; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 1
Maximale Länge der Daten: 38
Beispieldatenwert
Mr
IBAN
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.IBANClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 14
Maximale Länge der Daten: 42
Beispieldatenwert
GB87 BARC 2065 8244 9716 55
ICD-10
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.ICD10Classifier
Mindestlänge der Daten: 3
Maximale Länge der Daten: 7
Beispieldatenwert
D36.7
Idaho State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{2}[0-9]{6}[a-zA-Z]{1}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
AA123456X
Identifier
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.IdentifierClassifier
Standardpriorität: -10
Beispieldatenwert
Illinois State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}[0-9]{3}\-[0-9]{4}\-[0-9]{4}$|^[a-zA-Z]{1}[0-9]{11}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 12
Maximale Datenlänge: 14
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A123-4567-8999
INCO Terms (International Commercial Terms)
Bereich
Wert
Übereinstimmungskriterien
Liste mit INCO-Begriffen; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Datenlänge: 3
Beispieldatenwert
FCA
Indiana State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[0-9]{4}\-[0-9]{2}\-[0-9]{4}$|^[a-zA-Z]{1}[0-9]{9}$|^[0-9]{10}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 10
Maximale Datenlänge: 12
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
1234-56-7890
Indicator
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.IndicatorClassifier
Standardpriorität: -10
Beispieldatenwert
Individual Taxpayer Identification Number (ITIN)
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^(9\d{2})([ \-]?)(?!93|89)([789][0-9])([ \-]?)(\d{4})$
Mindestlänge der Daten: 9
Maximale Datenlänge: 11
Filter für Spaltenname: itin|tax
Beispieldatenwert
913-72-2222
International Mobile Equipment Identity (IMEI)
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.IMEINumberClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 15
Maximale Datenlänge: 15
Filter für Spaltenname: imei
Beispieldatenwert
490154203237518
International Securities Identification Number (ISIN)
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.ISINClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 10
Maximale Datenlänge: 20
Beispieldatenwert
GB0002634946
International Standard Book Number (ISBN)
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.ISBNClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 10
Maximale Datenlänge: 20
Beispieldatenwert
978 0 306 40615 7
International Standard Industrial Classification
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.ISICClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 5
Maximale Datenlänge: 5
Filter für Spaltenname: ^(unsic)$|^(isic)$|^((industr(ial|ies|y))[ ._-]?(code))$
Beispieldatenwert
C3319
Internet Protocol Address
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\s*(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\s*$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 7
Maximale Datenlänge: 15
Beispieldatenwert
127.127.127.002
Internet Protocol Version 6 Address
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\s*((([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:))|(([0-9A-Fa-f]{1,4}:){6}(:[0-9A-Fa-f]{1,4}|((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){5}(((:[0-9A-Fa-f]{1,4}){1,2})|:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4}){1,3})|((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){1,4})|((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){1,5})|((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){1,6})|((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(:(((:[0-9A-Fa-f]{1,4}){1,7})|((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:)))(%.+)?\s*$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Datenlänge: 39
Beispieldatenwert
fe80:0:0:0:204:61ff:fe9d:f156
Iowa State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[0-9]{3}[a-zA-Z]{2}[0-9]{4}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123XX4567
Ireland Eircode
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[ACD-FHKNPRTV-Y]\d[\dW][ \-]?[\dACD-FHKNPRTV-Y]{4}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 7
Maximale Datenlänge: 8
Beispieldatenwert
D02 NY52
ISO 3166-2 Code
Bereich
Wert
Übereinstimmungskriterien
Liste mit Codes für Bundesstaaten und Provinzen nach ISO 3166-2; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 4
Maximale Länge der Daten: 6
Beispieldatenwert
IN-KA
Italian Fiscal Code
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([A-Z]{3})([ \-]?)([A-Z]{3})\2([0-9L-NP-V]{2})([A-EHLMPRST])([0-9LNP-V]{2})\2([A-ILMZ][0-9L-NP-V]{3})([A-Z])$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 16
Maximale Länge der Daten: 16
Beispieldatenwert
MRTMTT25D09F205Z
Japan Credit Bureau (JCB)
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.JapanCBClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 17
Maximale Länge der Daten: 18
Beispieldatenwert
35283095185620637
Kansas State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[kK]{1}[0-9]{2}\-[0-9]{2}\-[0-9]{4}$|^[kK]{1}[0-9]{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
K94-12-3456
Kentucky State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}[0-9]{2}\-[0-9]{3}\-[0-9]{3}$|^[a-zA-Z]{1}[0-9]{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A23-145-678
Language Code or Name
Bereich
Wert
Übereinstimmungskriterien
Liste mit Sprachen; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 37
Filter für Spaltenname: lang|locale|language
Beispieldatenwert
EN
Last Name
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.GNMLastNameClassifier
Datentyp: string
Filter für Spaltennamen: ^l(ast)?([ \-_])?name$|^surname$|^family(([ \-_])?)name$
Standard-Konfidenzschwelle: 50%
Standardpriorität: 7
Beispieldatenwert
Schmidt
Breitengrad
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.LatitudeClassifier
Datentyp: numeric, string
Mindestlänge der Daten: 1
Maximale Länge der Daten: 20
Filter für Spaltennamen: ^lat$|^lat_|_lat$|latitud(ine|e|o)?|breitengrad|breddekreds|breedtegraad|breiddegrad|breiddargráða|enlem|πλάτος|широт(ы|a)|קו רוחב|عرض جغرافي|緯度|纬度
Beispieldatenwert
49° 13"
Gesetzlicher Familienstand/Zivilstand.
Bereich
Wert
Übereinstimmungskriterien
Liste mit Familienständen; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 6
Maximale Länge der Daten: 23
Beispieldatenwert
Einfach
Hinweis: Sie müssen die Datenklassennamen exakt angeben. Im Fall des Klassennamens Legal Marital/Civil Status.
muss am Ende des Namens ein vollständiger Stopp verwendet werden.
Längengrad
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.LongitudeClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 1
Maximale Länder der Daten: 21
Filter für Spaltenname: ^long$|^long_|_long$|longitud(ine|e|o)?|längengrad|laengengrad|længdekreds|laengdekreds|lengtegraad|lengdegrad|lengdargráða|boylam|μήκος|долгот(ы|a)|קו אורך|طول جغرافي|経度|经度
Beispieldatenwert
1°10’00.012" E
Louisiana State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^00[0-9]{7}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
003456789
Mac Address
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^(?:[0-9A-Fa-f]{2}([:-]))(?:[0-9A-Fa-f]{2}\1){4}[0-9A-Fa-f]{2}$|(?:^([0-9A-Fa-f]{4}\.){2}[0-9A-Fa-f]{4}$
Mindestlänge der Daten: 14
Maximale Länge der Daten: 17
Beispieldatenwert
12:34:56:78:9F
Maine State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[0-9]{7}$
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 7
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
1234567
Manitoba Province Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{9}$
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456789
Maryland State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}\-[0-9]{3}\-[0-9]{3}\-[0-9]{3}\-[0-9]{3}$|^[a-zA-Z]{1}[0-9]{12}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 13
Maximale Länge der Daten: 17
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A-123-456-789-999
Massachusetts State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[sS]{1}[0-9]{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
S12345678
Master Card
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.MasterCardClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 17
Maximale Länge der Daten: 18
Beispieldatenwert
5285696282092972
Michigan State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}\d{12}$|^[a-zA-Z]{1} [0-9]{3} [0-9]{3} [0-9]{3} [0-9]{3}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 13
Maximale Länge der Daten: 17
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A012345678912
Middle Name
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.GNMFirstNameClassifier
Datentyp: string
Filter für Spaltennamen: ^m(iddle)?([ _.\-])?name$
Standard-Konfidenzschwelle: 50%
Standardpriorität: 10
Beispieldatenwert
James
Minnesota State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}\d{12}$|^[a-zA-Z]{1}-[0-9]{3}-[0-9]{3}-[0-9]{3}-[0-9]{3}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 13
Maximale Länge der Daten: 17
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A012345678912
Missouri State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{9}$|^[a-zA-Z]{1}[0-9]{5,9}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 6
Maximale Länge der Daten: 10
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
012345678
Montana State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{9}$|^\d{13}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 13
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
0123456789123
Monat
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.MonthClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 1
Maximale Länge der Daten: 10
Beispieldatenwert
Januar
Name Suffix
Bereich
Wert
Übereinstimmungskriterien
Liste mit Namenssuffixen; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 16
Beispieldatenwert
PhD
Nebraska State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}[0-9]{3,8}$
Datentyp: Zeichenfolgel
Mindestlänge der Daten: 4
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
C12345678
Nevada State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[xX]{1}\d{8}$|^\d{10}$|^\d{12}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 12
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
0123456789
New Brunswick Province Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[0-9]{1,7}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 1
Maximale Länge der Daten: 7
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
0123456
New Hampshire State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{2}[a-zA-Z]{3}\d{5}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 10
Maximale Länge der Daten: 10
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
01ABC56789
New Jersey State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}\d{14}$|^[a-zA-Z]{1}\d{4} \d{5} \d{5}$|^[a-zA-Z]{1}\d{4}-\d{5}-\d{5}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 15
Maximale Länge der Daten: 17
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A01234567891234
New Mexico State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{9}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
012345678
New York State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{9}$|^[a-zA-Z]{1}\d{18}$|^\d{3} \d{3} \d{3}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 19
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
012345678
Newfoundland and Labrador Province State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}\d{9}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 10
Maximale Länge der Daten: 10
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A012345678
NoClassDetected
Bereich
Übereinstimmungskriterien
Weder der Spaltenname noch die Spaltenwerte stimmen mit einer der verfügbaren Datenklassen überein.
Beispieldatenwert
North Carolina State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[0-9]{1,12}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 1
Maximale Länge der Daten: 12
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456789999
North Dakota State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{3}\-[0-9]{2}\-[0-9]{4}$|^[a-zA-Z]{3}[0-9]{6}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
XYZ-11-2222
Nova Scotia Province Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{2}[0-9]{6}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 8
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
XY123456
Ohio State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{2}[0-9]{6}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 8
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
XY123456
Oklahoma State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{1}[0-9]{9}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
X123456789
Ontario Province Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([a-zA-Z]{1}\d{4})([-]?)(\d{5})\2(\d{5})$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 15
Maximale Länge der Daten: 17
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A1234-56123-99999
Oregon State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{1,9}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 1
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
012345678
Organization Name
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.GNMOrganizationClassifier
Datentyp: string
Standard-Konfidenzschwelle: 60%
Standardpriorität: 7
Beispieldatenwert
IBM
Passport Number
Bereich
Wert
Übereinstimmungskriterien
RegularExpression: ^[A-Z0-9<]{9}[0-9]{1}[A-Z]{3}[0-9]{7}[A-Z]{1}[0-9]{7}[A-Z0-9<]{14}[0-9]{2}$
Datentyp: string
Mindestlänge der Daten: 6
Maximale Länge der Daten: 254
Beispieldatenwert
L898902C<3UTO6908061F9406236ZE184226B<<<<<14
Pennsylvania State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{8}$|^\d{2} \d{3} \d{3}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 10
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
01234567
Prozentsatz
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\(?[+-]? ?[0-9]{1,10}[,.]?[0-9]{0,10} ?(%|percent|pct)\)?$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 25
Beispieldatenwert
45%
Person Name
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.GNMFullNameClassifier
Datentyp: string
Filter für Spaltennamen: _?name|नाम|名称|nom|nome|όνομα|nomine|имя|이름|име|naam
Standard-Konfidenzschwelle: 50%
Standardpriorität: 7
Beispieldatenwert
John Doe
Political Party
Bereich
Wert
Übereinstimmungskriterien
Liste mit politischen Parteien; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 99
Filter für Spaltenname : politic
Beispieldatenwert
PDP
Prince Edward Island Province State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{6}$
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 6
Maximale Länge der Daten: 6
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456
Quantity
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.QuantityClassifier
Standardpriorität: -10
Beispieldatenwert
100
Quebec Province Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([a-zA-Z]{1}\d{4})([-]?)(\d{6})(\2)(\d{2})$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 13
Maximale Länge der Daten: 15
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A1234-222222-00
Beziehung
Bereich
Wert
Übereinstimmungskriterien
Liste der Beziehungstypen; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 26
Beispieldatenwert
Friendship
Religion
Bereich
Wert
Übereinstimmungskriterien
Liste mit Religionen; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 3
Maximale Länge der Daten: 19
Beispieldatenwert
Christian
Rhode Island State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{7}$|^[vV]{1}\d{6}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 7
Beispieldatenwert
0123456
Routing Transit Number
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.RTNClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 9
Beispieldatenwert
121000358
Saskatchewan Province State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 8
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
12345678
South Carolina State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{9}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456789
South Dakota State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([\-\.]?)(\d{2})\2(\d{4})$|^\d{6}$|^\d{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 6
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456
Spanish Fiscal Identification Number
Bereich
Wert
Übereinstimmungskriterien
RegularExpression: (X?)[ \-]?(\d{7})[ \-]?([A-HJ-NP-TV-Z])
Datentyp: string
Mindestlänge der Daten: 8
Maximale Länge der Daten: 11
Beispieldatenwert
3124124N
State/Province Name
Bereich
Wert
Übereinstimmungskriterien
Liste mit Namen von Bundesländern und Provinzen; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 43
Beispieldatenwert
San Salvador
Temperatur
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.TemperatureClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 25
Beispieldatenwert
20°C
Tennessee State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{8,9}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456789
Texas State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 8
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
12345678
Text
Bereich
Spalte
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.TextClassifier
Standardpriorität: -10
Beispieldatenwert
Put your TV viewing into overdrive with scenes that jump off your screen when you add 3D HDTVs to your home-theater system.
UK National Insurance Number
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([A-CEGHJ-PR-TW-Z][A-CEGHJ-NPR-TW-Z])([ \-\.]?)(\d{2})\2?(\d{2})\2?(\d{2})(\2([ABCD]))?$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 13
Beispieldatenwert
CA 123456 A
UK Post Code
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[A-Z][A-Z]?\d[A-Z\d]?[ \-]?\d[ABD-HJLNP-UW-Z]{2}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 5
Maximale Länge der Daten: 8
Beispieldatenwert
L1 8LW
UK Province Code
Bereich
Wert
Übereinstimmungskriterien
Liste mit Codes für britische Provinzen; Groß-/Kleinschreibung muss beachtet werden
Datentyp: Zeichenfolge
Mindestlänge der Daten: 2
Maximale Länge der Daten: 3
Beispieldatenwert
HAW
Uniform Resource Locator
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.URLClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 10
Maximale Länge der Daten: 1000
Beispieldatenwert
Universal Product Code (UPC)
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.UPCClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 12
Maximale Länge der Daten: 12
Beispieldatenwert
123456789999
US County
Bereich
Wert
Übereinstimmungskriterien
Liste der US-Bezirksnamen; von der Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestdatenlänge: 3
Maximale Datenlänge: 35
Standardpriorität: 8
Beispieldatenwert
Adams
US Employer Identification Number
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^(0[1-6]|1[0-6]|2[0-7]|[35][0-9]|[468][0-8]|7[1-7]|9[0-589])[ \-]?\d{7}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 10
Filter für Spaltenname: EMPLOYER|EIN
Beispieldatenwert
99-1234567
US National Drug Code
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.USNDCClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 10
Maximale Länge der Daten: 20
Filter für Spaltenname: DRUG|NDC
Beispieldatenwert
1234-5678-90
US Phone Number
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^(\+?1\s*[-\/\.]?)?(\((\d{3})\)|(\d{3}))\s*[-\/\.]?\s*(\d{3})\s*[-\/\.]?\s*(\d{4})\s*(([xX]|[eE][xX][tT])\.?\s*(\d+))*$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 16
Beispieldatenwert
1 (234) 567-8901
US Social Security Number
Bereich
Wert
Übereinstimmungskriterien
b>RegularExpression:** ' ^([1-578]\d{2}|0[1-9]\d|00[1-9]|6[0-57-9]\d|66[0-57-9])([ \-\.]?)([1-9]\d|0[1-9])\2([1-9]\d{3}|0[1-9]\d{2}|00[1-9]\d|000[1-9])$
'
Datentyp: numerisch, String
Datenmindestlänge: 9
Datenhöchstlänge: 11
Beispieldatenwert
123-45-6789
US Social Security Number Last 4
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([1-9]\d{3}|0[1-9]\d{2}|00[1-9]\d|000[1-9])$
Mindestlänge der Daten: 4
Maximale Länge der Daten: 4
Filter für Spaltenname: ssn(4)?$|(ssn|social(.?security)?|socsec)(.*4)?
Beispieldatenwert
US Standard Industrial Classification
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.USSICClassifier
Mindestlänge der Daten: 3
Maximale Länge der Daten: 4
Filter für Spaltenname : SIC|USSIC|Standard Industrial Classification
Beispieldatenwert
1234
US State Capital Name
Bereich
Wert
Übereinstimmungskriterien
Liste mit den Namen der Hauptstädte amerikanischer Bundesstaaten; von Groß-/Kleinschreibung unabhängig
Datentyp: Zeichenfolge
Mindestlänge der Daten: 5
Maximale Länge der Daten: 14
Beispieldatenwert
Montgomery
US State Code
Bereich
Wert
Übereinstimmungskriterien
Liste der US-Statuscodes; Groß-/Kleinschreibung muss beachtet werden
Datentyp: Zeichenfolge
Mindestdatenlänge: 2
Maximale Datenlänge: 2
Standardpriorität: 14
Beispieldatenwert
DE
US State Name
Bereich
Wert
Übereinstimmungskriterien
Liste der Namen der US-Bundesstaaten ohne Beachtung der Groß-/Kleinschreibung
Datentyp: Zeichenfolge
Mindestlänge der Daten: 4
Maximale Datenlänge: 20
Standardpriorität: 12
Beispieldatenwert
Massachusetts
US Street Name
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.StreetClassifier
Datentyp: Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 50
Beispieldatenwert
8475 NW St
US Zip Code
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.USZipCodeClassifier
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 5
Maximale Länge der Daten: 10
Beispieldatenwert
02201-1020
Utah State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
RegularExpression: ^\d{4,9}$
Datentyp: numeric, string
Mindestlänge der Daten: 4
Maximale Länge der Daten: 9
Filter für Spaltennamen: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456789
Vehicle Identification Number (VIN)
Bereich
Wert
Übereinstimmungskriterien
Java-Klasse: com.ibm.infosphere.classification.impl.VehicleIdNumber
Datentyp: Zeichenfolge
Mindestlänge der Daten: 17
Maximale Länge der Daten: 17
Beispieldatenwert
1JCCM85E5BT001312
Vermont State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{8}$|^\d{7}A$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 8
Maximale Länge der Daten: 8
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
1234567A
Virginia State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([\-\.]?)(\d{2})\2(\d{4})$|^[A-Za-z]{1}\d{8}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 9
Maximale Länge der Daten: 11
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A12345678
VISA Card
Bereich
Wert
Übereinstimmungskriterien
b>Java-Klasse:** com.ibm.infosphere.classification.impl.VisaClassifier
Datentyp: numerisch, String
Minimale Datenlänge: 17
Maximale Datenlänge: 18
Beispieldatenwert
4024007121595481
Washington DC State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{7}$|^\d{9}$
Datentyp: numerisch, Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 9
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
1234567
Washington State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^(?=.*[A-Za-z]{2})([a-zA-Z]{2}[A-Za-z*]{5}\d{3}[A-Za-z0-9]{2})$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 12
Maximale Länge der Daten: 12
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
DOE**MJ501A1
West Virginia State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}\d{6}$|^\d{7}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 7
Maximale Länge der Daten: 7
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
A123456
Wisconsin State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^[a-zA-Z]{1}\d{3}-\d{4}-\d{4}-\d{2}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 17
Maximale Länge der Daten: 17
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
Z123-1234-5678-12
Wyoming State Driver’s License
Bereich
Wert
Übereinstimmungskriterien
Regulärer Ausdruck: ^\d{6}-\d{3}$
Datentyp: Zeichenfolge
Mindestlänge der Daten: 10
Maximale Länge der Daten: 10
Filter für Spaltenname: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
Beispieldatenwert
123456-123
Übergeordnetes Thema: Vordefinierte Datenklassen