在资产级别和列级别分配数据类。
在资产级别,分配的数据类表示通过分析选择或手动选择作为列最佳匹配项的数据类。
在列级别,数据类会根据数据类定义,基于列名(列范围)或列数据(值范围)进行分配:
- 列范围
- 仅通过解析和分析列名进行分类,即,仅基于元数据进行分类。 根据该列与该数据类匹配的程度,分类器会返回介于 0.0 与 1.0 之间的置信度值,其中 0.0 表示不匹配,1.0 表示完美匹配。 或者,分类器可以返回 false 代替 0.0,返回 true 代替 1.0。
- 值范围
- 通过分析在列中找到的数据值进行分类。 根据该值是否与该类匹配,分类器会返回 true 或 false。 对所有的值进行评估时,与该数据类匹配的列非空值所占的百分比表示该数据类对于该列的置信度。
除置信度外,在分配数据类时还会考虑数据类的优先级。 除非在 数据类详细信息中另有说明,否则具有匹配作用域 value 的数据类的缺省优先级为 10。 对于具有匹配作用域 column的数据类,缺省优先级为 0。
每个预定义数据类都使用特定类型的分类器来应用分类逻辑:
- Java 分类器可以评估列的列名或数据值,以确定数据类(列范围)。
- 正则表达式分类器通过应用正则表达式来评估列的数据值,以确定每个值是否属于该数据类(值范围)。
- 值列表分类器根据给定的有效值列表来评估列的数据值,以确定数据类(值范围)。
有关范围、分类器和匹配条件的更多信息,请参阅匹配数据。
每个数据类的详细信息
查找每个预定义数据类的分类类型及范围、评估条件和示例。
帐号
作用域
值
匹配条件
RegularExpression: .
列名过滤器: ^acc(ount)?([ _\-])?(num(ber)?|id|no(\.)?){1}$
样本数据值
123456
地址行 1
作用域
列
匹配条件
Java 类: com.ibm.infosphere.classification.impl.AddressLineClassifier
数据类型 string
数据最小长度: 4
数据最大长度: 100
列名过滤器: addr.{0,15}(1|one)$
默认优先级: 12
样本数据值
地址行 2
作用域
列
匹配条件
Java 类: com.ibm.infosphere.classification.impl.AddressLineClassifier
数据类型 string
数据最小长度: 4
数据最大长度: 100
列名过滤器: addr.{0,15}(2|two)$
默认优先级: 12
样本数据值
地址行 3
作用域
列
匹配条件
Java 类: com.ibm.infosphere.classification.impl.AddressLineClassifier
数据类型 string
数据最小长度: 4
数据最大长度: 100
列名过滤器: addr.{0,15}(3|three)$
默认优先级: 12
样本数据值
注: 必须精确指定数据类名。 如
Address Line 3
类名,在 Address
和 Line
之间存在两个空格。
机场代码
作用域
值
匹配条件
机场代码列表; 区分大小写
数据类型: string
数据最小长度: 3
数据最大长度: 3
样本数据值
阿拉巴马州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}\d{6}$|^\d{7}$
数据类型 string
数据最小长度: 7
数据最大长度: 7
样本数据值
1234567
阿拉斯加州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{7}$
数据类型 string
数据最小长度: 7
数据最大长度: 7
样本数据值
1234567
阿尔伯塔省驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{6}[-]?\d{3}$
数据类型 numeric, string
数据最小长度: 9
数据最大长度: 10
样本数据值
123456-123
American Express 卡
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.AMEXClassifier
数据类型: 数字,字符串
数据最小长度: 16
数据最大长度: 18
样本数据值
3400-000000-00009
亚利桑那州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[abdyABDY]\d{8}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A12345678
阿肯色州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{9}$
数据类型 string
数据最小长度: 9
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
012345678
BIC
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.BICClassifier
数据类型: string
数据最小长度: 9
数据最大长度: 9
样本数据值
DEUTDEDBDUE
布尔值
作用域
值
匹配条件
值列表: 0 , 1 , True , False , Yes , No
数据类型: 数字或字符串
缺省优先级: 16
样本数据值
是
不列颠哥伦比亚省驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{7}$
数据类型 numeric, string
数据最小长度: 7
数据最大长度: 7
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
1234567
加利福尼亚州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}[0-9]{7}$
数据类型 string
数据最小长度: 8
数据最大长度: 8
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
C1234567
加拿大邮政编码
作用域
值
匹配条件
RegularExpression: ^[A-Z]\d[A-Z][ \-]?\d[A-Z]\d$
数据类型 string
数据最小长度: 6
数据最大长度: 6
样本数据值
H3A 0B1
加拿大省代码
作用域
值
匹配条件
加拿大省代码列表; 区分大小写
数据类型: string
数据最小长度: 2
数据最大长度: 2
缺省优先级: 14
样本数据值
QC
加拿大省名
作用域
值
匹配条件
加拿大省名称列表; 不区分大小写
数据类型: string
数据最小长度: 2
数据最大长度: 25
缺省优先级: 12
样本数据值
Quebec
加拿大社会保障号 (SIN)
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:20
样本数据值
046-454-286
城市
作用域
值
匹配条件
城市名称的列表; 不区分大小写的
数据类型: string
数据最小长度: 2
数据最大长度: 58
缺省置信度阈值: 50%
缺省优先级: 7
样本数据值
Los Angeles
代码
作用域
列
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*默认优先级:-10
样本数据值
科罗拉多州驾驶证
作用域
值
匹配条件
RegularExpression: (?:(^[0-9]{2}\-?[0-9]{3}\-?[0-9]{4}$)|(^[a-zA-Z]{1}[0-9]{3,6}$))
数据类型 string
数据最小长度: 4
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
12-345-2222
颜色
作用域
值
匹配条件
颜色列表; 不区分大小写的
数据类型: string
数据最小长度: 3
数据最大长度: 41
样本数据值
Blue
商业和政府机构代码
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.CAGECodeClassifier
数据类型 string
数据最小长度: 5
数据最大长度: 5
列名过滤器: cage|fscm|nscm|entity|code
样本数据值
1ASDY
计算机主机名
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:
*数据最小长度:
*数据最大长度:255
样本数据值
www.example.com
康涅狄格州驾驶证
作用域
值
匹配条件
RegularExpression:'^[0-9]{9}$
'
数据类型:数字、字符串
数据最小长度:9 '
数据最大长度:9
列名筛选器:'d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456789
国家或地区代码
作用域
值
匹配条件
国家或地区代码列表; 区分大小写
数据类型: string
数据最小长度: 2
数据最大长度: 3
缺省优先级: 13
样本数据值
USA
国家或地区名称
作用域
值
匹配条件
国家或地区名称列表; 不区分大小写的
数据类型: string
数据最小长度: 2
数据最大长度: 50
缺省优先级: 12
样本数据值
India
信用卡截止日期
作用域
列
匹配条件
Java 类:com.ibm.infosphere.classification.impl.CreditCardExpDateAndValidationNumberClassifier
样本数据值
12/2018
信用卡号
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:
*
样本数据值
4146 6643 9004 5458
信用卡验证号
作用域
列
匹配条件
Java 类:com.ibm.infosphere.classification.impl.CreditCardExpDateAndValidationNumberClassifier
样本数据值
1234
货币
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:
*数据最小长度:
*数据最大长度:25
样本数据值
$12,345.67
通用医疗术语
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.CPTClassifier
数据类型: string
数据最小长度: 5
数据最大长度: 5
列名过滤器: CPT|medical procedure code|medical procedure|medicalcode|current procedural terminology
样本数据值
客户号
作用域
值
匹配条件
RegularExpression: .
列名过滤器: ^cust(omer)?([ _\-])?(num(ber)?|id|no(\.)?){1}$
样本数据值
3141596
日期
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.DateTimeClassifier
样本数据值
12-30-2015
出生日期
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.DOBClassifier
列名过滤器: dob$|birth(day)?|geburtsdatum|na(issance|cimiento|scita)|urodzenia|(生ま(れた日)?|誕生日)|出生(年月)?
样本数据值
12-30-2015
特拉华州驾驶证
作用域
值
匹配条件
RegularExpression: ^[0-9]{1,7}$
数据类型 numeric, string
数据最小长度: 1
数据最大长度: 7
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
1234567
Diners Club 卡
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:18
样本数据值
5520111111111121
Discover 卡
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:18
样本数据值
6220264390045758
驾驶证
作用域
值
匹配条件
RegularExpression: ^[ a-zA-Z0-9*-]{1,19}$
数据类型 string
数据最小长度: 1
数据最大长度: 19
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
1234567
DUNS
作用域
值
匹配条件
RegularExpression: ^(\d{2})([ \-]?)(\d{3})([ \-]?)(\d{4})$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: duns|universal number|universal_number
样本数据值
12-345-6789
电子邮件地址
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:
*数据最小长度:
*数据最大长度:254
样本数据值
就业状况
作用域
值
匹配条件
就业状态列表; 不区分大小写
数据类型: string
数据最小长度: 2
数据最大长度: 50
样本数据值
employee
种族
作用域
值
匹配条件
族裔列表; 不区分大小写
数据类型: string
数据最小长度: 3
数据最大长度: 22
样本数据值
Hispanic
眼睛颜色
作用域
值
匹配条件
眼睛颜色的列表; 不区分大小写的
数据类型: string
数据最小长度: 3
数据最大长度: 14
列名过滤器: eye|eye_color|eyecolor
样本数据值
Hazel
名字
作用域
列
匹配条件
Java 类: com.ibm.infosphere.classification.impl.GNMFirstNameClassifier
数据类型 string
列名过滤器: ^(?i)(given|f(irst)?)([ _.\-])?name$
默认置信阈值: 50%
默认优先级: 10
样本数据值
James
佛罗里达州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}[0-9]{3}\-[0-9]{3}\-[0-9]{2}\-[0-9]{3}\-[0-1]{1}$|^[a-zA-Z]{1}[0-9]{12}$
数据类型 string
数据最小长度: 13
数据最大长度: 17
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
X123-123-33-229-0
财富 1000 强公司
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.Fortune1000Classifier
数据类型: string
数据最小长度: 2
数据最大长度: 50
样本数据值
法国 INSEE 号
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:15
样本数据值
151022A10204375
性别
作用域
值
匹配条件
值列表 :M , F ,男性,女性
数据类型: string
数据最小长度: 1
数据最大长度: 6
缺省优先级: 16
样本数据值
F
地理坐标
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.GeographicCoordinatesClassifier
数据类型 string
数据最小长度: 3
数据最大长度: 44
样本数据值
49° 13" N; 1°10’00.012" E
佐治亚州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[0-9]{7,9}$
数据类型 numeric, string
数据最小长度: 7
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123-45-6789
德国车辆注册号
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:
*数据最小长度:
*数据最大长度:9
样本数据值
BB-XY1066
头发颜色
作用域
值
匹配条件
头发颜色的列表; 不区分大小写的
数据类型: string
数据最小长度: 3
数据最大长度: 14
列名过滤器: hair|hair_color|haircolor
样本数据值
Black
夏威夷州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[hH]{1}[0-9]{8}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
H12345678
健康保险理赔号
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.HICNClassifier
数据类型: string
数据最小长度: 6
数据最大长度: 15
样本数据值
WD-000-00-0000
爱好/休闲活动
作用域
值
匹配条件
爱好列表; 不区分大小写
数据类型: string
数据最小长度: 3
数据最大长度: 38
列名过滤器: hobb(y$|ies$)|leisure([ _])activit(y$|ies$)
样本数据值
Tennis
尊称
作用域
值
匹配条件
荣誉列表; 不区分大小写
数据类型: string
数据最小长度: 1
数据最大长度: 38
样本数据值
Mr
IBAN
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.IBANClassifier
数据类型: string
数据最小长度: 14
数据最大长度: 42
样本数据值
GB87 BARC 2065 8244 9716 55
ICD-10
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.ICD10Classifier
数据最小长度: 3
数据最大长度: 7
样本数据值
D36.7
爱达荷州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{2}[0-9]{6}[a-zA-Z]{1}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
AA123456X
标识
作用域
列
匹配条件
Java class:com.ibm.infosphere.classification.impl.
默认优先级:-10
样本数据值
伊利诺伊州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}[0-9]{3}\-[0-9]{4}\-[0-9]{4}$|^[a-zA-Z]{1}[0-9]{11}$
数据类型 string
数据最小长度: 12
数据最大长度: 14
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A123-4567-8999
INCO 条款(国际商业条款)
作用域
值
匹配条件
INCO 术语列表; 不区分大小写的
数据类型: string
数据最小长度: 3
数据最大长度: 3
样本数据值
FCA
印第安纳州驾驶证
作用域
值
匹配条件
RegularExpression: ^[0-9]{4}\-[0-9]{2}\-[0-9]{4}$|^[a-zA-Z]{1}[0-9]{9}$|^[0-9]{10}$
数据类型 string
数据最小长度: 10
数据最大长度: 12
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
1234-56-7890
指示符
作用域
列
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*默认优先级:-10
样本数据值
个人纳税人识别号 (ITIN)
作用域
值
匹配条件
RegularExpression: ^(9\d{2})([ \-]?)(?!93|89)([789][0-9])([ \-]?)(\d{4})$
数据最小长度: 9
数据最大长度: 11
列名过滤器: itin|tax
样本数据值
913-72-2222
国际移动设备身份 (IMEI)
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.IMEINumberClassifier
数据类型 string
数据最小长度: 15
数据最大长度: 15
列名过滤器: imei
样本数据值
490154203237518
国际证券识别号 (ISIN)
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.ISINClassifier
数据类型: 数字,字符串
数据最小长度: 10
数据最大长度: 20
样本数据值
GB0002634946
国际标准书号 (ISBN)
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.ISBNClassifier
数据类型: 数字,字符串
数据最小长度: 10
数据最大长度: 20
样本数据值
978 0 306 40615 7
国际标准行业分类
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.ISICClassifier
数据类型: string
数据最小长度: 5
数据最大长度: 5
列名过滤器: ^(unsic)$|^(isic)$|^((industr(ial|ies|y))[ ._-]?(code))$
样本数据值
C3319
因特网协议地址
作用域
值
匹配条件
RegularExpression: ^\s*(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\s*$
数据类型 string
数据最小长度: 7
数据最大长度: 15
样本数据值
127.127.127.002
因特网协议 V6 地址
作用域
值
匹配条件
RegularExpression: ^\s*((([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:))|(([0-9A-Fa-f]{1,4}:){6}(:[0-9A-Fa-f]{1,4}|((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){5}(((:[0-9A-Fa-f]{1,4}){1,2})|:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4}){1,3})|((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){1,4})|((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){1,5})|((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){1,6})|((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(:(((:[0-9A-Fa-f]{1,4}){1,7})|((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:)))(%.+)?\s*$
数据类型 string
数据最小长度: 3
数据最大长度: 39
样本数据值
fe80:0:0:0:204:61ff:fe9d:f156
爱荷华州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[0-9]{3}[a-zA-Z]{2}[0-9]{4}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123XX4567
爱尔兰 Eircode
作用域
值
匹配条件
RegularExpression: ^[ACD-FHKNPRTV-Y]\d[\dW][ \-]?[\dACD-FHKNPRTV-Y]{4}$
数据类型 string
数据最小长度: 7
数据最大长度: 8
样本数据值
D02 NY52
ISO 3166-2 代码
作用域
值
匹配条件
ISO 3166-2 省/直辖市/自治区代码的列表; 不区分大小写的
数据类型: string
数据最小长度: 4
数据最大长度: 6
样本数据值
IN-KA
意大利税控码
作用域
值
匹配条件
RegularExpression: ^([A-Z]{3})([ \-]?)([A-Z]{3})\2([0-9L-NP-V]{2})([A-EHLMPRST])([0-9LNP-V]{2})\2([A-ILMZ][0-9L-NP-V]{3})([A-Z])$
数据类型 string
数据最小长度: 16
数据最大长度: 16
样本数据值
MRTMTT25D09F205Z
日本信用卡株式会社 (JCB)
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:18
样本数据值
35283095185620637
堪萨斯州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[kK]{1}[0-9]{2}\-[0-9]{2}\-[0-9]{4}$|^[kK]{1}[0-9]{8}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
K94-12-3456
肯塔基州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}[0-9]{2}\-[0-9]{3}\-[0-9]{3}$|^[a-zA-Z]{1}[0-9]{8}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A23-145-678
语言代码或名称
作用域
值
匹配条件
语言列表; 不区分大小写的
数据类型: string
数据最小长度: 2
数据最大长度: 37
列名过滤器: lang|locale|language
样本数据值
EN
姓氏
作用域
列
匹配条件
Java 类: com.ibm.infosphere.classification.impl.GNMLastNameClassifier
数据类型 string
列名过滤器: ^l(ast)?([ \-_])?name$|^surname$|^family(([ \-_])?)name$
默认置信阈值: 50%
默认优先级: 7
样本数据值
Smith
纬度
作用域
值
匹配条件
Java class:com.ibm.infosphere.classification.impl.
type:numeric,
minimum length:
maximum length:
name filter: ^lat$|^lat_|_lat$|latitud(ine|e|o)?|breitengrad|breddekreds|breedtegraad|breiddegrad|breiddargráða|enlem|πλάτος|широт(ы|a)|קו רוחב|عرض جغرافي|緯度|纬度
样本数据值
49° 13"
法律婚姻/婚姻状况。
作用域
值
匹配条件
婚姻状况列表; 不区分大小写
数据类型: string
数据最小长度: 6
数据最大长度: 23
样本数据值
单个
注: 必须精确指定数据类名。 对于 Legal Marital/Civil Status.
类名,必须在名称末尾使用句号。
经度
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:
*列名过滤器: ^long$|^long_|_long$|longitud(ine|e|o)?|längengrad|laengengrad|længdekreds|laengdekreds|lengtegraad|lengdegrad|lengdargráða|boylam|μήκος|долгот(ы|a)|קו אורך|طول جغرافي|経度|经度
样本数据值
1°10’00.012" E
路易斯安那州驾驶证
作用域
值
匹配条件
RegularExpression: ^00[0-9]{7}$
数据类型 string
数据最小长度: 9
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
003456789
MAC 地址
作用域
值
匹配条件
RegularExpression: ^(?:[0-9A-Fa-f]{2}([:-]))(?:[0-9A-Fa-f]{2}\1){4}[0-9A-Fa-f]{2}$|(?:^([0-9A-Fa-f]{4}\.){2}[0-9A-Fa-f]{4}$
数据最小长度: 14
数据最大长度: 17
样本数据值
12:34:56:78:9F
缅因州驾驶证
作用域
值
匹配条件
RegularExpression: ^[0-9]{7}$
数据类型 numeric, string
数据最小长度: 7
数据最大长度: 7
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
1234567
曼尼托巴省驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{9}$
数据类型 numeric, string
数据最小长度: 9
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456789
马里兰州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}\-[0-9]{3}\-[0-9]{3}\-[0-9]{3}\-[0-9]{3}$|^[a-zA-Z]{1}[0-9]{12}$
数据类型 string
数据最小长度: 13
数据最大长度: 17
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A-123-456-789-999
马萨诸塞州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[sS]{1}[0-9]{8}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
S12345678
Master 卡
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:18
样本数据值
5285696282092972
密歇根州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}\d{12}$|^[a-zA-Z]{1} [0-9]{3} [0-9]{3} [0-9]{3} [0-9]{3}$
数据类型 string
数据最小长度: 13
数据最大长度: 17
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A012345678912
中间名
作用域
列
匹配条件
Java 类: com.ibm.infosphere.classification.impl.GNMFirstNameClassifier
数据类型 string
列名过滤器: ^m(iddle)?([ _.\-])?name$
默认置信阈值: 50%
默认优先级: 10
样本数据值
James
明尼苏达州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}\d{12}$|^[a-zA-Z]{1}-[0-9]{3}-[0-9]{3}-[0-9]{3}-[0-9]{3}$
数据类型 string
数据最小长度: 13
数据最大长度: 17
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A012345678912
密苏里州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{9}$|^[a-zA-Z]{1}[0-9]{5,9}$
数据类型 string
数据最小长度: 6
数据最大长度: 10
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
012345678
蒙大拿州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{9}$|^\d{13}$
数据类型 string
数据最小长度: 9
数据最大长度: 13
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
0123456789123
月
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:数字、
*数据最小长度:
*数据最大长度:10
样本数据值
一月
名字后缀
作用域
值
匹配条件
名称后缀的列表; 不区分大小写的
数据类型: string
数据最小长度: 2
数据最大长度: 16
样本数据值
PhD
内布拉斯加州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}[0-9]{3,8}$
数据类型 string
数据最小长度: 4
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
C12345678
内华达州驾驶证
作用域
值
匹配条件
RegularExpression: ^[xX]{1}\d{8}$|^\d{10}$|^\d{12}$
数据类型 string
数据最小长度: 9
数据最大长度: 12
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
0123456789
新不伦瑞克省驾驶证
作用域
值
匹配条件
RegularExpression: ^[0-9]{1,7}$
数据类型 string
数据最小长度: 1
数据最大长度: 7
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
0123456
新罕布什尔州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{2}[a-zA-Z]{3}\d{5}$
数据类型 string
数据最小长度: 10
数据最大长度: 10
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
01ABC56789
新泽西州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}\d{14}$|^[a-zA-Z]{1}\d{4} \d{5} \d{5}$|^[a-zA-Z]{1}\d{4}-\d{5}-\d{5}$
数据类型 string
数据最小长度: 15
数据最大长度: 17
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A01234567891234
新墨西哥州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{9}$
数据类型 string
数据最小长度: 9
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
012345678
纽约州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{9}$|^[a-zA-Z]{1}\d{18}$|^\d{3} \d{3} \d{3}$
数据类型 string
数据最小长度: 9
数据最大长度: 19
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
012345678
纽芬兰省和拉布拉多省州驾驶执照
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}\d{9}$
数据类型 string
数据最小长度: 10
数据最大长度: 10
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A012345678
NoClassDetected
作用域
匹配条件
没有任何列名或列值与任何可用的数据类匹配。
样本数据值
北卡罗来纳州驾驶证
作用域
值
匹配条件
RegularExpression: ^[0-9]{1,12}$
数据类型 string
数据最小长度: 1
数据最大长度: 12
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456789999
北达科他州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{3}\-[0-9]{2}\-[0-9]{4}$|^[a-zA-Z]{3}[0-9]{6}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
XYZ-11-2222
新斯科舍省驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{2}[0-9]{6}$
数据类型 string
数据最小长度: 8
数据最大长度: 8
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
XY123456
俄亥俄州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{2}[0-9]{6}$
数据类型 string
数据最小长度: 8
数据最大长度: 8
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
XY123456
俄克拉荷马州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{1}[0-9]{9}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
X123456789
安大略省驾驶证
作用域
值
匹配条件
RegularExpression: ^([a-zA-Z]{1}\d{4})([-]?)(\d{5})\2(\d{5})$
数据类型 string
数据最小长度: 15
数据最大长度: 17
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A1234-56123-99999
俄勒冈州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{1,9}$
数据类型 string
数据最小长度: 1
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
012345678
组织名称
作用域
值
匹配条件
Java class:com.ibm.infosphere.classification.impl.
type:
confidence threshold:
%*默认优先级:7
样本数据值
IBM
护照编号
作用域
值
匹配条件
RegularExpression: ^[A-Z0-9<]{9}[0-9]{1}[A-Z]{3}[0-9]{7}[A-Z]{1}[0-9]{7}[A-Z0-9<]{14}[0-9]{2}$
数据类型 string
数据最小长度: 6
数据最大长度: 254
样本数据值
L898902C<3UTO6908061F9406236ZE184226B<<<<<14
宾夕法尼亚州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{8}$|^\d{2} \d{3} \d{3}$
数据类型 string
数据最小长度: 8
数据最大长度: 10
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
01234567
百分比
作用域
值
匹配条件
RegularExpression: ^\(?[+-]? ?[0-9]{1,10}[,.]?[0-9]{0,10} ?(%|percent|pct)\)?$
数据类型 string
数据最小长度: 2
数据最大长度: 25
样本数据值
45%
人员姓名
作用域
列
匹配条件
Java 类: com.ibm.infosphere.classification.impl.GNMFullNameClassifier
数据类型 string
列名过滤器: _?name|नाम|名称|nom|nome|όνομα|nomine|имя|이름|име|naam
默认置信阈值: 50%
默认优先级: 7
样本数据值
John Doe
政党
作用域
值
匹配条件
非政治参与方列表; 不区分大小写
数据类型: string
数据最小长度: 2
数据最大长度: 99
列名过滤器: politic
样本数据值
PDP
爱德华王子岛省州驾驶执照
作用域
值
匹配条件
RegularExpression: ^\d{6}$
数据类型 numeric, string
数据最小长度: 6
数据最大长度: 6
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456
数量
作用域
列
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*默认优先级:-10
样本数据值
1
魁北克省驾驶证
作用域
值
匹配条件
RegularExpression: ^([a-zA-Z]{1}\d{4})([-]?)(\d{6})(\2)(\d{2})$
数据类型 string
数据最小长度: 13
数据最大长度: 15
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A1234-222222-00
关系
作用域
值
匹配条件
关系类型的列表; 不区分大小写的
数据类型: string
数据最小长度: 3
数据最大长度: 26
样本数据值
Friendship
宗教
作用域
值
匹配条件
宗教列表; 不区分大小写
数据类型: string
数据最小长度: 3
数据最大长度: 19
样本数据值
Christian
罗德岛州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{7}$|^[vV]{1}\d{6}$
数据类型 string
数据最小长度: 7
数据最大长度: 7
样本数据值
0123456
汇款路线号码
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.RTNClassifier
数据类型: 数字,字符串
数据最小长度: 9
数据最大长度: 9
样本数据值
121000358
萨斯喀彻温省驾驶执照
作用域
值
匹配条件
RegularExpression: ^\d{8}$
数据类型 string
数据最小长度: 8
数据最大长度: 8
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
12345678
南卡罗来纳州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{9}$
数据类型 string
数据最小长度: 9
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456789
南达科他州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([\-\.]?)(\d{2})\2(\d{4})$|^\d{6}$|^\d{8}$
数据类型 string
数据最小长度: 6
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456
西班牙财政识别号
作用域
值
匹配条件
RegularExpression: (X?)[ \-]?(\d{7})[ \-]?([A-HJ-NP-TV-Z])
数据类型 string
数据最小长度: 8
数据最大长度: 11
样本数据值
3124124N
省/自治区/直辖市名称
作用域
值
匹配条件
省/直辖市/自治区名称列表; 不区分大小写的
数据类型: string
数据最小长度: 2
数据最大长度: 43
样本数据值
San Salvador
温度
作用域
值
匹配条件
Java class:com.ibm.infosphere.classification.impl.
type:
minimum length:
maximum length:25
样本数据值
20°C
田纳西州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{8,9}$
数据类型 string
数据最小长度: 8
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456789
德克萨斯州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{8}$
数据类型 string
数据最小长度: 8
数据最大长度: 8
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
12345678
文本
作用域
列
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*默认优先级:-10
样本数据值
Put your TV viewing into overdrive with scenes that jump off your screen when you add 3D HDTVs to your home-theater system.
英国国家保险号
作用域
值
匹配条件
RegularExpression: ^([A-CEGHJ-PR-TW-Z][A-CEGHJ-NPR-TW-Z])([ \-\.]?)(\d{2})\2?(\d{2})\2?(\d{2})(\2([ABCD]))?$
数据类型 string
数据最小长度: 8
数据最大长度: 13
样本数据值
CA 123456 A
英国邮政编码
作用域
值
匹配条件
RegularExpression: ^[A-Z][A-Z]?\d[A-Z\d]?[ \-]?\d[ABD-HJLNP-UW-Z]{2}$
数据类型 string
数据最小长度: 5
数据最大长度: 8
样本数据值
L1 8LW
英国省代码
作用域
值
匹配条件
英国省代码列表; 区分大小写的
数据类型: string
数据最小长度: 2
数据最大长度: 3
样本数据值
HAW
统一资源定位符
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.URLClassifier
数据类型: string
数据最小长度: 10
数据最大长度: 1000
样本数据值
通用产品代码 (UPC)
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.UPCClassifier
数据类型: 数字,字符串
数据最小长度: 12
数据最大长度: 12
样本数据值
123456789999
美国县
作用域
值
匹配条件
美国县名称列表; 不区分大小写的
数据类型: string
数据最小长度: 3
数据最大长度: 35
缺省优先级: 8
样本数据值
Adams
美国雇主识别号
作用域
值
匹配条件
RegularExpression: ^(0[1-6]|1[0-6]|2[0-7]|[35][0-9]|[468][0-8]|7[1-7]|9[0-589])[ \-]?\d{7}$
数据类型 string
数据最小长度: 9
数据最大长度: 10
列名过滤器: EMPLOYER|EIN
样本数据值
99-1234567
美国国家药品代码
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.USNDCClassifier
数据类型: string
数据最小长度: 10
数据最大长度: 20
列名过滤器: DRUG|NDC
样本数据值
1234-5678-90
美国电话号码
作用域
值
匹配条件
RegularExpression: ^(\+?1\s*[-\/\.]?)?(\((\d{3})\)|(\d{3}))\s*[-\/\.]?\s*(\d{3})\s*[-\/\.]?\s*(\d{4})\s*(([xX]|[eE][xX][tT])\.?\s*(\d+))*$
数据类型 string
数据最小长度: 9
数据最大长度: 16
样本数据值
1 (234) 567-8901
美国社会保障号
作用域
值
匹配条件
b>RegularExpression:**'^([1-578]\d{2}|0[1-9]\d|00[1-9]|6[0-57-9]\d|66[0-57-9])([ \-\.]?)([1-9]\d|0[1-9])\2([1-9]\d{3}|0[1-9]\d{2}|00[1-9]\d|000[1-9])$
'
数据类型:数字、字符串 '
数据最小长度:9
数据最大长度:11
样本数据值
123-45-6789
美国社会保障号后 4 位
作用域
值
匹配条件
RegularExpression: ^([1-9]\d{3}|0[1-9]\d{2}|00[1-9]\d|000[1-9])$
数据最小长度: 4
数据最大长度: 4
列名过滤器: ssn(4)?$|(ssn|social(.?security)?|socsec)(.*4)?
样本数据值
美国标准行业分类
作用域
值
匹配条件
Java 类: com.ibm.infosphere.classification.impl.USSICClassifier
数据最小长度: 3
数据最大长度: 4
列名过滤器: SIC|USSIC|Standard Industrial Classification
样本数据值
1234
美国州首府名称
作用域
值
匹配条件
美国州首府名称列表; 不区分大小写
数据类型: string
数据最小长度: 5
数据最大长度: 14
样本数据值
Montgomery
美国州代码
作用域
值
匹配条件
美国州代码列表; 区分大小写
数据类型: string
数据最小长度: 2
数据最大长度: 2
缺省优先级: 14
样本数据值
DE
美国州名
作用域
值
匹配条件
美国州名称的列表; 不区分大小写的
数据类型: string
数据最小长度: 4
数据最大长度: 20
缺省优先级: 12
样本数据值
Massachusetts
美国街道名称
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.
*数据类型:
*数据最小长度:
*数据最大长度:50
样本数据值
8475 NW St
美国邮政编码
作用域
值
匹配条件
Java class:com.ibm.infosphere.classification.impl.
type:numeric,
minimum length:
maximum length:10
样本数据值
02201-1020
犹他州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{4,9}$
数据类型 numeric, string
数据最小长度: 4
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456789
车辆识别号 (VIN)
作用域
值
匹配条件
Java 类:com.ibm.infosphere.classification.impl.VehicleIdNumber
数据类型:
*数据最小长度:
*数据最大长度:17
样本数据值
1JCCM85E5BT001312
佛蒙特州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{8}$|^\d{7}A$
数据类型 string
数据最小长度: 8
数据最大长度: 8
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
1234567A
弗吉尼亚州驾驶证
作用域
值
匹配条件
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([\-\.]?)(\d{2})\2(\d{4})$|^[A-Za-z]{1}\d{8}$
数据类型 string
数据最小长度: 9
数据最大长度: 11
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A12345678
VISA 卡
作用域
值
匹配条件
b>Java class:** com.ibm.infosphere.classification.impl.VisaClassifier
数据类型:数字、字符串
数据最小长度:17
数据最大长度:18
样本数据值
4024007121595481
华盛顿州驾驶执照
作用域
值
匹配条件
RegularExpression: ^\d{7}$|^\d{9}$
数据类型 numeric, string
数据最小长度: 7
数据最大长度: 9
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
1234567
华盛顿州驾驶证
作用域
值
匹配条件
RegularExpression: ^(?=.*[A-Za-z]{2})([a-zA-Z]{2}[A-Za-z*]{5}\d{3}[A-Za-z0-9]{2})$
数据类型 string
数据最小长度: 12
数据最大长度: 12
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
DOE**MJ501A1
西弗吉尼亚州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}\d{6}$|^\d{7}$
数据类型 string
数据最小长度: 7
数据最大长度: 7
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
A123456
威斯康辛州驾驶证
作用域
值
匹配条件
RegularExpression: ^[a-zA-Z]{1}\d{3}-\d{4}-\d{4}-\d{2}$
数据类型 string
数据最小长度: 17
数据最大长度: 17
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
Z123-1234-5678-12
怀俄明州驾驶证
作用域
值
匹配条件
RegularExpression: ^\d{6}-\d{3}$
数据类型 string
数据最小长度: 10
数据最大长度: 10
列名过滤器: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
样本数据值
123456-123
父主题: 预定义的数据类