데이터 클래스는 자산 레벨 및 열 레벨에서 지정됩니다.
자산 레벨에서, 지정된 데이터 클래스는 열에 대해 가장 잘 맞는 것으로 분석에 의해, 또는 수동으로 선택된 데이터 클래스를 나타냅니다.
열 레벨에서 데이터 클래스는 데이터 클래스 정의에 따라 열 이름(범위 열) 또는 열 데이터(범위 값)에 따라 지정됩니다.
- 범위 열
- 분류가 오직 열 이름의 구문 분석 및 분석, 즉 메타데이터만을 기반으로 합니다. 열이 데이터 클래스와 얼마나 잘 일치하는지에 따라 분류자가 0.0에서 1.0 사이의 신뢰도 값을 리턴하며 여기서 0.0은 일치하지 않음, 1.0은 완벽한 일치를 의미합니다. 분류자가 0.0 대신 false, 1.0 대신 true를 리턴할 수도 있습니다.
- 범위 값
- 분류가 열에 있는 데이터 값의 분석을 기반으로 합니다. 값의 클래스 일치 여부에 따라 분류자가 true 또는 false를 리턴합니다. 모든 값이 평가되고 나면 열의 값 중에서 널이 아니며 데이터 클래스와 일치하는 값의 백분율이 열의 데이터 클래스에 대한 신뢰도를 나타냅니다.
신뢰도 외에도 데이터 클래스가 지정될 때 데이터 클래스의 우선순위가 고려됩니다. 데이터 클래스 세부사항에서 달리 언급하지 않는 한, 일치하는 범위 값 을 갖는 데이터 클래스의 기본 우선순위는 10입니다. 범위가 column과 일치하는 데이터 클래스의 경우, 기본 우선순위는 0입니다.
각 사전 정의된 데이터 클래스는 분류 로직을 적용하는 데 특정 유형의 분류자를 사용합니다.
- Java 분류자는 열 이름 또는 열의 데이터 값을 평가하여 데이터 클래스(범위 열)를 판별할 수 있습니다.
- Regex 분류자는 각 값이 데이터 클래스에 속하는지 여부를 판별하는 데 일반 표현식을 사용하여 열의 데이터 값을 평가합니다(범위 값).
- 값 목록 분류자는 유효값의 지정된 목록을 기반으로 열의 데이터 값을 평가하여 데이터 클래스를 판별합니다(범위 값).
범위, 분류자 및 일치 기준에 대한 자세한 정보는 일치하는 데이터를 참조하십시오.
각 데이터 클래스의 세부사항
분류 유형 및 범위, 평가 기준, 각 사전 정의된 데이터 클래스의 예를 알아보십시오.
계정 번호
범위
값
일치 기준
RegularExpression: .
열 이름 필터: ^acc(ount)?([ _\-])?(num(ber)?|id|no(\.)?){1}$
샘플 데이터 값
123456
주소 행 1
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.AddressLineClassifier
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 100
열 이름 필터: addr.{0,15}(1|one)$
기본 우선순위: 12
샘플 데이터 값
주소 라인 2
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.AddressLineClassifier
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 100
열 이름 필터: addr.{0,15}(2|two)$
기본 우선순위: 12
샘플 데이터 값
주소 3
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.AddressLineClassifier
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 100
열 이름 필터: addr.{0,15}(3|three)$
기본 우선순위: 12
샘플 데이터 값
주: 데이터 클래스 이름을 정확하게 지정해야 합니다. 다음과 같은 경우,....
Address Line 3
클래스 이름의 경우 Address
와 Line
사이에 두 개의 공백이 있습니다.
공항 코드
범위
값
일치 기준
공항 코드 목록; 대소문자 구분
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 3
샘플 데이터 값
앨라배마주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}\d{6}$|^\d{7}$
데이터 유형: string
데이터 최소 길이: 7
데이터 최대 길이: 7
샘플 데이터 값
1234567
알래스카주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{7}$
데이터 유형: string
데이터 최소 길이: 7
데이터 최대 길이: 7
샘플 데이터 값
1234567
앨버타주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{6}[-]?\d{3}$
데이터 유형: numeric, string
데이터 최소 길이: 9
데이터 최대 길이: 10
샘플 데이터 값
123456-123
American Express 카드
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.AMEXClassifier
데이터 유형: numeric, string
데이터 최소 길이: 16
데이터 최대 길이: 18
샘플 데이터 값
3400-000000-00009
아리조나주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[abdyABDY]\d{8}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A12345678
아칸소주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{9}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
012345678
BIC
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.BICClassifier
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 9
샘플 데이터 값
DEUTDEDBDUE
부울
범위
값
일치 기준
값 목록: 0, 1, True, False, Yes, No
데이터 유형: 숫자 또는 문자열
기본 우선순위: 16
샘플 데이터 값
예
브리티시컬럼비아주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{7}$
데이터 유형: numeric, string
데이터 최소 길이: 7
데이터 최대 길이: 7
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
1234567
캘리포니아주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}[0-9]{7}$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 8
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
C1234567
캐나다 우편번호
범위
값
일치 기준
RegularExpression: ^[A-Z]\d[A-Z][ \-]?\d[A-Z]\d$
데이터 유형: string
데이터 최소 길이: 6
데이터 최대 길이: 6
샘플 데이터 값
H3A 0B1
캐나다 주 코드
범위
값
일치 기준
캐나다 주 코드 목록. 대소문자 구분
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 2
기본 우선순위: 14
샘플 데이터 값
QC
캐나다 주 이름
범위
값
일치 기준
캐나다 주 이름 목록. 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 25
기본 우선순위: 12
샘플 데이터 값
퀘벡
캐나다 사회보험번호(SIN)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.CanadianSINClassifier
데이터 유형: numeric, string
데이터 최소 길이: 9
데이터 최대 길이: 20
샘플 데이터 값
046-454-286
구/군/시
범위
값
일치 기준
구/군/시 이름 목록. 대소문자 구분 안함
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 58
기본 신뢰도 임계값: 50%
기본 우선순위: 7
샘플 데이터 값
로스앤젤레스
코드
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.
우선순위: -10
샘플 데이터 값
콜로라도주 운전 면허증
범위
값
일치 기준
RegularExpression: (?:(^[0-9]{2}\-?[0-9]{3}\-?[0-9]{4}$)|(^[a-zA-Z]{1}[0-9]{3,6}$))
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
12-345-2222
색상
범위
값
일치 기준
색상 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 41
샘플 데이터 값
파란색
생산자부호(CAGE 코드)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.CAGECodeClassifier
데이터 유형: string
데이터 최소 길이: 5
데이터 최대 길이: 5
열 이름 필터: cage|fscm|nscm|entity|code
샘플 데이터 값
1ASDY
컴퓨터 호스트 이름
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.HostNameClassifier
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 255
샘플 데이터 값
www.example.com
코네티컷주 운전 면허증
범위
값
일치 기준
RegularExpression: ' ^[0-9]{9}$
'
데이터 유형: 숫자, 문자열
데이터 최소 길이: 9
데이터 최대 길이: 9
' 열 이름 필터: ' d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
'
샘플 데이터 값
123456789
국가 코드
범위
값
일치 기준
국가 코드 목록. 대소문자 구분
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 3
기본 우선순위: 13
샘플 데이터 값
미국
국가 이름
범위
값
일치 기준
국가 이름 목록. 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 50
기본 우선순위: 12
샘플 데이터 값
인도
신용카드 만기 날짜
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.CreditCardExpDateAndValidationNumberClassifier
샘플 데이터 값
12/2018
신용카드 번호
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.
유형: 숫자,
최소 길이:
최대 길이:
샘플 데이터 값
4146 6643 9004 5458
신용카드 검증 번호
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.CreditCardExpDateAndValidationNumberClassifier
샘플 데이터 값
1234
통화
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.CurrencyClassifier
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 25
샘플 데이터 값
$12,345.67
CPT
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.CPTClassifier
데이터 유형: string
데이터 최소 길이: 5
데이터 최대 길이: 5
열 이름 필터: CPT|medical procedure code|medical procedure|medicalcode|current procedural terminology
샘플 데이터 값
고객 번호
범위
값
일치 기준
RegularExpression: .
열 이름 필터: ^cust(omer)?([ _\-])?(num(ber)?|id|no(\.)?){1}$
샘플 데이터 값
3141596
날짜
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.DateTimeClassifier
샘플 데이터 값
12-30-2015
생년월일
범위
값
일치 기준
Java 클래스: {_infosphere.classification.impl.DOBClassifier
열 이름 필터: dob$|birth(day)?|geburtsdatum|na(issance|cimiento|scita)|urodzenia|(生ま(れた日)?|誕生日)|出生(年月)?
샘플 데이터 값
12-30-2015
델라웨어주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[0-9]{1,7}$
데이터 유형: numeric, string
데이터 최소 길이: 1
데이터 최대 길이: 7
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
1234567
Diners Club 카드
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.DinersClubClassifier
데이터 유형: numeric, string
데이터 최소 길이: 15
데이터 최대 길이: 18
샘플 데이터 값
5520111111111121
Discover Card
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.DiscoverClassifier
데이터 유형: numeric, string
데이터 최소 길이: 17
데이터 최대 길이: 18
샘플 데이터 값
6220264390045758
운전 면허증
범위
값
일치 기준
RegularExpression: ^[ a-zA-Z0-9*-]{1,19}$
데이터 유형: string
데이터 최소 길이: 1
데이터 최대 길이: 19
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
1234567
DUNS
범위
값
일치 기준
RegularExpression: ^(\d{2})([ \-]?)(\d{3})([ \-]?)(\d{4})$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: duns|universal number|universal_number
샘플 데이터 값
12-345-6789
이메일 주소
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.EmailClassifier
데이터 유형: string
데이터 최소 길이: 6
데이터 최대 길이: 254
샘플 데이터 값
고용 상태
범위
값
일치 기준
고용 상태 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 50
샘플 데이터 값
직원
인종
범위
값
일치 기준
민족 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 22
샘플 데이터 값
히스패닉
눈 색상
범위
값
일치 기준
눈 색상 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 14
열 이름 필터: eye|eye_color|eyecolor
샘플 데이터 값
담갈색
이름
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.GNMFirstNameClassifier
데이터 유형: string
열 이름 필터: ^(?i)(given|f(irst)?)([ _.\-])?name$
기본 신뢰도 임계값입니다: 50%
기본 우선순위: 10
샘플 데이터 값
James
플로리다주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}[0-9]{3}\-[0-9]{3}\-[0-9]{2}\-[0-9]{3}\-[0-1]{1}$|^[a-zA-Z]{1}[0-9]{12}$
데이터 유형: string
데이터 최소 길이: 13
데이터 최대 길이: 17
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
X123-123-33-229-0
포춘 1000 기업
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.Fortune1000Classifier
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 50
샘플 데이터 값
프랑스 INSEE 번호
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.FranceINSEEClassifier
데이터 유형: numeric, string
데이터 최소 길이: 15
데이터 최대 길이: 15
샘플 데이터 값
151022A10204375
성별
범위
값
일치 기준
값 목록: M, F, Male, 여성
데이터 유형: string
데이터 최소 길이: 1
데이터 최대 길이: 6
기본 우선순위: 16
샘플 데이터 값
F
지리 좌표
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.GeographicCoordinatesClassifier
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 44
샘플 데이터 값
49° 13" N; 1°10’00.012" E
조지아주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[0-9]{7,9}$
데이터 유형: numeric, string
데이터 최소 길이: 7
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123-45-6789
독일 자동차등록번호
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.GermanyCarClassifier
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 9
샘플 데이터 값
BB-XY1066
머리카락 색상
범위
값
일치 기준
머리카락 색상 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 14
열 이름 필터: hair|hair_color|haircolor
샘플 데이터 값
검은색
하와이주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[hH]{1}[0-9]{8}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
H12345678
건강 보험 청구 번호
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.HICNClassifier
데이터 유형: string
데이터 최소 길이: 6
데이터 최대 길이: 15
샘플 데이터 값
WD-000-00-0000
취미/레저 활동
범위
값
일치 기준
취미 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 38
열 이름 필터: hobb(y$|ies$)|leisure([ _])activit(y$|ies$)
샘플 데이터 값
테니스
존칭어
범위
값
일치 기준
존댓말 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 1
데이터 최대 길이: 38
샘플 데이터 값
Mr
IBAN
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.IBANClassifier
데이터 유형: string
데이터 최소 길이: 14
데이터 최대 길이: 42
샘플 데이터 값
GB87 BARC 2065 8244 9716 55
ICD-10
범위
값
일치 기준
Java 클래스: {_infosphere.classification.impl.ICD10Classifier
데이터 최소 길이: 3
데이터 최대 길이: 7
샘플 데이터 값
D36.7
아이다호주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{2}[0-9]{6}[a-zA-Z]{1}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
AA123456X
ID
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.
우선순위: -10
샘플 데이터 값
일리노이주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}[0-9]{3}\-[0-9]{4}\-[0-9]{4}$|^[a-zA-Z]{1}[0-9]{11}$
데이터 유형: string
데이터 최소 길이: 12
데이터 최대 길이: 14
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A123-4567-8999
인코텀즈(International Commercial Terms)
범위
값
일치 기준
INCO 용어 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 3
샘플 데이터 값
FCA
인디애나주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[0-9]{4}\-[0-9]{2}\-[0-9]{4}$|^[a-zA-Z]{1}[0-9]{9}$|^[0-9]{10}$
데이터 유형: string
데이터 최소 길이: 10
데이터 최대 길이: 12
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
1234-56-7890
표시기
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.
우선순위: -10
샘플 데이터 값
개인납세자 식별번호(ITIN)
범위
값
일치 기준
RegularExpression: ^(9\d{2})([ \-]?)(?!93|89)([789][0-9])([ \-]?)(\d{4})$
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: itin|tax
샘플 데이터 값
913-72-2222
국제모바일기기 식별코드(IMEI)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.IMEINumberClassifier
데이터 유형: string
데이터 최소 길이: 15
데이터 최대 길이: 15
열 이름 필터: imei
샘플 데이터 값
490154203237518
국제증권식별번호(ISIN)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.ISINClassifier
데이터 유형: numeric, string
데이터 최소 길이: 10
데이터 최대 길이: 20
샘플 데이터 값
GB0002634946
국제 표준 도서 번호(ISBN)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.ISBNClassifier
데이터 유형: numeric, string
데이터 최소 길이: 10
데이터 최대 길이: 20
샘플 데이터 값
978 0 306 40615 7
국제표준산업분류
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.ISICClassifier
데이터 유형: string
데이터 최소 길이: 5
데이터 최대 길이: 5
열 이름 필터: ^(unsic)$|^(isic)$|^((industr(ial|ies|y))[ ._-]?(code))$
샘플 데이터 값
C3319
인터넷 프로토콜 주소
범위
값
일치 기준
RegularExpression: ^\s*(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\s*$
데이터 유형: string
데이터 최소 길이: 7
데이터 최대 길이: 15
샘플 데이터 값
127.127.127.002
인터넷 프로토콜 버전 6 주소
범위
값
일치 기준
RegularExpression: ^\s*((([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:))|(([0-9A-Fa-f]{1,4}:){6}(:[0-9A-Fa-f]{1,4}|((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){5}(((:[0-9A-Fa-f]{1,4}){1,2})|:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4}){1,3})|((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){1,4})|((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){1,5})|((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){1,6})|((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(:(((:[0-9A-Fa-f]{1,4}){1,7})|((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:)))(%.+)?\s*$
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 39
샘플 데이터 값
fe80:0:0:0:204:61ff:fe9d:f156
아이오와주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[0-9]{3}[a-zA-Z]{2}[0-9]{4}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123XX4567
아일랜드 Eircode
범위
값
일치 기준
RegularExpression: ^[ACD-FHKNPRTV-Y]\d[\dW][ \-]?[\dACD-FHKNPRTV-Y]{4}$
데이터 유형: string
데이터 최소 길이: 7
데이터 최대 길이: 8
샘플 데이터 값
D02 NY52
ISO 3166-2 코드
범위
값
일치 기준
주 또는 지방의 ISO 3166-2 코드 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 6
샘플 데이터 값
IN-KA
이탈리아 회계 코드
범위
값
일치 기준
RegularExpression: ^([A-Z]{3})([ \-]?)([A-Z]{3})\2([0-9L-NP-V]{2})([A-EHLMPRST])([0-9LNP-V]{2})\2([A-ILMZ][0-9L-NP-V]{3})([A-Z])$
데이터 유형: string
데이터 최소 길이: 16
데이터 최대 길이: 16
샘플 데이터 값
MRTMTT25D09F205Z
Japan Credit Bureau(JCB)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.JapanCBClassifier
데이터 유형: numeric, string
데이터 최소 길이: 17
데이터 최대 길이: 18
샘플 데이터 값
35283095185620637
캔자스주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[kK]{1}[0-9]{2}\-[0-9]{2}\-[0-9]{4}$|^[kK]{1}[0-9]{8}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
K94-12-3456
켄터키주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}[0-9]{2}\-[0-9]{3}\-[0-9]{3}$|^[a-zA-Z]{1}[0-9]{8}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A23-145-678
언어 코드 또는 이름
범위
값
일치 기준
언어 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 37
열 이름 필터: lang|locale|language
샘플 데이터 값
EN
성
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.GNMLastNameClassifier
데이터 유형: string
열 이름 필터: ^l(ast)?([ \-_])?name$|^surname$|^family(([ \-_])?)name$
기본 신뢰도 임계값입니다: 50%
기본 우선순위: 7
샘플 데이터 값
Smith
위도
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.LatitudeClassifier
데이터 유형: numeric, string
데이터 최소 길이: 1
데이터 최대 길이: 20
열 이름 필터: ^lat$|^lat_|_lat$|latitud(ine|e|o)?|breitengrad|breddekreds|breedtegraad|breiddegrad|breiddargráða|enlem|πλάτος|широт(ы|a)|קו רוחב|عرض جغرافي|緯度|纬度
샘플 데이터 값
49° 13"
법적 결혼/민법적 지위.
범위
값
일치 기준
결혼 상태 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 6
데이터 최대 길이: 23
샘플 데이터 값
단일
주: 데이터 클래스 이름을 정확하게 지정해야 합니다. Legal Marital/Civil Status.
클래스 이름의 경우 이름 끝에 전체 중지를 사용해야 합니다.
경도
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.LongitudeClassifier
데이터 유형: numeric, string
데이터 최소 길이: 1
데이터 최대 길이: 21
열 이름 필터: ^long$|^long_|_long$|longitud(ine|e|o)?|längengrad|laengengrad|længdekreds|laengdekreds|lengtegraad|lengdegrad|lengdargráða|boylam|μήκος|долгот(ы|a)|קו אורך|طول جغرافي|経度|经度
샘플 데이터 값
1°10’00.012" E
루이지애나주 운전 면허증
범위
값
일치 기준
RegularExpression: ^00[0-9]{7}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
003456789
MAC 주소
범위
값
일치 기준
RegularExpression: ^(?:[0-9A-Fa-f]{2}([:-]))(?:[0-9A-Fa-f]{2}\1){4}[0-9A-Fa-f]{2}$|(?:^([0-9A-Fa-f]{4}\.){2}[0-9A-Fa-f]{4}$
데이터 최소 길이: 14
데이터 최대 길이: 17
샘플 데이터 값
12:34:56:78:9F
메인주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[0-9]{7}$
데이터 유형: numeric, string
데이터 최소 길이: 7
데이터 최대 길이: 7
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
1234567
매니토바주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{9}$
데이터 유형: numeric, string
데이터 최소 길이: 9
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123456789
메릴랜드주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}\-[0-9]{3}\-[0-9]{3}\-[0-9]{3}\-[0-9]{3}$|^[a-zA-Z]{1}[0-9]{12}$
데이터 유형: string
데이터 최소 길이: 13
데이터 최대 길이: 17
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A-123-456-789-999
메사추세츠주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[sS]{1}[0-9]{8}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
S12345678
마스터 카드
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.MasterCardClassifier
데이터 유형: numeric, string
데이터 최소 길이: 17
데이터 최대 길이: 18
샘플 데이터 값
5285696282092972
미시간주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}\d{12}$|^[a-zA-Z]{1} [0-9]{3} [0-9]{3} [0-9]{3} [0-9]{3}$
데이터 유형: string
데이터 최소 길이: 13
데이터 최대 길이: 17
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A012345678912
중간 이름
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.GNMFirstNameClassifier
데이터 유형: string
열 이름 필터: ^m(iddle)?([ _.\-])?name$
기본 신뢰도 임계값입니다: 50%
기본 우선순위: 10
샘플 데이터 값
James
미네소타주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}\d{12}$|^[a-zA-Z]{1}-[0-9]{3}-[0-9]{3}-[0-9]{3}-[0-9]{3}$
데이터 유형: string
데이터 최소 길이: 13
데이터 최대 길이: 17
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A012345678912
미주리주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{9}$|^[a-zA-Z]{1}[0-9]{5,9}$
데이터 유형: string
데이터 최소 길이: 6
데이터 최대 길이: 10
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
012345678
몬태나주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{9}$|^\d{13}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 13
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
0123456789123
월
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.MonthClassifier
데이터 유형: numeric, string
데이터 최소 길이: 1
데이터 최대 길이: 10
샘플 데이터 값
1월
이름 접미부
범위
값
일치 기준
이름 접미사 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 16
샘플 데이터 값
PhD
네브래스카주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}[0-9]{3,8}$
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
C12345678
네바다주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[xX]{1}\d{8}$|^\d{10}$|^\d{12}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 12
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
0123456789
뉴브런즈윅주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[0-9]{1,7}$
데이터 유형: string
데이터 최소 길이: 1
데이터 최대 길이: 7
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
0123456
뉴햄프셔주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{2}[a-zA-Z]{3}\d{5}$
데이터 유형: string
데이터 최소 길이: 10
데이터 최대 길이: 10
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
01ABC56789
뉴저지주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}\d{14}$|^[a-zA-Z]{1}\d{4} \d{5} \d{5}$|^[a-zA-Z]{1}\d{4}-\d{5}-\d{5}$
데이터 유형: string
데이터 최소 길이: 15
데이터 최대 길이: 17
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A01234567891234
뉴멕시코주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{9}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
012345678
뉴욕주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{9}$|^[a-zA-Z]{1}\d{18}$|^\d{3} \d{3} \d{3}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 19
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
012345678
뉴펀들랜드와 라브라도주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}\d{9}$
데이터 유형: string
데이터 최소 길이: 10
데이터 최대 길이: 10
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A012345678
NoClassDetected
범위
일치 기준
열 이름과 열 값 모두 사용 가능한 데이터 클래스와 일치하지 않습니다.
샘플 데이터 값
노스캐롤라이나주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[0-9]{1,12}$
데이터 유형: string
데이터 최소 길이: 1
데이터 최대 길이: 12
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123456789999
노스다코타주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{3}\-[0-9]{2}\-[0-9]{4}$|^[a-zA-Z]{3}[0-9]{6}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
XYZ-11-2222
노바스코샤주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{2}[0-9]{6}$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 8
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
XY123456
오하이오주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{2}[0-9]{6}$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 8
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
XY123456
오클라호마주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([ \-\.]?)(\d{2})\2(\d{4})$|^[a-zA-Z]{1}[0-9]{9}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
X123456789
온타리오주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([a-zA-Z]{1}\d{4})([-]?)(\d{5})\2(\d{5})$
데이터 유형: string
데이터 최소 길이: 15
데이터 최대 길이: 17
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A1234-56123-99999
오리건주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{1,9}$
데이터 유형: string
데이터 최소 길이: 1
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
012345678
조직 이름
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.
유형:
신뢰도 임계값:
우선순위: 7
샘플 데이터 값
IBM
여권 번호
범위
값
일치 기준
RegularExpression: ^[A-Z0-9<]{9}[0-9]{1}[A-Z]{3}[0-9]{7}[A-Z]{1}[0-9]{7}[A-Z0-9<]{14}[0-9]{2}$
데이터 유형: string
데이터 최소 길이: 6
데이터 최대 길이: 254
샘플 데이터 값
L898902C<3UTO6908061F9406236ZE184226B<<<<<14
펜실베니아주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{8}$|^\d{2} \d{3} \d{3}$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 10
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
01234567
백분율
범위
값
일치 기준
RegularExpression: ^\(?[+-]? ?[0-9]{1,10}[,.]?[0-9]{0,10} ?(%|percent|pct)\)?$
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 25
샘플 데이터 값
45%
개인 이름
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.GNMFullNameClassifier
데이터 유형: string
열 이름 필터: _?name|नाम|名称|nom|nome|όνομα|nomine|имя|이름|име|naam
기본 신뢰도 임계값입니다: 50%
기본 우선순위: 7
샘플 데이터 값
홍길동
정당
범위
값
일치 기준
정당 명부; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 99
열 이름 필터: politic
샘플 데이터 값
PDP
프린스 에드워드 아일랜드주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{6}$
데이터 유형: numeric, string
데이터 최소 길이: 6
데이터 최대 길이: 6
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123456
수량
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.
우선순위: -10
샘플 데이터 값
100년
퀘벡주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([a-zA-Z]{1}\d{4})([-]?)(\d{6})(\2)(\d{2})$
데이터 유형: string
데이터 최소 길이: 13
데이터 최대 길이: 15
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A1234-222222-00
관계
범위
값
일치 기준
관계 유형 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 26
샘플 데이터 값
프렌드십
종교
범위
값
일치 기준
종교 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 19
샘플 데이터 값
크리스티안
로드아일랜드주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{7}$|^[vV]{1}\d{6}$
데이터 유형: string
데이터 최소 길이: 7
데이터 최대 길이: 7
샘플 데이터 값
0123456
미국 송금 코드 번호(RTN)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.RTNClassifier
데이터 유형: numeric, string
데이터 최소 길이: 9
데이터 최대 길이: 9
샘플 데이터 값
121000358
사스캐처원주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{8}$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 8
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
12345678
사우스캐롤라이나주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{9}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123456789
사우스다코타주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([\-\.]?)(\d{2})\2(\d{4})$|^\d{6}$|^\d{8}$
데이터 유형: string
데이터 최소 길이: 6
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123456
스페인 회계식별번호
범위
값
일치 기준
RegularExpression: (X?)[ \-]?(\d{7})[ \-]?([A-HJ-NP-TV-Z])
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 11
샘플 데이터 값
3124124N
주 이름
범위
값
일치 기준
시/도 이름 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 43
샘플 데이터 값
산살바도르
온도
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.TemperatureClassifier
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 25
샘플 데이터 값
20°C
테네시주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{8,9}$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123456789
텍사스주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{8}$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 8
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
12345678
텍스트
범위
컬럼
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.
우선순위: -10
샘플 데이터 값
Put your TV viewing into overdrive with scenes that jump off your screen when you add 3D HDTVs to your home-theater system.
영국 국민 보험(NI) 번호
범위
값
일치 기준
RegularExpression: ^([A-CEGHJ-PR-TW-Z][A-CEGHJ-NPR-TW-Z])([ \-\.]?)(\d{2})\2?(\d{2})\2?(\d{2})(\2([ABCD]))?$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 13
샘플 데이터 값
CA 123456 A
영국 우편번호
범위
값
일치 기준
RegularExpression: ^[A-Z][A-Z]?\d[A-Z\d]?[ \-]?\d[ABD-HJLNP-UW-Z]{2}$
데이터 유형: string
데이터 최소 길이: 5
데이터 최대 길이: 8
샘플 데이터 값
L1 8LW
영국 지역 코드
범위
값
일치 기준
영국 주 코드 목록; 대소문자 구분
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 3
샘플 데이터 값
HAW
URL(Uniform Resource Locator)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.URLClassifier
데이터 유형: string
데이터 최소 길이: 10
데이터 최대 길이: 1000
샘플 데이터 값
범용 제품 코드(UPC)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.UPCClassifier
데이터 유형: numeric, string
데이터 최소 길이: 12
데이터 최대 길이: 12
샘플 데이터 값
123456789999
미국 카운티
범위
값
일치 기준
미국 국가 이름 목록. 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 3
데이터 최대 길이: 35
기본 우선순위: 8
샘플 데이터 값
애덤스
미국 고용주 식별 번호
범위
값
일치 기준
RegularExpression: ^(0[1-6]|1[0-6]|2[0-7]|[35][0-9]|[468][0-8]|7[1-7]|9[0-589])[ \-]?\d{7}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 10
열 이름 필터: EMPLOYER|EIN
샘플 데이터 값
99-1234567
미국 국가 의약품 코드(NDC)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.USNDCClassifier
데이터 유형: string
데이터 최소 길이: 10
데이터 최대 길이: 20
열 이름 필터: DRUG|NDC
샘플 데이터 값
1234-5678-90
미국 전화번호
범위
값
일치 기준
RegularExpression: ^(\+?1\s*[-\/\.]?)?(\((\d{3})\)|(\d{3}))\s*[-\/\.]?\s*(\d{3})\s*[-\/\.]?\s*(\d{4})\s*(([xX]|[eE][xX][tT])\.?\s*(\d+))*$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 16
샘플 데이터 값
1 (234) 567-8901
미국 사회보장번호
범위
값
일치 기준
b>RegularExpression:** ' ^([1-578]\d{2}|0[1-9]\d|00[1-9]|6[0-57-9]\d|66[0-57-9])([ \-\.]?)([1-9]\d|0[1-9])\2([1-9]\d{3}|0[1-9]\d{2}|00[1-9]\d|000[1-9])$
'
데이터 유형: 숫자, 문자열
데이터 최소 길이: 9
데이터 최대 길이: 11
샘플 데이터 값
123-45-6789
미국 사회보장번호 마지막 4자리
범위
값
일치 기준
RegularExpression: ^([1-9]\d{3}|0[1-9]\d{2}|00[1-9]\d|000[1-9])$
데이터 최소 길이: 4
데이터 최대 길이: 4
열 이름 필터: ssn(4)?$|(ssn|social(.?security)?|socsec)(.*4)?
샘플 데이터 값
미국 표준산업분류
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.USSICClassifier
데이터 최소 길이: 3
데이터 최대 길이: 4
열 이름 필터: SIC|USSIC|Standard Industrial Classification
샘플 데이터 값
1234
미국 주 수도 이름
범위
값
일치 기준
미국 주도 이름 목록; 대소문자를 구분하지 않음
데이터 유형: string
데이터 최소 길이: 5
데이터 최대 길이: 14
샘플 데이터 값
몽고메리
미국 주 코드
범위
값
일치 기준
미국 상태 코드 목록. 대소문자 구분
데이터 유형: string
데이터 최소 길이: 2
데이터 최대 길이: 2
기본 우선순위: 14
샘플 데이터 값
DE
미국 주 이름
범위
값
일치 기준
미국 주 이름 목록. 대소문자 구분 안함
데이터 유형: string
데이터 최소 길이: 4
데이터 최대 길이: 20
기본 우선순위: 12
샘플 데이터 값
매사추세츠
미국 거리 이름
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.StreetClassifier
데이터 유형: string
데이터 최소 길이: 7
데이터 최대 길이: 50
샘플 데이터 값
8475 NW St
미국 우편번호
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.USZipCodeClassifier
데이터 유형: numeric, string
데이터 최소 길이: 5
데이터 최대 길이: 10
샘플 데이터 값
02201-1020
유타주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{4,9}$
데이터 유형: numeric, string
데이터 최소 길이: 4
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123456789
차량식별번호(VIN)
범위
값
일치 기준
Java 클래스: com.ibm.infosphere.classification.impl.VehicleIdNumber
데이터 유형: string
데이터 최소 길이: 17
데이터 최대 길이: 17
샘플 데이터 값
1JCCM85E5BT001312
버몬트주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{8}$|^\d{7}A$
데이터 유형: string
데이터 최소 길이: 8
데이터 최대 길이: 8
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
1234567A
버지니아주 운전 면허증
범위
값
일치 기준
RegularExpression: ^([0-6]\d{2}|7[0-6]\d|77[0-2])([\-\.]?)(\d{2})\2(\d{4})$|^[A-Za-z]{1}\d{8}$
데이터 유형: string
데이터 최소 길이: 9
데이터 최대 길이: 11
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A12345678
VISA 카드
범위
값
일치 기준
b>자바 클래스:** com.ibm.infosphere.classification.impl.VisaClassifier
데이터 유형: 숫자, 문자열
데이터 최소 길이: 17
데이터 최대 길이: 18
샘플 데이터 값
4024007121595481
워싱턴 DC주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{7}$|^\d{9}$
데이터 유형: numeric, string
데이터 최소 길이: 7
데이터 최대 길이: 9
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
1234567
워싱턴주 운전 면허증
범위
값
일치 기준
RegularExpression: ^(?=.*[A-Za-z]{2})([a-zA-Z]{2}[A-Za-z*]{5}\d{3}[A-Za-z0-9]{2})$
데이터 유형: string
데이터 최소 길이: 12
데이터 최대 길이: 12
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
DOE**MJ501A1
웨스트버지니아주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}\d{6}$|^\d{7}$
데이터 유형: string
데이터 최소 길이: 7
데이터 최대 길이: 7
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
A123456
위스콘신주 운전 면허증
범위
값
일치 기준
RegularExpression: ^[a-zA-Z]{1}\d{3}-\d{4}-\d{4}-\d{2}$
데이터 유형: string
데이터 최소 길이: 17
데이터 최대 길이: 17
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
Z123-1234-5678-12
와이오밍주 운전 면허증
범위
값
일치 기준
RegularExpression: ^\d{6}-\d{3}$
데이터 유형: string
데이터 최소 길이: 10
데이터 최대 길이: 10
열 이름 필터: d(\.)?l(\.)?([ -_]?(number|no(\.)?))?$|driv(ing|er(s|'s)?)[ -_]license|license
샘플 데이터 값
123456-123
상위 주제: 사전 정의된 데이터 클래스