다음 기법을 사용하여 IBM Watson OpenScale의 문제점에 대해 작업할 수 있습니다.
- AutoAI를 사용할 때 불일치 데이터에 대한 오류를 받는 이유는 무엇입니까?
- 모델 구성 동안 오류를 받는 이유가 무엇입니까?
- XGBoost를 사용할 때 내 클래스 레이블이 누락된 이유는 무엇입니까?
- 페이로드 분석이 제대로 표시되지 않는 이유는 무엇입니까?
- 오류: 기능 중요성을 계산하는 동안 오류가 발생했습니다.
- 내 활성인 편향성 제거 레코드 중 일부가 누락된 이유가 무엇입니까?
- Watson OpenScale이 사용 가능한 스키마를 표시하지 않음
- 모니터 실행이
OutOfResources exception
오류 메시지와 함께 실패합니다.
AutoAI를 사용할 때 불일치 데이터에 대한 오류를 받는 이유는 무엇입니까?
2진 분류를 위해 AutoAI를 사용할 때 불일치 데이터에 대한 오류 메시지를 수신합니다. AutoAI는 IBM Watson OpenScale for IBM Cloud Pak for Data에서만 지원됨을 유의하십시오.
2진 분류 유형의 경우, AutoAI는 예측 열의 데이터 유형을 자동으로 부울로 설정합니다.
이를 수정하려면 다음 솔루션 중 하나를 구현하십시오.
- 훈련 데이터에서 훈련 데이터의 레이블 열 값을 결과에 따라
0
또는1
과 같은 정수 값으로 변경하십시오. - 훈련 데이터의 레이블 열 값을
A
및B
와 같은 문자열 값으로 변경하십시오.
모델 구성 동안 오류를 받는 이유가 무엇입니까?
모델 세부사항을 구성할 때 다음 오류 메시지가 표시됩니다. 필드 feature_fields
이(가) 모델의 input_schema
에서 누락된 열 <name>
을(를) 참조합니다. 입력 스키마에서 기능을 찾을 수 없습니다.
구성 중에 모델 세부사항 섹션을 완료하는 동안 위의 메시지는 모델 입력 스키마와 모델 훈련 데이터 스키마 간의 불일치를 나타냅니다.
문제를 해결하려면 다음 중 어떤 조건이 오류를 일으키는지 파악하고 수정 조치를 취해야 합니다: 머신 러닝 제공업체로 IBM watsonx.ai Runtime을 사용하고 모델 유형이 XGBoost/scikit-learn인 경우 모델 저장 방법에 대한 중요한 정보는 watsonx.ai Runtime Python SDK 설명서를 참조하세요. 드리프트 감지 모델을 생성하려면 노트북에서 scikit-learn 버전 0.20.2를 사용해야 합니다. 다른 모든 경우에는 훈련 데이터 열 이름이 입력 스키마 열 이름과 일치하는지 확인해야 합니다.
XGBoost를 사용할 때 내 클래스 레이블이 누락된 이유는 무엇입니까?
기본 XGBoost 멀티 클래스 분류가 클래스 레이블을 리턴하지 않습니다.
기본적으로, 2진 및 다중 클래스 모델의 경우, XGBoost 프레임워크는 클래스 레이블을 리턴하지 않습니다.
XGBoost 2진 및 다중 클래스 모델의 경우 클래스 레이블을 리턴하려면 모델을 업데이트해야 합니다.
페이로드 분석이 제대로 표시되지 않는 이유는 무엇입니까?
페이로드 분석이 제대로 표시되지 않으며 다음 오류 메시지가 표시됩니다. AIQDT0044E 금지 문자 "
in column name <column name>
페이로드 분석을 적절히 처리하기 위해 Watson OpenScale은 큰따옴표(")로 열 이름을 지원하지 않습니다. 상기 페이로드에서, 상기 페이로드 내의 이는 CSV 및 JSON 형식으로 된 스코어링 페이로드와 피드백 모두에 영향을 줍니다.
페이로드 파일의 열 이름에서 큰따옴표(")를 제거하십시오.
오류: 기능 중요성을 계산하는 동안 오류가 발생했습니다.
처리 중에 Error: An error occurred while computing feature importance
오류 메시지가 수신됩니다.
데이터 세트의 열 이름에 등호 부호(=)가 있으면 설명 가능성에 문제를 일으킵니다.
열 이름에서 등호 부호(=)를 제거하고 데이터 세트를 다시 처리를 위해 전송하십시오.
내 활성인 편향성 제거 레코드 중 일부가 누락된 이유가 무엇입니까?
활성인 편향성 제거 레코드가 페이로드 로깅 테이블에 도달하지 않습니다.
활성 편향성 제거 API를 사용할 때 페이로드 로깅을 위해 한 번에 전송하는 데에는 1000개의 레코드 제한이 있습니다.
데이터 손실을 피하려면 활성 편향성 제거 API를 사용하여 1000개 이하의 단위로 스코어링해야 합니다.
Watson OpenScale이 사용 가능한 스키마를 표시하지 않음
사용자가 Watson OpenScale에 대한 스키마 정보를 검색하려고 할 때 사용할 수 있는 정보가 없습니다. Watson OpenScale을 참조하지 않고 DB2에서 직접 시도한 후, 데이터베이스 사용자 ID에 사용할 수 있는 스키마를 확인하면 없음이 리턴됩니다.
데이터베이스 사용자 ID에 대한 권한이 충분하지 않아 Watson OpenScale에 대한 데이터베이스 연결 문제가 발생합니다.
데이터베이스 사용자에게 Watson OpenScale에 필요한 올바른 권한이 있는지 확인하십시오.
모니터 실행이 OutOfResources exception
오류 메시지와 함께 실패함
OutOfResources exception
오류 메시지가 수신됩니다.
피드백 페이로드, 스코어링 페이로드 또는 비즈니스 페이로드 테이블에서 가질 수 있는 행 수에는 더 이상 한계가 없습니다. 이제 50,000이라는 한계가 각 청구 기간에 품질 및 편향 모니터를 거치는 레코드 수에 적용됩니다.
한계에 도달한 후에는 표준 플랜으로 업그레이드하거나 다음 청구 기간을 기다려야 합니다.
배치 누락
배치된 모델이 구독 작성을 위해 선택할 수 있는 배치로서 나타나지 않습니다.
배치가 사용 가능한 배치된 모델 목록에 표시되지 않는 여러 가지 이유가 있습니다. 지원되지 않는 알고리즘이나 프레임워크를 사용하기 때문에 해당 모델이 지원되는 모델 유형이 아닌 경우, 이는 나타나지 않습니다. 기계 학습 제공자가 제대로 구성되지 않았을 수 있습니다. 권한에 문제가 있을 수도 있습니다.
다음 단계를 사용하여 이 문제를 해결하십시오.
- 모델이 지원되는 유형인지 확인하십시오.
- 특정 배포 공간에 대한 Watson OpenScale 구성에 머신 러닝 공급자가 있는지 확인합니다.
- CP4D
admin
사용자에게 배치 영역에 대한 액세스 권한이 있는지 확인하십시오.
다수의 구독으로 인해 Watson OpenScale 평가가 실패할 수 있습니다.
Watson OpenScale 인스턴스에 너무 많은 구독 (예: 100개의 구독) 이 포함된 경우 품질 평가가 실패할 수 있습니다. 다음 오류 메시지를 표시하는 데이터 마트 서비스 팟 (Pod) 에 대한 로그에서 실패의 세부사항을 볼 수 있습니다.
"Failure converting response to expected model EntityStreamSizeException: actual entity size (Some(8644836)) exceeded content length limit (8388608 bytes)! You can configure this by setting akka.http.[server|client].parsing.max-content-length or calling HttpEntity.withSizeLimit before materializing the dataBytes stream".
oc get pod -l component=aios-datamart
명령을 사용하여 팟 (Pod) 의 이름을 찾을 수 있습니다. oc logs <pod name>
명령을 사용하여 팟 (Pod) 에 대한 로그를 작성할 수도 있습니다.
이 오류를 수정하기 위해 다음 명령을 사용하여 "ADDITIONAL_JVM_OPTIONS"
환경 변수를 편집함으로써 최대 요청 본문 크기를 늘릴 수 있습니다.
oc patch woservice <release name> -p '{"spec": {"datamart": {"additional_jvm_options":"-Dakka.http.client.parsing.max-content-length=100m"} }}' --type=merge
Watson OpenScale을 설치할 때 릴리스 이름을 사용자 정의하지 않는 경우 릴리스 이름은 "aiopenscale"
입니다.
Microsoft Azure ML Studio
두 가지 유형의 Azure Machine Learning웹 서비스 중
New
유형만 Watson OpenScale에서 지원됩니다.Classic
유형은 지원되지 않습니다.기본 입력 이름을 사용해야 함: Azure 웹 서비스에서 기본 입력 이름은
"input1"
입니다. 현재 이 필드는 Watson OpenScale에서 필수이며 누락되면 Watson OpenScale이 작동하지 않습니다.Azure 웹 서비스가 기본 이름을 사용하지 않는 경우 입력 필드 이름을
"input1"
로 변경한 후 웹 서비스를 다시 배치하고 OpenScale 기계 학습 제공자 설정을 다시 구성하십시오.기계 학습 모델을 나열하는 Microsoft Azure ML Studio에 대한 호출로 인해 응답 제한시간이 초과되면(예를 들어, 다수의 웹 서비스가 있는 경우) 제한시간 값을 늘려야 합니다.
/etc/haproxy/haproxy.cfg
구성 설정을 변경하여 이 문제를 임시 해결해야 할 수 있습니다.로드 밸런서 노드에 로그인한 후
/etc/haproxy/haproxy.cfg
를 업데이트하여 클라이언트 및 서버 제한시간을1m
에서5m
으로 설정하십시오.timeout client 5m timeout server 5m
systemctl restart haproxy
를 실행하여 HAProxy 로드 밸런서를 다시 시작하십시오.
HAProxy 외의 다른 로드 밸런서를 사용하는 경우 유사한 방식으로 제한시간 값을 조정해야 할 수 있습니다.
- 두 가지 유형의 Azure Machine Learning웹 서비스 중
New
유형만 Watson OpenScale에서 지원됩니다.Classic
유형은 지원되지 않습니다.
설정을 가져온 후 프로덕션 등록에서 피드백 데이터 업로드 실패
사전 프로덕션 공간에서 프로덕션 공간으로 설정을 가져온 후 피드백 데이터를 업로드하는 데 문제가 있을 수 있습니다. 이는 데이터 유형이 정확하게 일치하지 않을 때 발생합니다. 설정을 가져올 때 피드백 테이블은 해당 열 유형에 대한 페이로드 테이블을 참조합니다. 페이로드 데이터에 가장 정확한 값 유형이 먼저 있는지 확인하여 이 문제를 방지할 수 있습니다. 예를 들어, 정수 데이터 유형보다 double 데이터 유형의 우선순위를 지정해야 합니다.
Microsoft Azure 기계 학습 서비스
모델 평가를 수행할 때 배치 스코어링 엔드포인트를 호출해야 하는 경우 Watson OpenScale 이 Azure Machine Learning 서비스와 통신할 수 없는 문제가 발생할 수 있습니다. Symantec Blue Coat와 같은 엔터프라이즈 보안 정책을 강제 실행하는 보안 도구로 인해 해당 액세스가 허용되지 않을 수 있습니다.
Watson OpenScale 이 일괄처리 배치 구독에 대한 새 Hive 테이블을 작성하는 데 실패함
Watson OpenScale 일괄처리 배치 구성 중에 Parquet
형식으로 새 Apache Hive 테이블을 작성하도록 선택하면 다음 오류가 발생할 수 있습니다.
Attribute name "table name" contains invalid character(s) among " ,;{}()\\n\\t=". Please use alias to rename it.;
이 오류는 Watson OpenScale 이 열 이름의 공백으로 인해 CREATE TABLE
SQL 조작을 실행하는 데 실패하는 경우에 발생합니다. 이 오류를 방지하기 위해 열 이름에서 공백을 제거하거나 Apache Hive 형식을 csv
로 변경할 수 있습니다.
Watson OpenScale 설정이 기본 Db2 데이터베이스로 실패할 수 있습니다.
Watson OpenScale 을 설정하고 기본 Db2 데이터베이스를 지정하면 설정이 완료되지 않을 수 있습니다.
이 문제를 수정하려면 Cloud Pak for Data 에서 다음 명령을 실행하여 Db2:
db2 update db cfg using DFT_EXTENT_SZ 32
명령을 실행한 후 새 Db2 데이터베이스를 작성하여 Watson OpenScale을 설정해야 합니다.
상위 주제: 문제점 해결