Cloud Pak for Data 배치 간 기능 차이점
Cloud Pak for Data as a Service 및 Cloud Pak for Data 4.6, 4.5, 4.0및 3.5 소프트웨어는 기능 및 구현에 약간의 차이가 있습니다. Cloud Pak for Data as a Service는 일련의 IBM Cloud 서비스입니다. Cloud Pak for Data 4.6 및 3.5 의 경우, 설치 및 유지보수해야 하는 소프트웨어로 제공됩니다. 두 배치 모두에서 사용 가능한 서비스는 Cloud Pak for Data 4.6, 4.5, 4.0및 3.5와 비교하여 Cloud Pak for Data as a Service 의 기능에 차이가 있습니다.
- 플랫폼 차이점
- 서비스 전반에 걸친 공통 기능
- Watson Studio
- Watson Machine Learning
- Watson Knowledge Catalog
- DataStage
- Watson OpenScale
- Watson Query
플랫폼 차이점
Cloud Pak for Data as a Service 및 Cloud Pak for Data 4.6 은 공통 코드 기반을 공유하지만 다음과 같은 주요 방법이 있습니다.
기능 | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
소프트웨어, 하드웨어 및 설치 | Cloud Pak for Data as a Service는 IBM이 IBM Cloud에서 완전히 관리합니다. 소프트웨어 업데이트는 자동입니다. 계산 자원 및 스토리지의 크기 조정은 자동입니다. https://dataplatform.cloud.ibm.com에 등록하십시오. | 하드웨어를 제공하고 유지보수합니다. Cloud Pak for Data 소프트웨어를 설치, 유지보수 및 업그레이드합니다. 소프트웨어 요구사항을 참조하십시오. |
스토리지 | IBM Cloud Object Storage 서비스 인스턴스를 프로비저닝하여 스토리지를 제공합니다. IBM Cloud Object Storage을 참조하십시오. | Red Hat OpenShift 클러스터에 파일 스토리지 시스템을 제공합니다. 스토리지 요구사항을 참조하십시오. |
워크로드를 실행하기 위한 자원 계산 | 사용자는 작업에 적합한 런타임을 선택합니다. 런타임 환경 및 작업 지속 기간에 대한 비율을 기반으로 계산 사용법이 청구됩니다. 계정 자원 사용 모니터를 참조하십시오. | 적절한 수의 vCPU를 사용하여 Red Hat OpenShift 클러스터 및 노드의 수를 설정합니다. 하드웨어 요구사항 및 플랫폼 모니터링을 참조하십시오. |
비용 | 적절한 계획 레벨에서 필요한 각 서비스를 구매합니다. 많은 서비스가 자원 소비를 계산합니다. 탐색 메뉴에서 서비스 > 서비스 카탈로그 를 선택하여 IBM Cloud 카탈로그 의 각 서비스 페이지 또는 Cloud Pak for Data as a Service의 서비스 카탈로그를 참조하십시오. | Cloud Pak for Data에 대한 라이센스와 필요한 각 서비스를 구매합니다. Cloud Pak for Data를 참조하십시오. |
보안, 준수 및 격리 | Cloud Pak for Data as a Service의 데이터 보안, 네트워크 보안, 보안 표준 준수 및 분리는 IBM Cloud에 의해 관리됩니다. 추가 보안 및 암호화 옵션을 설정할 수 있습니다. Cloud Pak for Data as a Service의 보안을 참조하십시오. | Red Hat OpenShift 컨테이너 플랫폼은 기본 보안 기능을 제공합니다. Cloud Pak for Data는 다양한 개인정보 보호정책 및 준수 규정에 대해 평가되며 다양한 개인정보 보호정책 및 준수 평가에 대비하여 사용할 수 있는 기능을 제공합니다. 사용자는 추가 보안 기능, 암호화 및 네트워크 격리를 담당합니다. 보안 고려사항을 참조하십시오. |
사용 가능한 서비스 | 대부분의 데이터 패브릭 서비스는 두 배치 환경 모두에서 사용 가능합니다. Cloud Pak for Data as a Service에 대한 서비스를 참조하십시오. |
다른 많은 서비스를 포함합니다. Services for Cloud Pak for Data 4.6을 참조하십시오. |
사용자 관리 | 사용자 및 사용자 그룹을 추가하고 IBM Cloud Identity and Access Management로 계정 역할 및 권한을 관리합니다. 계정에 사용자 추가를 참조하십시오. IBM Cloud에서 SAML 연합을 설정할 수도 있습니다. IBM Cloud 문서: IBM Cloud IAM(Identity and Access Management)의 개념을 참조하십시오, |
관리 메뉴에서 사용자를 추가하고 사용자 그룹을 작성할 수 있습니다. ID 및 액세스 관리 서비스를 사용하거나 기존의 SAML SSO 또는 LDAP 제공자를 ID 및 암호 관리에 사용할 수 있습니다. 동적 속성 기반 사용자 그룹을 작성할 수 있습니다. 사용자 관리를 참조하십시오. |
서비스 전반에 걸친 공통 기능
플랫폼과 함께 제공되는 다음 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5및 4.6: 의 서비스에 대해 효과적으로 동일합니다.
- 플랫폼에서 자산 및 아티팩트에 대한 글로벌 검색
- 플랫폼 전반에서 연결을 공유하기 위한 플랫폼 자산 카탈로그
- 플랫폼 전반의 협업 작업공간 내 역할 기반 사용자 관리
- 자산 및 작업공간에 대한 공통 인프라
- 서비스를 추가하기 위한 서비스 카탈로그
- 관리 메뉴에서 계산 사용법 보기
다음 표에서는 Cloud Pak for Data as a Service 와 Cloud Pak for Data 3.5, 4.5및 4.6사이의 서비스 전반에 걸친 기능의 차이점을 설명합니다.
기능 | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
업데이트된 프로젝트 경험 | ✓ | 4.5 부터 사용 가능 |
모든 프로젝트 관리 | IBM Cloud Pak for Data 서비스에 대한 IAM 서비스 액세스 관리자 역할의 프로젝트 관리 권한이 있는 사용자는 관리 역할을 가진 프로젝트에 참여한 후 프로젝트를 관리하거나 삭제할 수 있습니다. | 프로젝트 관리 권한이 있는 사용자는 관리 역할을 가진 프로젝트에 참여한 후 프로젝트를 관리하거나 삭제할 수 있습니다. |
원격 데이터 소스에 대한 연결 | 지원되는 대부분의 데이터 소스는 두 배치 환경 모두에 공통적입니다. 지원되는 연결을 참조하십시오. |
지원되는 데이터 소스를 참조하십시오. |
개인용 또는 공유된 연결 신임 정보 | 프로젝트 및 카탈로그의 연결에는 개인 신임 정보가 필요하거나 공유 신임이 허용될 수 있습니다. 계정 레벨에서 공유 신임 정보를 사용하지 않도록 설정할 수 있습니다. | 플랫폼 연결에는 개인 신임 정보가 필요하거나 공유 신임 정보가 허용될 수 있습니다. 공유 신임 정보는 플랫폼 레벨에서 사용 불가능할 수 있습니다. |
볼트에 있는 시크릿 정보의 연결 신임 정보 | 사용할 수 없음 | ✓ |
갤러리의 샘플 자산 및 프로젝트 | ✓ | 사용할 수 없음 |
데이터 액세스 요청 | 사용할 수 없음 | ✓ |
Watson Studio
다음 Watson Studio 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5및 Cloud Pak for Data 4.6: 에서 효과적으로 동일합니다.
- 프로젝트 및 배치 공간에서의 협업
- 프로젝트 ZIP 파일을 사용하여 프로젝트 가져오기 및 내보내기
- Jupyter 노트북
- 작업 스케줄링
- Data Refinery
이 테이블은 다중 배치 환경에서의 Watson Studio 서비스 간의 기능 차이점, 오퍼링 계획 간의 차이점 및 추가 서비스가 필요한지 여부에 대해 설명합니다. Cloud Pak for Data as a Service의 오퍼링 계획 간 기능 차이점에 대한 자세한 정보는 Watson Studio 오퍼링 계획을 참조하십시오.
기능 | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
프로젝트 작성 | Create: • An empty project • A project from a sample in the Gallery • A project from file |
Create: • An empty project • A project from file • A project with Git integration |
Git 통합 | GitHub 에서 노트북을 공개 노트북에 게시 |
프로젝트를 Git 동기화 자산과 통합하여 한 프로젝트의 저장소에 통합하고 해당 자산을 다른 프로젝트에 사용 |
고급 Git 조작을 위한 프로젝트 터미널 | 사용할 수 없음 | 기본 Git 통합이 있는 프로젝트에서 사용 가능 |
JupyterLab | 사용할 수 없음 | Git 통합과 함께 프로젝트에서 사용 가능 |
Visual Studio Code 통합 | 사용할 수 없음 | 4.6부터 Git 통합이 있는 프로젝트에서 사용 가능합니다. |
RStudio | Git와 통합할 수 없음 | Git와 통합할 수 있음 RStudio Server Runtimes 서비스가 필요합니다. |
Python 스크립트 | 사용할 수 없음 | JupyterLab에서 Python 스크립트에 대한 작업을 수행하십시오. Watson Studio 런타임 서비스가 필요합니다. |
프로그램으로 프로젝트 자산 액세스 | Python 및 R에 project-lib 사용 |
Python 및 R(project-lib 의 후속 작업)에 ibm-watson-studio-lib 을(를) 사용하십시오. |
Flight service 를 사용하여 노트북에 데이터를 로드하기 위한 코드 생성 | 사용할 수 없음 | ✓ |
Watson 자연어 처리 | Python 에 사용 가능 | Python 에 사용 가능 |
노트북 라이프사이클 관리 | 사용할 수 없음 | 노트북 라이프사이클 관리에 CPDCTL 사용 |
코드 패키지 자산(폴더 구조의 종속 파일 세트) | 사용할 수 없음 | CPDCTL을 사용하여 배치 공간에 코드 패키지 자산 작성 |
노트북을 공간으로 승격 | 사용할 수 없음 | 프로젝트의 자산 페이지에서 수동으로 사용 가능하거나 CPDCTL을 사용하여 프로그래밍 방식으로 사용 가능 |
GPU 사용 Python | 단일 GPU 유형에만 사용 가능한 지원(Nvidia K80) | 다중 엔비디아 GPU 유형에 사용할 수 있는 지원. Watson Studio 런타임 서비스가 필요합니다. |
사용자 정의 이미지 작성 및 사용 | 사용할 수 없음 | Python (GPU가 있고 없음), R, JupyterLab (GPU 포함 및 사용 안함), RStudio및 SPSS 환경에 대한 사용자 정의 이미지를 작성하십시오. Watson Studio 런타임 및 기타 적용 가능한 서비스가 필요합니다. |
아나콘다 저장소 | 사용할 수 없음 | 사용자 정의 환경 및 사용자 정의 이미지를 작성하는 데 사용 |
Hadoop 통합 | 사용할 수 없음 | 모델을 빌드하고 훈련하고 Hadoop 클러스터에서 Data Refinery 플로우를 실행하십시오. Apache Hadoop 서비스에 대한 실행 엔진이 필요합니다. |
Decision Optimization | ✓ | Decision Optimization 서비스가 필요합니다. |
SPSS Modeler | ✓ | SPSS Modeler 서비스가 필요합니다. |
Watson Pipelines | 베타 릴리스 | 4.6에서 시작할 수 있습니다. Watson Pipelines 서비스가 필요합니다. |
대시보드 | Cognos Dashboard Embedded 서비스가 필요합니다. | Cognos Dashboards 서비스가 필요합니다. |
Watson Machine Learning
다음 Watson Machine Learning 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5및 4.6: 에서 효과적으로 동일합니다.
- 프로젝트 및 배치 공간에서의 협업
- 모델 배치
- 함수 배치
- Watson Machine Learning REST API
- Watson Machine Learning Python 클라이언트
- 온라인 배포 작성
- 배치 규모 및 업데이트 배치
- 사용자 정의 컴포넌트 정의 및 사용
- Federated Learning을 사용하여 별도의 보안 데이터 소스로 공통 모델을 훈련
- 영역 전체에서의 배치 모니터링
이 테이블은 다중 배치 환경에서 Watson Machine Learning 서비스 사이의 기능 차이점, 오퍼링 계획 간의 차이점 및 추가 서비스가 필요한지 여부에 대해 설명합니다. Cloud Pak for Data as a Service에 대한 오퍼링 계획 간 기능 차이점에 대한 자세한 내용은 Watson Machine Learning 오퍼링 계획을 참조하십시오.
기능 | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
AutoAI 교육 입력 | 현재 지원되는 데이터 소스 | 지원되는 데이터 소스 릴리스별 변경 |
AutoAI 실험 구성 | 8 CPU및 32 GB | 사용 가능한 다른 크기 |
데이터 크기 및 예측 목표 수에 대한 AutoAI 한계 |
한계 설정 | 한계가 계산 구성에 따라 다름 |
AutoAI 데이터 대치 | ✓ | 4.5.2 에서 시작할 수 있습니다. |
AutoAI 공정성 평가 | ✓ | 4.5.2 에서 시작할 수 있습니다. |
AutoAI 시계열 지원 기능 | ✓ | 4.5.3 에서 시작할 수 있습니다. |
AutoAI 증분 학습 | 사용할 수 없음 | 4.6.0 에서 시작할 수 있습니다. |
일반적인 프레임워크 및 소프트웨어 스펙을 사용하여 배치 |
최신 지원되는 버전을 확인하십시오. | 지원되는 버전은 릴리스별로 다릅니다. |
일괄처리 배치를 위해 데이터베이스에 연결 | 배치 유형별 지원을 확인하십시오. | 배치 유형 및 버전별 지원 확인 |
Python 스크립트 배치 및 스코어 | Python 클라이언트를 통해 사용 가능 | JupyterLab 또는 Python 클라이언트에서 스크립트를 작성한 후 전개 |
배치 및 배치 점수 R 스크립트 | 사용할 수 없음 | 사용 가능 |
Shiny 앱 배치 | 사용할 수 없음 | 4.5 에서 시작하는 코드 패키지에서 새 앱 배치 작성 및 배치 |
공정성, 편향성 또는 드리프트에 대한 작업 평가 | Watson OpenScale이 필요합니다. | Watson OpenScale이 필요합니다. |
제어 영역 작성 | 역할 제한 없음 | 공간을 보고 작성할 수 있는 사용자를 제어하려면 권한을 사용하십시오. |
온라인 배치 테스트를 위한 업데이트된 양식 | ✓ | 4.5.3 에서 시작할 수 있습니다. |
GIT 프로젝트에서 공간으로 가져오기 | 사용할 수 없음 | 4.5 부터 사용 가능 |
를 Git 프로젝트에서 공간으로 가져올 때 코드 패키지가 자동으로 작성됩니다. |
사용할 수 없음 | 4.5 부터 사용 가능 |
코드 패키지에서 R신영앱 업데이트 | 사용할 수 없음 | 4.6 부터 사용 가능 |
모델 명세에서 모델 세부사항 추적 | 라이프사이클 세부사항이 있는 팩트시트를 보려면 모델을 등록하십시오. Watson Knowledge Catalog 서비스가 필요합니다. | 4.5부터 사용할 수 있습니다. AI Factsheets 서비스가 필요합니다. |
사용자 정의 이미지 작성 및 사용 | 사용할 수 없음 | Python 또는 SPSS에 대한 사용자 정의 이미지 작성 |
협업자에게 파이프라인 이벤트 알림 | 사용할 수 없음 | 4.5 부터 메일 발송을 사용하여 협업자에게 알리십시오. |
중첩 파이프라인 사용 | 사용할 수 없음 | 4.5.2 에서 시작할 수 있습니다. |
비어 있지 않은 공간으로 프로젝트 또는 공간 파일 가져오기 | 사용할 수 없음 | 4.0.6 부터 사용 가능 |
딥 러닝 실험 | 사용할 수 없음 | Watson Machine Learning Accelerator 서비스 필요 |
IBM Cloud 서비스 인스턴스 프로비저닝 및 관리 | Watson Machine Learning 또는 Watson OpenScale에 대한 인스턴스 추가 |
관리자가 클러스터에 서비스를 프로비저닝합니다. |
Watson Knowledge Catalog
다음 Watson Knowledge Catalog 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5및 4.6: 에서 효과적으로 동일합니다.
- 프로젝트 및 카탈로그의 협업
- AI를 이용한 검색 및 카탈로그의 추천
- 카탈로그에서 자산 등급 지정 및 검토
- 프로젝트의 Data Refinery 도구
- 협업자 역할이 있는 카테고리
- 사전 정의 및 사용자 정의 분류
- 사전 정의 및 사용자 정의 데이터 클래스
- 거버넌스 규칙
- 정책
- 데이터 보호 규칙
- 프로젝트 또는 카탈로그에서 개별 관계형 데이터 자산의 수동 프로파일링
- 거버넌스된 카탈로그에 추가된 관계형 데이터 자산의 자동 프로파일링
- 사용자 정의 자산 유형, 자산의 사용자 정의 특성 및 카탈로그의 자산 간 사용자 정의 관계
이 테이블에서는 다중 배치 환경에서의 Watson Knowledge Catalog 서비스 간의 기능 차이점, 오퍼링 계획 간의 차이점 및 추가 서비스가 필요한지 여부에 대해 설명합니다. Cloud Pak for Data as a Service의 오퍼링 계획 간 기능 차이점에 대한 자세한 정보는 Watson Knowledge Catalog 오퍼링 계획을 참조하십시오.
기능 | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
구조화되지 않은 데이터의 프로파일링 | 프로젝트 또는 카탈로그에 추가되는 개별 자산의 자동 프로파일링 | 사용할 수 없음 |
프로젝트의 Metadata import 도구-감지 | 데이터 자산을 프로젝트 또는 카탈로그로 가져옵니다. 프로젝트 및 카탈로그 연결의 서브세트에 대한 지원. 메타데이터 가져오기 및 메타데이터 보강에 지원되는 데이터 소스를 참조하십시오. | 서로 다른 유형의 자산을 가져오십시오. 데이터 자산을 프로젝트 또는 카탈로그로 가져오십시오. 대부분의 지원되는 연결은 두 전개 환경 모두에서 동일합니다. 4.5: 비즈니스 인텔리전스 보고서 가져오기, 연관된 변환 스크립트가 있는 자산 또는 데이터 모델 ( 4.5.2에서 시작) 을 카탈로그로 가져옵니다. 라이센스 키가 없는 MANTA Automated Data Lineage 를 설치해야 합니다. 카탈로그 연결의 서브세트에 대한 지원. 메타데이터 가져오기 및 메타데이터 보강을 위해 지원되는 데이터 소스를 참조하십시오. |
프로젝트 계보에서 Metadata import 도구 | 사용할 수 없음 | 카탈로그만 반입한다. 라이센스 키를 사용하여 MANTA Automated Data Lineage 를 설치해야 합니다. 카탈로그 연결의 서브세트에 대한 지원. 메타데이터 가져오기 및 메타데이터 보강에 지원되는 데이터 소스를 참조하십시오. |
레거시 UI 도구 | 사용할 수 없음 대신 프로젝트의 도구를 사용한다. | Metadata import 자동화된 감지 QuickScan 데이터 품질 분석 정보 자산 보기 |
프로젝트의 메타데이터 강화 도구 | 대량의 데이터 자산 세트에서 프로파일링, 용어 지정 및 품질 분석을 실행하십시오. | 4.5부터 사용할 수 있습니다. |
자동 용어 지정 | ✓ | ✓ |
데이터 품질 점수 | 데이터 품질 점수가 다음에 표시됩니다. 프로젝트의 자산 프로파일 및 카탈로그 메타데이터 보강 결과 |
데이터 품질 점수는 다음에 표시됩니다. 프로젝트 및 카탈로그의 자산 프로파일 메타데이터 보강 결과 레거시 UI를 사용하여 빠른 스캔 결과 레거시 UI 데이터 품질 프로젝트 |
데이터 품질 분석 | ✓ | ✓ |
프로젝트의 데이터 품질 규칙 | ✓ | 4.5부터 사용할 수 있습니다. |
자산 활동 | 지불 계획이 필요합니다. 프로젝트 및 카탈로그에서 사용 가능합니다. |
프로젝트 및 카탈로그에서 사용 가능합니다. |
데이터 계보 | 사용할 수 없음 | 4.5부터 사용할 수 있습니다. |
기술 데이터 계보 | 사용할 수 없음 | 4.5부터 사용할 수 있습니다. MANTA Automated Data Lineage for IBM Cloud Pak for Data 의 라이센스 버전이 설치되어 있어야 합니다. 메타데이터 가져오기 도구를 실행하여 생성됩니다. 카탈로그에서 액세스할 수 있습니다. |
비즈니스 용어 | 일부 계획에 대해 제한합니다. | ✓ |
사전 정의된 비즈니스 용어 | 사전 정의된 비즈니스 용어 및 이를 포함하는 지식 액셀러레이터 샘플 개인 데이터 카테고리는 2022년 10월 7일이후 Lite 또는 Standard 계획으로 Watson Knowledge Catalog 서비스 인스턴스를 작성하는 경우에만 사용할 수 있습니다. | 사용할 수 없음 |
Data Privacy를 사용하여 프로젝트에서 마스킹된 데이터 세트 제공 | ✓ | 3.5에서는 사용할 수 없습니다. |
참조 데이터 세트 | 계획에 따라 한계가 있다. | ✓ |
아티팩트, 카테고리에 대한 사용자 정의 특성 | ✓ | 4.6부터 관리 메뉴에서 작성하십시오. |
아티팩트에 대한 사용자 정의 관계 | 지불 계획이 필요합니다. | 4.6부터 관리 메뉴에서 작성하십시오. |
Knowledge Accelerators | 엔터프라이즈 계획이 필요합니다. 갤러리에서 다운로드하십시오. |
커뮤니티에서 3.5용으로 다운로드하십시오. 4.5에서 시작하는 플랫폼과 함께 제공됩니다. |
거버넌스 아티팩트 및 요청에 대한 사용자 정의 워크플로우 구성 | 통제 아티팩트에 사용할 수 있습니다. | ✓ |
워크플로우 작업 모니터 | ✓ | 4.5 부터 사용 가능 |
사용자 정의 카테고리 역할 | 계획에 따라 한계가 있다. | ✓ |
관리 보고서 | 지불 계획이 필요합니다. | 4.5부터 사용할 수 있습니다. |
InfoSphere Information Server에서 자산 마이그레이션 | 사용할 수 없음 | ✓ |
DataStage
다음 테이블에서는 Cloud Pak for Data as a Service에 있는 DataStage와 Cloud Pak for Data 4.0.2 이후의 DataStage 사이의 기능 차이점에 대해 설명합니다.
기능 | Cloud Pak for Data as a Service | Cloud Pak for Data 4.0.2 이상 |
---|---|---|
PX 인스턴스 관리 | 사전 정의된 크기 세트에서 인스턴스를 프로비저닝할 수 있습니다. | Cloud Pak for Data 인스턴스 관리를 사용하여 인스턴스를 더 유연하게 프로비저닝할 수 있습니다. |
작업 컴파일 |
|
|
작업 런타임 | 각 인스턴스는 적절한 격리를 보장하기 위해 한 번에 하나의 작업만 실행할 수 있습니다. |
|
자산 관리 | .xls, .xlsx, .xml 및 .json 유형의 파일의 경우 단순 구조만 지원됩니다. | 유형 .csv, .txt, .xls, .xlsx, .xml 및 .json의 파일을 모두 지원할 수 있습니다. |
스토리지 |
|
|
Java Integration 스테이지 | 사용할 수 없음 | ✓ |
Java 라이브러리 컴포넌트 | 사용할 수 없음 | 4.6 부터 사용 가능 |
일반 JDBC 연결 | 사용할 수 없음 | ✓ |
Excel(X) | 사용할 수 없음 | ✓ |
AVI | 사용할 수 없음 | ✓ |
External Source 스테이지 | 사용할 수 없음 | ✓ |
External Target 스테이지 | 사용할 수 없음 | ✓ |
계층 단계 |
|
✓ |
MPP 및 SMP | S, M, L은 단일 노드, SMP 구성입니다. MPP-S, MPP-M, MPP-L은 MPP 구성입니다. | 기본적으로 MPP 구성만 사용할 수 있습니다. 병렬 작업 로드는 APT_CONFIG_FILE 옵션으로 구성된 로직 파티션을 통해 관리됩니다. |
SAP Bulk Extract 연결 | 사용할 수 없음 | 4.5 부터 사용 가능 |
SAP Delta Extract 연결 | 사용할 수 없음 | 4.5 부터 사용 가능 |
랩된 스테이지 | 사용할 수 없음 | 4.5 부터 사용 가능 |
SAP HANA 연결 | 사용할 수 없음 | ✓ |
ODBC 연결의 텍스트 데이터 소스 | 사용할 수 없음 | ✓ |
빌드 스테이지 | 사용할 수 없음 | 4.0.9 부터 사용 가능 |
이전/사후 작업 서브루틴을 사용하여 보고서 보내기 | 사용할 수 없음 | 4.5.2 에서 시작할 수 있습니다. |
중첩 시퀀스 작업 마이그레이션이 IBM Watson Pipelines | 사용할 수 없음 | 4.5.2 에서 시작할 수 있습니다. |
사용자 정의 스테이지 | 사용할 수 없음 | 4.5.2 에서 시작할 수 있습니다. |
Apache HBase 연결 | 사용할 수 없음 | 4.5.2 에서 시작할 수 있습니다. |
Apache Hive 연결에 대한 Kerberos 인증 | 사용할 수 없음 | 4.5.2 에서 시작할 수 있습니다. |
사용자 정의 함수(UDF) | 사용할 수 없음 | ✓ |
이전/이후-작업 특성 | 사용할 수 없음 | ✓ |
데이터 서비스 커넥터 | 사용할 수 없음 | ✓ |
복합 플랫 파일 커넥터 | 사용할 수 없음 | ✓ |
일치 디자이너 | 사용할 수 없음 | ✓ |
Survive 스테이지 | 사용할 수 없음 | 4.6.3 에서 시작하는 사용 가능 |
Slowly Changing Dimension 스테이지, Surrogate Key Generator 스테이지 및 Transformer 스테이지의 Db2 데이터베이스 시퀀스 | 사용할 수 없음 | 4.6 부터 사용 가능 |
Apache Hive 연결을 대상으로 사용하십시오. 커넥터에서 DataStage 을 선택한 경우에 사용 가능합니다.) | 사용할 수 없음 | 4.6.1 에서 시작할 수 있습니다. |
로컬 연결을 사용하여 특성 매개변수화 | 사용할 수 없음 | 4.6.1 에서 시작할 수 있습니다. |
Operational Decision Manager 스테이지 | 사용할 수 없음 | 4.6.1 에서 시작할 수 있습니다. |
Watson OpenScale
다음 Watson OpenScale 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 3.5, 4.0, 4.5및 Cloud Pak for Data 4.6: 에서 효과적으로 동일합니다.
- 공정성을 위해 배치 평가
- 배치 품질 평가
- 드리프트를 위한 모니터 배치
- 통찰력 대시보드에서 모델 결과 보기 및 비교
- 선택한 machie 학습 제공자에서 배치 추가
- 평가가 지정된 임계값 아래로 떨어질 때 트리거하도록 경보를 설정
- 사용자 인터페이스 또는 노트북에서 배치 평가
이 테이블은 다중 배치 환경에서 Watson OpenScale 서비스 사이의 기능 차이점, 오퍼링 계획 간의 차이점 및 추가 서비스가 필요한지 여부에 대해 설명합니다.
기능 | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
미리 스코어링된 테스트 데이터 업로드 | 사용할 수 없음 | 4.0.7 부터 사용 가능 |
모델 팩트시트의 평가에 대한 세부사항 보기 | ✓ | 4.5 부터 사용 가능 |
IBM SPSS Collaboration and Deployment Services | 사용할 수 없음 | ✓ |
일괄처리 | 사용할 수 없음 | ✓ |
사용자 그룹별 액세스 제어 지원 | 사용할 수 없음 | ✓ |
사용 가능한 데이터베이스 및 Postgres 계획 | ✓ | 사용할 수 없음 |
다중 인스턴스 설정하기 | 사용할 수 없음 | ✓ |
사용자 정의 평가 및 메트릭 | ✓ | 4.5 부터 사용 가능 |
OpenPages 와 통합 | 사용할 수 없음 | ✓ |
Watson Query
Cloud Pak for Data as a Service에서 데이터 가상화 기능은 Watson Query 서비스에서 제공합니다. Cloud Pak for Data에서 Data Virtualization 서비스는 버전 4.6에서 Watson Query 로 이름이 변경되었습니다. 다음 Data virtualization 기능은 Cloud Pak for Data as a Service 및 Cloud Pak for Data 4.0에서 효과적으로 동일합니다.
- 지원되는 데이터 소스에 연결
- 데이터 가상화
- 정책 및 데이터 보호 규칙을 사용하여 가상 데이터 관리
- 서비스 모니터링 및 탐색
- SQL 인터페이스 사용
- 캐싱
다음 데이터 가상화 기능은 사용자 인터페이스에서는 다르지만 동일한 기본 기능을 제공합니다.
This table describes the differences in features between Watson Query on Cloud Pak for Data as a Service and Watson Query (formerly Data Virtualization) on Cloud Pak for Data.
기능 | Cloud Pak for Data as a Service | Cloud Pak for Data |
---|---|---|
Watson Knowledge Catalog와 통합 | 필수 | 선택적 |
그룹 기반 권한 부여 및 그룹에 대한 오브젝트 레벨 액세스 | 사용할 수 없음 | ✓ |
원격 커넥터 지원 | SaaS 에 적용할 수 없음 | ✓ |
파일 시스템 기반 데이터 소스 지원(Cloud Object Storage 제외) | SaaS 에 적용할 수 없음 | ✓ |
업로드된 JDBC 드라이버가 필요한 데이터 소스에 연결 (예: SAP HANA, 일반 JDBC ) | SaaS 에 적용할 수 없음 | ✓ |
사용자 인터페이스에서 통계 수집 | 사용할 수 없음 | ✓ |
오브젝트 가상화 중에 자동 통계 수집 | 사용할 수 없음 | ✓ |
열 마스킹 | ✓ | ✓ |
뷰 및 테이블 다시 로드 탐색 | ✓ | 4.5 부터 사용 가능 |
통계 콜렉션에서 데이터 샘플링 | ✓ | 4.5 부터 사용 가능 |
행 레벨 정책을 사용하여 데이터 관리 지원 | 사용할 수 없음 | 4.5 부터 사용 가능 |
메타데이터 강화 | ✓ | 4.5 부터 사용 가능 |
데이터 보호 규칙의 캐싱 | 사용할 수 없음 | 4.5 부터 사용 가능 |
여러 그룹에 대한 액세스 관리 | 사용할 수 없음 | 4.5 부터 사용 가능 |
Cloud Object Storage 에서 CSV 또는 TSV 파일 지원 | SaaS 에 적용할 수 없음 | 4.6 부터 사용 가능 |
Cloud Object Storage 의 연결에 대한 신임 정보 | SaaS 에 적용할 수 없음 | 4.6 부터 사용 가능 |