Cloud Pak for Data 배치 간 기능 차이점

Cloud Pak for Data as a Service 및 Cloud Pak for Data 4.0 및 3.5 소프트웨어는 기능 및 구현에 몇 가지 차이점이 있습니다. Cloud Pak for Data as a Service는 일련의 IBM Cloud 서비스입니다. Cloud Pak for Data 4.0 및 3.5는 설치하고 유지보수해야 하는 소프트웨어로 제공됩니다. 두 배치 모두에서 사용 가능한 서비스는 Cloud Pak for Data 4.0 및 3.5와 비교하여 Cloud Pak for Data as a Service의 기능에 차이가 있습니다.

플랫폼 차이점

Cloud Pak for Data as a Service 및 Cloud Pak for Data 4.0은 공통 코드 베이스를 공유하지만 다음과 같은 주요 방법으로 서로 다릅니다.

기능 Cloud Pak for Data as a Service Cloud Pak for Data
소프트웨어, 하드웨어 및 설치 Cloud Pak for Data as a Service는 IBM이 IBM Cloud에서 완전히 관리합니다. 소프트웨어 업데이트는 자동입니다. 계산 자원 및 스토리지의 크기 조정은 자동입니다. https://dataplatform.cloud.ibm.com에 등록합니다. 하드웨어를 제공하고 유지보수합니다. Cloud Pak for Data 소프트웨어를 설치, 유지보수 및 업그레이드합니다. 소프트웨어 요구사항을(를) 참조하십시오.
스토리지 IBM Cloud Object Storage 서비스 인스턴스를 프로비저닝하여 스토리지를 제공합니다. IBM Cloud Object Storage를 참조하십시오. Red Hat OpenShift 클러스터에 파일 스토리지 시스템을 제공합니다. 스토리지 요구 사항을(를) 참조하십시오.
워크로드를 실행하기 위한 자원 계산 사용자는 작업에 적합한 런타임을 선택합니다. 런타임 환경 및 작업 지속 기간에 대한 비율을 기반으로 계산 사용법이 청구됩니다. 계정 자원 사용 모니터를 참조하십시오. 적절한 수의 vCPU를 사용하여 Red Hat OpenShift 클러스터 및 노드의 수를 설정합니다. 하드웨어 요구사항플랫폼 모니터링을(를) 참조하십시오.
비용 적절한 계획 레벨에서 필요한 각 서비스를 구매합니다. 많은 서비스가 자원 소비를 계산합니다. 탐색 메뉴에서 서비스 > 서비스 카탈로그를 선택하여 IBM Cloud 카탈로그 또는 Cloud Pak for Data as a Service의 서비스 카탈로그에서 각 서비스 페이지를 참조하십시오. Cloud Pak for Data에 대한 라이센스와 필요한 각 서비스를 구매합니다. Cloud Pak for Data을(를) 참조하십시오.
보안, 준수 및 격리 Cloud Pak for Data as a Service의 데이터 보안, 네트워크 보안, 보안 표준 준수 및 분리는 IBM Cloud에 의해 관리됩니다. 추가 보안 및 암호화 옵션을 설정할 수 있습니다. Cloud Pak for Data as a Service의 보안을 참조하십시오. Red Hat OpenShift 컨테이너 플랫폼은 기본 보안 기능을 제공합니다. Cloud Pak for Data는 다양한 개인정보 보호정책 및 준수 규정에 대해 평가되며 다양한 개인정보 보호정책 및 준수 평가에 대비하여 사용할 수 있는 기능을 제공합니다. 사용자는 추가 보안 기능, 암호화 및 네트워크 격리를 담당합니다. 보안 고려사항을(를) 참조하십시오.
사용 가능한 서비스 대부분의 데이터 패브릭 서비스는 두 배치 환경 모두에서 사용 가능합니다.
Cloud Pak for Data as a Service에 대한 서비스를 참조하십시오.
다른 많은 서비스를 포함합니다. 참조 Services for Cloud Pak for Data 4.0.
사용자 관리 사용자 및 사용자 그룹을 추가하고 IBM Cloud Identity and Access Management로 계정 역할 및 권한을 관리합니다. 계정에 사용자 추가를 참조하십시오.
IBM Cloud에서 SAML 연합을 설정할 수도 있습니다. 참조 IBM Cloud 문서: IBM Cloud Identity and Access Management 소개
관리 메뉴에서 사용자를 추가하고 사용자 그룹을 작성할 수 있습니다. ID 및 액세스 관리 서비스를 사용하거나 기존의 SAML SSO 또는 LDAP 제공자를 ID 및 암호 관리에 사용할 수 있습니다. 사용자 관리을(를) 참조하십시오.

서비스 전반에 걸친 공통 기능

서비스의 다음 기능은 Cloud Pak for Data 3.5 및 Cloud Pak for Data 4.0과 동일하게 Cloud Pak for Data as a Service에서 동일합니다.

  • 플랫폼에서 자산 및 아티팩트에 대한 글로벌 검색
  • 플랫폼 전반에서 연결을 공유하기 위한 플랫폼 자산 카탈로그
  • 플랫폼 전반의 협업 작업공간 내 역할 기반 사용자 관리
  • 자산 및 작업공간에 대한 공통 인프라
  • 서비스를 추가하기 위한 서비스 카탈로그
  • 관리 메뉴에서 계산 사용법 보기

다음 테이블에서는 Cloud Pak for Data as a Service와 Cloud Pak for Data 3.5 및 4.0 사이의 서비스 간 기능의 차이점에 대해 설명합니다.

기능 Cloud Pak for Data as a Service Cloud Pak for Data
업데이트된 프로젝트 경험 새로운 프로젝트 경험을 참조하십시오. 사용 불가능
원격 데이터 소스에 대한 연결 지원되는 대부분의 데이터 소스는 두 배치 환경 모두에 공통적입니다.
지원되는 연결을 참조하십시오.
지원되는 데이터 소스을(를) 참조하십시오.
개인용 또는 공유된 연결 신임 정보 프로젝트 및 카탈로그의 연결에는 개인 신임 정보가 필요하거나 공유 신임이 허용될 수 있습니다. 계정 레벨에서 공유 신임 정보를 사용하지 않도록 설정할 수 있습니다. 플랫폼 연결에는 개인 신임 정보가 필요하거나 공유 신임 정보가 허용될 수 있습니다. 공유 신임 정보는 플랫폼 레벨에서 사용 불가능할 수 있습니다.
볼트에 있는 시크릿 정보의 연결 신임 정보 사용 불가능
갤러리의 샘플 자산 및 프로젝트 사용 불가능
데이터 액세스 요청 사용 불가능

Watson Studio

다음 Watson Studio 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 3.5 및 Cloud Pak for Data 4.0에서 효과적으로 동일합니다.

  • 프로젝트에서 협업
  • 프로젝트 ZIP 파일을 사용하여 프로젝트 가져오기 및 내보내기
  • Jupyter 노트북
  • 작업 스케줄링
  • Data Refinery

이 테이블은 다중 배치 환경에서의 Watson Studio 서비스 간 기능 차이점, 오퍼링 계획 간의 차이점 및 추가 서비스가 필요한지 여부를 설명합니다. Cloud Pak for Data as a Service의 오퍼링 계획 간 기능 차이점에 대한 자세한 정보는 Watson Studio 오퍼링 계획을 참조하십시오.

기능 Cloud Pak for Data as a Service Cloud Pak for Data
프로젝트 작성 작성:
- 비어 있는 프로젝트
- 갤러리의 샘플에서의 프로젝트
- 파일의 프로젝트
작성:
- 비어 있는 프로젝트
-
파일에서의 프로젝트 - Git 통합을 갖는 프로젝트
Git 통합 - GitHub에서 노트북을 게시합니다.
- 노트북을 요점으로 게시
- 프로젝트를 Git
- 하나의 프로젝트에 있는 저장소에 통합하고 해당 자산을 다른 프로젝트에 사용합니다.
고급 Git 조작을 위한 프로젝트 터미널 사용 불가능 기본 Git 통합이 있는 프로젝트에서 사용 가능
JupyterLab 사용 불가능 Git 통합과 함께 프로젝트에서 사용 가능
RStudio Git와 통합할 수 없음 Git와 통합할 수 있음 RStudio Server와 R 서비스가 필요합니다.
Python 스크립트 사용 불가능 JupyterLab에서 Python 스크립트에 대한 작업을 수행하십시오. Python 서비스가 있는 Jupyter 노트북 또는 Jupyter 노트북이 필요합니다.
프로그램으로 프로젝트 자산 액세스 Python 및 R에 project-lib 사용 Python 및 R(project-lib의 후속 작업)에 ibm-watson-studio-lib을(를) 사용하십시오.
비행 서비스를 사용하여 노트북에 코드 삽입 사용 불가능
노트북 라이프사이클 관리 사용 불가능 노트북 라이프사이클 관리에 CPDCTL 사용
코드 패키지 자산(폴더 구조의 종속 파일 세트) 사용 불가능 CPDCTL을 사용하여 배치 공간에 코드 패키지 자산 작성
노트북을 공간으로 승격 사용 불가능 프로젝트의 자산 페이지에서 수동으로 사용 가능하거나 CPDCTL을 사용하여 프로그래밍 방식으로 사용 가능
GPU 사용 Python 단일 GPU 유형에만 사용 가능한 지원(Nvidia K80) 다중 엔비디아 GPU 유형에 사용할 수 있는 지원. GPU 서비스가 있는 Python과 함께 Jupyter 노트북이 필요합니다.
사용자 정의 이미지 작성 및 사용 사용 불가능 Python(GPU가 있고 없음), R, JupyterLab(GPU 포함 및 사용 안함), RStudio 및 SPSS 환경에 대한 사용자 정의 이미지 작성
아나콘다 저장소 사용 불가능 사용자 정의 환경 및 사용자 정의 이미지를 작성하는 데 사용
Hadoop 통합 사용 불가능 모델을 빌드하고 훈련하고 Hadoop 클러스터에서 Data Refinery 플로우를 실행하십시오. Apache Hadoop 서비스에 대한 실행 엔진이 필요합니다.
Decision Optimization Decision Optimization 서비스가 필요합니다.
SPSS Modeler SPSS Modeler 서비스가 필요합니다.
대시보드 Cognos Dashboard Embedded 서비스가 필요합니다. Cognos Dashboards 서비스가 필요합니다.

Cloud Pak for Data as a Service 및 Cloud Pak for Data에서 Watson Studio Desktop과 Watson Studio 간의 차이점은 Watson Studio 배치 간의 기능 차이점을(를) 참조하십시오.

Watson Machine Learning

다음 Watson Machine Learning 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 3.5 및 Cloud Pak for Data 4.0에서 효과적으로 동일합니다.

  • AutoAI 실험 작성 및 배치
  • 배치 공간에서 협업
  • 모델 배치
  • 함수 배치
  • Watson Machine Learning REST API
  • Watson Machine Learning Python 클라이언트
  • 일괄처리 배치 작업 작성
  • 온라인 배포 작성
  • 배치 규모 및 업데이트 배치
  • 사용자 정의 컴포넌트 정의 및 사용
  • Federated Learning을 사용하여 별도의 보안 데이터 소스로 공통 모델을 훈련
  • 영역 전체에서의 배치 모니터링

이 테이블은 다중 배치 환경에서 Watson Machine Learning 서비스 사이의 기능 차이점, 오퍼링 계획 간의 차이점 및 추가 서비스가 필요한지 여부에 대해 설명합니다. Cloud Pak for Data as a Service에 대한 오퍼링 계획 간 기능 차이점에 대한 자세한 내용은 Watson Machine Learning 오퍼링 계획을 참조하십시오.

기능 Cloud Pak for Data as a Service Cloud Pak for Data
유명한 프레임워크
및 소프트웨어 스펙을 사용하여 배치
최신 지원되는 버전을 확인하십시오. 지원되는 버전은 릴리스별로 다릅니다.
일괄처리 배치를 위해 데이터베이스에 연결 배치 유형별 지원을 확인하십시오. 배치 유형
및 버전별 지원 확인
Python 스크립트 배치 Python 클라이언트를 통해 사용 가능 JupyterLab에서 스크립트를 작성한 후 배치
Shiny 앱 배치 사용 불가능 새로운 앱 작성 및 배치
가상 배치(CoreML) iOS용 앱 작성 더 이상 사용되지 않음
제거 예정
공정성, 편향성 또는 드리프트에 대한 작업 평가 Watson OpenScale이 필요합니다. Watson OpenScale이 필요합니다.
제어 영역 작성 역할 제한 없음 공간을 보고 작성할 수 있는 사용자를 제어하려면 권한을 사용하십시오.
모델 명세에서 모델 세부사항 추적 라이프사이클 세부사항이 있는 팩트시트를 보기 위해 모델을 등록 사용 불가능
사용자 정의 이미지 작성 및 사용 사용 불가능 Python 또는 SPSS에 대한 사용자 정의 이미지 작성
AI 라이프사이클 이벤트 자동화 Watson Studio Pipelines(베타)을 사용하여 엔드-투-엔드 플로우
CPDCTL을 사용하여 라이프사이클 이벤트 자동화
비어 있지 않은 공간으로 프로젝트 또는 공간 파일 가져오기 사용 불가능 사용 가능, 4.0.6부터 시작
딥 러닝 실험 더 이상 사용되지 않으며 제거 예정 Watson Machine Learning Accelerator 서비스 필요
IBM Cloud 서비스 인스턴스 프로비저닝 및 관리 Watson Machine Learning
또는 Watson OpenScale에 대한 인스턴스 추가
관리자가
클러스터에 서비스를 프로비저닝합니다.

{: caption=" Watson Machine Learning 배치 간 기능 차이점" caption-side="top"}

Watson Knowledge Catalog

다음 Watson Knowledge Catalog 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 3.5 및 Cloud Pak for Data 4.0에서 효과적으로 동일합니다.

  • AI를 이용한 검색 및 카탈로그의 추천
  • 카탈로그에서 자산 등급 지정 및 검토
  • 프로젝트 및 카탈로그의 협업
  • 프로젝트의 Data Refinery 도구
  • 협업자 역할이 있는 카테고리
  • 사전 정의된 분류
  • 사전 정의된 데이터 클래스
  • 거버넌스 규칙
  • 프로젝트 또는 카탈로그에서 개별 관계형 데이터 자산의 수동 프로파일링
  • 거버넌스된 카탈로그에 추가된 관계형 데이터 자산의 자동 프로파일링

이 테이블은 다중 배치 환경에서 Watson Knowledge Catalog 서비스 사이의 기능 차이점, 오퍼링 계획 간의 차이점 및 추가 서비스가 필요한지 여부에 대해 설명합니다. Cloud Pak for Data as a Service의 오퍼링 계획 간 기능 차이점에 대한 자세한 정보는 Watson Knowledge Catalog 오퍼링 계획을 참조하십시오.

기능 Cloud Pak for Data as a Service Cloud Pak for Data
구조화되지 않은 데이터의 프로파일링 프로젝트 또는 카탈로그에 추가되는 개별 자산의 자동 프로파일링 사용할 수 없음.
프로젝트의 메타데이터 가져오기 도구 프로젝트 및 카탈로그 연결의 서브세트에 대한 지원. 메타데이터 가져오기 연결을 참조하십시오. 지원되는 대부분의 연결은 두 배치 환경 모두 동일합니다. 3.5에 대한 메타데이터 가져오기 연결4.0에 대한 메타데이터 가져오기 연결 수을(를) 참조하십시오.
레거시 UI를 사용한 메타데이터 가져오기 사용할 수 없음. 대신 프로젝트에서 메타데이터 가져오기를 사용하십시오. IBM InfoSphere DataStage, QualityStage Designer 및 메타데이터 교환 서버가 필요합니다. 프로젝트에서 메타데이터 가져오기와 다른 연결 세트를 지원합니다. 메타데이터 가져오기 커넥터메타데이터 가져오기 브릿지을(를) 참조하십시오.
메타데이터 강화 도구 Professional 또는 Enterprise 계획이 필요합니다.
프로젝트에서 사용 가능합니다.
사용할 수 없음. 프로파일링을 사용하거나, 해당 옵션을 사용하여 감지하거나, 대신 품질 프로젝트에서 분석을 실행하십시오.
고급 데이터 큐레이션 툴 사용할 수 없음. 대신 메타데이터 가져오기 및 메타데이터 보강 도구를 사용하십시오. 데이터 발견 및 품질 프로젝트에 대한 작업을 수행합니다.
자동화된 용어 지정 메타데이터 보강 도구에서 사용 가능합니다. 감지 작업의 일부:
- 항상 빠른 스캔 작업에 포함됨
- 자동화된 감지에서 선택사항
데이터 품질 점수 데이터 품질 점수가 다음에 표시됩니다.
- 프로젝트 및 카탈로그의 자산 프로파일
- 메타데이터 보강 결과
데이터 품질 점수가 다음에 표시됩니다.
- 분석 프로젝트 및 카탈로그의 자산 프로파일
- 빠른 스캔 결과
- 데이터 품질 프로젝트
데이터 품질 분석 메타데이터 강화 도구에서 실행합니다. 자동화된 감지 작업 또는 데이터 규칙이 있는 품질 프로젝트에서 실행하십시오.
사용자 정의 자산 유형 및 자산 속성 Professional 또는 Enterprise 계획이 필요합니다.
Watson 데이터 API로 작성하십시오.
Watson 데이터 API로 작성하십시오.
자산 활동 지불 계획이 필요합니다.
프로젝트 및 카탈로그에서 사용 가능합니다.
분석 프로젝트 및 카탈로그에서 사용 가능합니다.
정보 자산 보기 사용 불가능 추가 특성 및 정보를 표시하기 위한 기본 카탈로그의 개별 보기입니다.
운영 데이터 계보 사용 불가능 정보 자산 보기에서 사용 가능합니다. 카탈로그에는 보이지 않습니다.
관계 그래프 사용 불가능 정보 자산 보기에서 사용 가능합니다. 카탈로그에는 보이지 않습니다.
사용자 정의 분류 Professional 또는 Enterprise 계획이 필요합니다.
사용자 정의 데이터 클래스 Professional 또는 Enterprise 계획이 필요합니다.
비즈니스 용어 일부 계획에 대해 제한합니다.
정책 일부 계획에 대해 제한합니다.
데이터 보호 규칙 일부 계획에 대해 제한합니다.
Data Privacy를 사용하여 프로젝트에서 마스킹된 데이터 세트 제공 엔터프라이즈 계획이 필요합니다. 3.5에서는 사용할 수 없습니다.
참조 데이터 세트 일부 계획에 대해 제한합니다.
아티팩트, 카테고리에 대한 사용자 정의 속성 및 관계 Professional 또는 Enterprise 계획이 필요합니다.
Watson 데이터 API를 사용하여 작성하십시오.
관리 메뉴 또는 Watson 데이터 API를 사용하여 작성하십시오.
Knowledge Accelerators Enterprise 계획이 필요합니다.
갤러리에서 다운로드하십시오.
커뮤니티에서 다운로드.
거버넌스 아티팩트의 워크플로우 Lite및 Standard 계획은 작성자가 검토 또는 승인 없이 아티팩트를 게시할 수 있도록 허용합니다.
Enterprise 및 Professional 계획은 여러 단계로 여러 템플리트를 제공합니다.
다중 단계가 포함된 템플리트가 여러 개 있습니다.
거버넌스 아티팩트 및 요청에 대한 사용자 정의 워크플로우 구성 사용 불가능
InfoSphere Information Server에서 자산 마이그레이션 사용 불가능

DataStage

다음 테이블에서는 Cloud Pak for Data as a Service에 있는 DataStage와 Cloud Pak for Data 4.0.2 이후의 DataStage 사이의 기능 차이점에 대해 설명합니다.

기능 Cloud Pak for Data as a Service Cloud Pak for Data 4.0.2 이상
PX 인스턴스 관리 사전 정의된 크기 세트에서 인스턴스를 프로비저닝할 수 있습니다. Cloud Pak for Data 인스턴스 관리를 사용하여 인스턴스를 더 유연하게 프로비저닝할 수 있습니다.
작업 컴파일
  • OSH는 컴파일 중에 생성됩니다.
  • 런타임 시 변환기가 컴파일됩니다.
  • OSH는 컴파일 중에 생성됩니다.
  • 변환기는 컴파일 시간 동안 컴파일되며 /ds-storage 마운트에 사용할 수 있습니다.
  • 컴파일은 동기식으로 수행됩니다.
작업 런타임 각 인스턴스는 적절한 격리를 보장하기 위해 한 번에 하나의 작업만 실행할 수 있습니다.
  • 동시 작업 실행이 지원됩니다.
  • 동시성은 인스턴스 용량 및 /px-storage/config/wlm.config.properties 파일의 설정에 따라 결정됩니다.
자산 관리 .xls, .xlsx, .xml 및 .json 유형의 파일의 경우 단순 구조만 지원됩니다. 유형 .csv, .txt, .xls, .xlsx, .xml 및 .json의 파일을 모두 지원할 수 있습니다.
스토리지
  • POSIX 유형 파일 기반 실제 스토리지는 사용할 수 없습니다.
  • Cloud Object Storage 프로젝트 버킷을 사용하여 스토리지를 에뮬레이트합니다.
  • 실제 스토리지는 /px-storage/ds-storage에서 사용할 수 있습니다.
  • PX 런타임 팟에 더 많은 스토리지를 마운트할 수 있습니다. DataStage에 NFS 마운트 설정을(를) 참조하십시오.
Java Integration 스테이지 사용 불가능
JDBC 사용 불가능
Excel 사용 불가능
AVI 사용 불가능
External Source 스테이지 사용 불가능
External Target 스테이지 사용 불가능
계층 단계
  • XML 구문 분석기 및 JSON 구문 분석기의 단일 파일 또는 파일 세트 옵션을 사용할 수 없습니다.
  • XML 작성기 및 JSON 작성기에 대한 단일 파일, 파일 세트 및 대형 오브젝트 옵션을 사용할 수 없습니다.
MPP 및 SMP S, M, L은 단일 노드, SMP 구성입니다. MPP-S, MPP-M, MPP-L은 MPP 구성입니다. 기본적으로 MPP 구성만 사용할 수 있습니다. 병렬 작업 로드는 APT_CONFIG_FILE 옵션으로 구성된 로직 파티션을 통해 관리됩니다.
  • 공정성을 위해 배치 평가
  • 배치 품질 평가
  • 드리프트를 위한 모니터 배치
  • 통찰력 대시보드에서 모델 결과 보기 및 비교
  • 선택한 machie 학습 제공자에서 배치 추가
  • 평가가 지정된 임계값 아래로 떨어질 때 트리거하도록 경보를 설정
  • 사용자 인터페이스 또는 노트북에서 배치 평가{: .blue}

Watson Query 및 Data Virtualization

Cloud Pak for Data as a Service에서 데이터 가상화 기능은 Watson Query 서비스에서 제공합니다. Cloud Pak for Data에서는 Data Virtualization 서비스가 동일한 기능을 제공합니다. 다음 데이터 가상화 기능은 Cloud Pak for Data as a Service 및 Cloud Pak for Data 4.0에서 효과적으로 동일합니다.

  • 지원되는 데이터 소스에 연결
  • 데이터 가상화
  • 정책 및 데이터 보호 규칙을 사용하여 가상 데이터 관리
  • 서비스 모니터링 및 탐색
  • SQL 인터페이스 사용
  • 캐싱

다음 데이터 가상화 기능은 사용자 인터페이스에서는 다르지만 동일한 기본 기능을 제공합니다.

이 테이블에서는 Cloud Pak for Data as a Service에서의 Watson Query와 Cloud Pak for Data에서의 Data Virtualization 간의 기능 차이점을 설명합니다.

기능 Cloud Pak for Data as a Service Cloud Pak for Data
Watson Knowledge Catalog와 통합 필요 선택사항
그룹 기반 권한 부여 및 그룹에 대한 오브젝트 레벨 액세스 사용 불가능
원격 커넥터 지원 사용 불가능
파일 시스템 기반 데이터 소스 지원(Cloud Object Storage 제외) 사용 불가능
JDBC 연결을 사용하여 데이터 소스에 연결(예: SAP HANA) 사용 불가능 ✓ 사용자 업로드 JDBC 드라이버 사용
사용자 인터페이스에서 통계 수집 사용 불가능
열 마스킹 사용 불가능

자세히 보기

상위 주제: Cloud Pak for Data as a Service