0 / 0
영어 버전 문서로 돌아가기
Cloud Pak for Data 배치 간 기능 차이점

Cloud Pak for Data 배치 간 기능 차이점

Cloud Pak for Data as a Service 및 Cloud Pak for Data 소프트웨어의 기능 및 구현에는 몇 가지 차이점이 있습니다. Cloud Pak for Data as a Service는 일련의 IBM Cloud 서비스입니다. Cloud Pak for Data 4.8 은 설치하고 유지보수해야 하는 소프트웨어로 제공됩니다. 두 배치 모두에서 사용 가능한 서비스는 Cloud Pak for Data 4.8, 4.7및 4.6과 비교하여 Cloud Pak for Data as a Service 의 기능에도 차이가 있습니다.

플랫폼 차이점

Cloud Pak for Data as a Service 및 Cloud Pak for Data 소프트웨어는 공통 코드 베이스를 공유하지만 다음과 같은 주요 방식에서 차이가 있습니다.

플랫폼 차이점
기능 서비스로서의 소프트웨어
소프트웨어, 하드웨어 및 설치 Cloud Pak for Data as a Service는 IBM이 IBM Cloud에서 완전히 관리합니다. 소프트웨어 업데이트는 자동입니다. 계산 자원 및 스토리지의 크기 조정은 자동입니다. https://dataplatform.cloud.ibm.com에서 등록합니다. 하드웨어를 제공하고 유지보수합니다. 소프트웨어를 설치, 유지보수 및 업그레이드합니다. 소프트웨어 요구사항을 참조하십시오.
스토리지 IBM Cloud Object Storage 서비스 인스턴스를 프로비저닝하여 스토리지를 제공합니다. IBM Cloud Object Storage를 참조하십시오. Red Hat OpenShift 클러스터에 지속적 스토리지를 제공합니다. 스토리지 요구사항을 참조하십시오.
워크로드를 실행하기 위한 자원 계산 사용자는 작업에 적합한 런타임을 선택합니다. 런타임 환경 및 작업 지속 기간에 대한 비율을 기반으로 계산 사용법이 청구됩니다. 계정 자원 사용 모니터를 참조하십시오. 적절한 수의 vCPUs를 사용하여 Red Hat OpenShift 노드의 수를 설정합니다. 하드웨어 요구사항플랫폼 모니터링을 참조하십시오.
비용 적절한 계획 레벨에서 필요한 각 서비스를 구매합니다. 많은 서비스가 자원 소비를 계산합니다. 탐색 메뉴에서 서비스 > 서비스 카탈로그 를 선택하여 IBM Cloud 카탈로그 또는 Cloud Pak for Data as a Service의 서비스 카탈로그의 각 서비스 페이지를 참조하십시오. 필요한 서비스를 기반으로 소프트웨어 라이센스를 구매합니다. 예를 들어, Cloud Pak for Data Enterprise Edition 라이센스에는 Watson Studio 또는 IBM Knowledge Catalog와 같은 서비스에 대한 인타이틀먼트가 포함되어 있습니다. Cloud Pak for Data를 참조하십시오.
보안, 준수 및 격리 Cloud Pak for Data as a Service의 데이터 보안, 네트워크 보안, 보안 표준 준수 및 분리는 IBM Cloud에 의해 관리됩니다. 추가 보안 및 암호화 옵션을 설정할 수 있습니다. Cloud Pak for Data as a Service의 보안을 참조하십시오. Red Hat OpenShift 컨테이너 플랫폼은 기본 보안 기능을 제공합니다. Cloud Pak for Data는 다양한 개인정보 보호정책 및 준수 규정에 대해 평가되며 다양한 개인정보 보호정책 및 준수 평가에 대비하여 사용할 수 있는 기능을 제공합니다. 사용자는 추가 보안 기능, 암호화 및 네트워크 격리를 담당합니다. 보안 고려사항을 참조하십시오.
사용 가능한 서비스 대부분의 데이터 패브릭 서비스는 두 배치 환경 모두에서 사용 가능합니다.
Cloud Pak for Data as a Service에 대한 서비스를 참조하십시오.
다른 많은 서비스를 포함합니다. Cloud Pak for Data 4.8의 서비스를 참조하십시오.
사용자 관리 사용자 및 사용자 그룹을 추가하고 IBM Cloud Identity and Access Management로 계정 역할 및 권한을 관리합니다. 계정에 사용자 추가를 참조하십시오.
IBM Cloud에서 SAML 연합을 설정할 수도 있습니다. IBM Cloud 문서: IBM Cloud IAM 작동 방식을 참조하십시오.
관리 메뉴에서 사용자를 추가하고 사용자 그룹을 작성할 수 있습니다. ID 및 액세스 관리 서비스를 사용하거나 기존의 SAML SSO 또는 LDAP 제공자를 ID 및 암호 관리에 사용할 수 있습니다. 동적 속성 기반 사용자 그룹을 작성할 수 있습니다. 사용자 관리를 참조하십시오.

서비스 전체의 공통 코어 기능

플랫폼과 함께 제공되는 다음 핵심 기능은 Cloud Pak for Data as a Service, Cloud Pak for Data 소프트웨어, 버전 4.8, 4.7및 4.6:

  • 플랫폼에서 자산 및 아티팩트에 대한 글로벌 검색
  • 플랫폼 전반에서 연결을 공유하기 위한 플랫폼 자산 카탈로그
  • 플랫폼 전반의 협업 작업공간 내 역할 기반 사용자 관리
  • 자산 및 작업공간에 대한 공통 인프라
  • 서비스를 추가하기 위한 서비스 카탈로그
  • 관리 메뉴에서 계산 사용법 보기

다음 표에서는 Cloud Pak for Data as a Service 와 Cloud Pak for Data 소프트웨어 버전 4.8, 4.7및 4.6간의 서비스에서 핵심 기능의 차이점을 설명합니다.

서비스 간 공통 기능의 차이는가 있습니다.
기능 서비스로서의 소프트웨어
모든 프로젝트 관리 IBM Cloud Pak for Data 서비스에 대한 IAM 서비스 액세스 관리자 역할의 프로젝트 관리 권한이 있는 사용자는 Admin 역할을 가진 모든 프로젝트를 결합한 후 프로젝트를 관리하거나 삭제할 수 있습니다. 프로젝트 관리 권한이 있는 사용자는 관리 역할을 가진 프로젝트를 결합한 후 프로젝트를 관리하거나 삭제할 수 있습니다.
원격 데이터 소스에 대한 연결 지원되는 대부분의 데이터 소스는 두 배치 환경 모두에 공통적입니다.
지원되는 연결을 참조하십시오.
지원되는 데이터 소스를 참조하십시오.
개인용 또는 공유된 연결 신임 정보 프로젝트 및 카탈로그의 연결에는 개인 신임 정보가 필요하거나 공유 신임이 허용될 수 있습니다. 계정 레벨에서 공유 신임 정보를 사용하지 않도록 설정할 수 있습니다. 플랫폼 연결에는 개인 신임 정보가 필요하거나 공유 신임 정보가 허용될 수 있습니다. 공유 신임 정보는 플랫폼 레벨에서 사용 불가능할 수 있습니다.
볼트에 있는 시크릿 정보의 연결 신임 정보 사용할 수 없음 사용 가능
Kerberos 인증 사용할 수 없음 일부 서비스 및 연결 에 사용 가능
자원 허브 앱의 샘플 자산 및 프로젝트 사용 가능 사용할 수 없음
사용자 정의 JDBC 커넥터 사용할 수 없음 4.8.0 부터 사용 가능

Watson Studio

다음 Watson Studio 기능은 Cloud Pak for Data as a Service 및 Cloud Pak for Data 소프트웨어, 버전 4.8, 4.7및 4.6:

  • 프로젝트 및 배치 공간에서 협업
  • 프로그래밍 방식으로 프로젝트 자산에 액세스
  • 프로젝트 ZIP 파일을 사용하여 프로젝트 가져오기 및 내보내기
  • Jupyter 노트북
  • 작업 스케줄링
  • Data Refinery
  • Python 용 Watson 자연어 처리

이 표에서는 as-a-service및 소프트웨어 배치 환경에서 Watson Studio 서비스 간의 기능 차이, 오퍼링 플랜 간의 차이 및 추가 서비스가 필요한지 여부에 대해 설명합니다. Cloud Pak for Data as a Service의 오퍼링 계획 간 기능 차이점에 대한 자세한 정보는 Watson Studio 오퍼링 계획을 참조하십시오.

Watson Studio 의 차이점
기능 서비스로서의 소프트웨어
프로젝트 작성 작성:
비어 있는 프로젝트
자원 허브에 있는 샘플의 프로젝트
파일의 프로젝트
작성:
비어 있는 프로젝트
파일의 프로젝트
Git 통합이 있는 프로젝트
Git 통합 GitHub 에 노트북 공개
노트북을 gist로 공개
Git
와 프로젝트를 통합하여 한 프로젝트의 저장소에 자산을 동기화하고 해당 자산을 다른 프로젝트에 사용합니다.
고급 Git 조작을 위한 프로젝트 터미널 사용할 수 없음 기본 Git 통합이 있는 프로젝트에서 사용 가능
폴더가 있는 프로젝트에서 자산 구성 사용할 수 없음 4.8.0 부터 사용 가능
JupyterLab 사용할 수 없음 Git 통합과 함께 프로젝트에서 사용 가능
Visual Studio Code 통합 사용할 수 없음 4.6부터 Git 통합을 사용하는 프로젝트에서 사용 가능합니다.
RStudio Git와 통합할 수 없음 Git와 통합할 수 있음 RStudio Server Runtimes 서비스가 필요합니다.
Python 스크립트 사용할 수 없음 JupyterLab에서 Python 스크립트에 대한 작업을 수행하십시오. Watson Studio 런타임 서비스가 필요합니다.
Flight service 를 사용하여 노트북에 데이터를 로드하기 위한 코드 생성 사용할 수 없음 사용 가능
노트북 라이프사이클 관리 사용할 수 없음 노트북 라이프사이클 관리에 CPDCTL 사용
코드 패키지 자산(폴더 구조의 종속 파일 세트) 사용할 수 없음 CPDCTL을 사용하여 배치 공간에 코드 패키지 자산 작성
노트북을 공간으로 승격 사용할 수 없음 프로젝트의 자산 페이지에서 수동으로 사용 가능하거나 CPDCTL을 사용하여 프로그래밍 방식으로 사용 가능
GPU 사용 Python 단일 GPU 유형에 대해서만 사용 가능한 지원 다중 엔비디아 GPU 유형에 사용할 수 있는 지원. Watson Studio 런타임 서비스가 필요합니다.
사용자 정의 이미지 작성 및 사용 사용할 수 없음 Python (GPU 포함 및 포함하지 않음), R, JupyterLab (GPU 포함 및 포함하지 않음), RStudio및 SPSS 환경에 대한 사용자 정의 이미지를 작성합니다. Watson Studio 런타임 및 기타 적용 가능한 서비스가 필요합니다.
아나콘다 저장소 사용할 수 없음 사용자 정의 환경 및 사용자 정의 이미지를 작성하는 데 사용
Hadoop 통합 사용할 수 없음 모델을 빌드하고 훈련하고 Hadoop 클러스터에서 Data Refinery 플로우를 실행하십시오. Apache Hadoop 서비스에 대한 실행 엔진이 필요합니다.
Decision Optimization 사용 가능 Decision Optimization 서비스가 필요합니다.
SPSS Modeler 사용 가능 SPSS Modeler 서비스가 필요합니다.
Watson Pipelines 사용 가능 Watson Pipelines 서비스가 필요합니다.

Watson Machine Learning

다음 Watson Machine Learning 기능은 Cloud Pak for Data as a Service 및 Cloud Pak for Data 소프트웨어, 버전 4.8, 4.7및 4.6:

  • 프로젝트 및 배치 공간에서 협업
  • 모델 배포
  • 함수 배치
  • Watson Machine Learning REST API
  • Watson Machine Learning Python 클라이언트
  • 온라인 배포 작성
  • 배치 규모 및 업데이트 배치
  • 사용자 정의 컴포넌트 정의 및 사용
  • Federated Learning을 사용하여 별도의 보안 데이터 소스로 공통 모델을 훈련
  • 영역 전체에서의 배치 모니터링
  • 온라인 배치 테스트를 위한 업데이트된 양식
  • 중첩 파이프라인 사용
  • AutoAI 데이터 대체
  • AutoAI 공정성 평가
  • AutoAI 시계열 지원 기능

이 표에서는 as-a-service및 소프트웨어 배치 환경에서 Watson Machine Learning 서비스 간의 기능 차이, 오퍼링 플랜 간의 차이 및 추가 서비스가 필요한지 여부에 대해 설명합니다. Cloud Pak for Data as a Service에 대한 오퍼링 계획 간 기능 차이점에 대한 자세한 내용은 Watson Machine Learning 오퍼링 계획을 참조하십시오.

Watson Machine Learning 배치 간의 기능 차이
기능 서비스로서의 소프트웨어
AutoAI 훈련 입력 현재 지원되는 데이터 소스 릴리스별 지원되는 데이터 소스 변경
AutoAI 실험 컴퓨팅 구성 8 CPU및 32GB 사용 가능한 다른 크기
AutoAI 데이터 크기의 한계
및 예측 대상 수
한계 설정 계산 구성에 따라 한계가 다름
AutoAI 증분 학습 사용할 수 없음 4.6.0 부터 사용 가능
인기 있는 프레임워크 및 소프트웨어 스펙을 사용하여 배치
최신 지원되는 버전을 확인하십시오. 지원되는 버전은 릴리스별로 다릅니다.
일괄처리 배치를 위해 데이터베이스에 연결 배치 유형별 지원을 확인하십시오. 배치 유형
및 버전별 지원 확인
Python 스크립트 배치 및 스코어링 Python 클라이언트를 통해 사용 가능 JupyterLab 또는 Python 클라이언트에서 스크립트를 작성한 후 배치하십시오.
배치 및 일괄처리 스코어 R 스크립트 사용할 수 없음 사용 가능
Shiny 앱 배치 사용할 수 없음 Shiny앱 작성 및 배치
코드 패키지에서 배치
작업의 공정성 또는 드리프트 평가 Watson OpenScale 서비스가 필요합니다. Watson OpenScale 서비스가 필요합니다.
영역
에서 공정성, 드리프트 또는 설명 가능성을 위해 온라인 배치 평가
사용할 수 없음 4.7
Watson OpenScale 서비스 필요
영역에서 배치된 프롬프트 템플리트 평가 사용할 수 없음
제어 영역 작성 역할 제한 없음 공간을 보고 작성할 수 있는 사용자를 제어하려면 권한을 사용하십시오.
GIT 프로젝트에서 공간으로 가져오기 사용할 수 없음 사용 가능
Git 프로젝트에서 공간으로
를 가져올 때 자동으로 작성되는 코드 패키지
사용할 수 없음 사용 가능
코드 패키지에서 RShiny앱 업데이트 사용할 수 없음 4.6 부터 사용 가능
모델 명세에서 모델 세부사항 추적 라이프사이클 세부사항이 있는 시트를 보려면 모델을 등록하십시오. IBM Knowledge Catalog 서비스가 필요합니다. 사용 가능
AI Factsheets 서비스가 필요합니다.
사용자 정의 이미지 작성 및 사용 사용할 수 없음 Python 또는 SPSS에 대한 사용자 정의 이미지 작성
파이프라인 이벤트에 대해 협업자에게 알림 사용할 수 없음 메일 발송을 사용하여 협업자에게 알림
비어 있지 않은 공간으로 프로젝트 또는 공간 파일 가져오기 사용할 수 없음 사용 가능
딥 러닝 실험 사용할 수 없음 Watson Machine Learning Accelerator 서비스 필요
IBM Cloud 서비스 인스턴스 프로비저닝 및 관리 Watson Machine Learning
또는 Watson OpenScale에 대한 인스턴스 추가
관리자가
클러스터에 서비스를 프로비저닝합니다.

IBM Knowledge Catalog

다음 IBM Knowledge Catalog 기능은 Cloud Pak for Data as a Service 및 Cloud Pak for Data 소프트웨어, 버전 4.8, 4.7및 4.6:

  • 프로젝트 및 카탈로그의 협업
  • AI를 이용한 검색 및 카탈로그의 추천
  • 카탈로그에서 자산 등급 지정 및 검토
  • 프로젝트의 Data Refinery 도구
  • 협업자 역할이 있는 카테고리
  • 사전정의 및 사용자 정의 분류
  • 사전 정의 및 사용자 정의 데이터 클래스
  • 거버넌스 규칙
  • 정책
  • 데이터 보호 규칙
  • 프로젝트 또는 카탈로그에서 개별 관계형 데이터 자산의 수동 프로파일링
  • 거버넌스된 카탈로그에 추가된 관계형 데이터 자산의 자동 프로파일링
  • 사용자 정의 자산 유형, 자산의 사용자 정의 특성 및 카탈로그에 있는 자산 간 사용자 정의 관계
  • 워크플로우 태스크 모니터
  • 마스킹 플로우를 사용하여 프로젝트에서 마스크된 데이터 세트 전달

이 표에서는 as-a-service및 소프트웨어 배치 환경에서 IBM Knowledge Catalog 서비스 간의 기능 차이, 오퍼링 플랜 간의 차이 및 추가 서비스가 필요한지 여부에 대해 설명합니다. Cloud Pak for Data as a Service의 오퍼링 플랜 간 기능 차이점에 대한 자세한 정보는 IBM Knowledge Catalog 오퍼링 플랜을 참조하십시오.

IBM Knowledge Catalog 의 차이점
기능 서비스로서의 소프트웨어
프로젝트의 Metadata import 도구-발견 프로젝트 또는 카탈로그로 데이터 자산을 가져오십시오. 프로젝트 및 카탈로그 연결의 서브세트에 대한 지원. 메타데이터 가져오기 및 메타데이터 강화를 위해 지원되는 데이터 소스를 참조하십시오. 여러 유형의 자산 가져오기:
프로젝트 또는 카탈로그로 데이터 자산을 가져오십시오. 대부분의 지원되는 연결은 두 배치 환경에서 동일합니다.
비즈니스 인텔리전스 보고서, 연관된 변환 스크립트가 있는 자산 또는 데이터 모델을 카탈로그로 가져오십시오. 라이센스 키 없이 MANTA Automated Data Lineage 를 설치해야 합니다. 카탈로그 연결의 서브세트에 대한 지원.

메타데이터 가져오기 및 메타데이터 강화를 위해 지원되는 데이터 소스를 참조하십시오.
프로젝트의 Metadata import 도구-계보 사용할 수 없음 데이터 자산의 계보를 카탈로그로 가져오십시오.
MANTA Automated Data Lineage ( 4.7부터 시작)
에서 ETL 작업의 계보를 캡처하고 액세스하려면 라이센스 키를 사용하여 MANTA Automated Data Lineage 를 설치해야 합니다. 카탈로그 연결의 서브세트에 대한 지원. 메타데이터 가져오기 및 메타데이터 강화를 위해 지원되는 데이터 소스를 참조하십시오.
레거시 UI 도구 사용할 수 없음 대신 프로젝트에서 도구를 사용하십시오. 4.7부터 사용할 수 없습니다. 대신 프로젝트에서 도구를 사용하십시오.
4.6:
Metadata import
자동화된 감지
데이터 품질 분석
정보 자산 보기
프로젝트의 메타데이터 강화 도구 대형 데이터 자산 세트에서 프로파일링, 용어 지정, 품질 분석 및 키 또는 관계 분석을 실행합니다. 사용 가능
데이터 품질 점수 데이터 품질 점수는
프로젝트 및 카탈로그의 자산에 대한 데이터 품질 정보
메타데이터 강화 결과에 표시됩니다.
데이터 품질 점수는
프로젝트 및 카탈로그의 자산에 대한 데이터 품질 정보
메타데이터 강화 결과
프로젝트 및 카탈로그의 자산 프로파일에 표시됩니다. 4.7 이상에서는 사용할 수 없습니다.
레거시 UI를 사용하여 빠른 스캔 결과를 제공합니다. 4.7 이상에서는 사용할 수 없습니다.
레거시 UI를 사용하는 데이터 품질 프로젝트. 4.7 이상에서는 사용할 수 없습니다.
자세한 데이터 품질 정보 프로젝트 및 카탈로그의 데이터 품질 페이지 및 메타데이터 강화 결과의 일부 4.7부터 사용 가능합니다.
프로젝트의 데이터 품질 규칙 사용 가능
DataStage 서비스가 필요합니다.
사용 가능
DataStage 서비스가 필요합니다.
데이터 품질 SLA 규칙 사용할 수 없음 데이터 품질을 모니터하고 위반을 보고합니다. SLA 준수 보고서는 프로젝트의 데이터 자산 데이터 품질 페이지에 표시됩니다.
4.7.3
데이터 품질 문제에 대한 개선 워크플로우 사용할 수 없음 4.7.3 부터 사용 가능
파일이 있는 카탈로그에 여러 자산 추가 사용할 수 없음 4.7.3 부터 사용 가능
자산 활동 지불 계획이 필요합니다.
프로젝트 및 카탈로그에서 사용 가능합니다.
프로젝트 및 카탈로그에서 사용 가능합니다.
데이터 계보 사용할 수 없음 사용 가능
기술 데이터 계보 사용할 수 없음 사용 가능
MANTA Automated Data Lineage for IBM Cloud Pak for Data 의 라이센스 버전이 설치되어 있어야 합니다. 메타데이터 가져오기 도구를 실행하여 생성됩니다. 카탈로그에서 액세스할 수 있습니다.
비즈니스 용어 일부 계획에 대해 제한합니다. 사용 가능
사전 정의된 비즈니스 용어 사전정의된 비즈니스 용어 및 이를 포함하는 Knowledge Accelerator 샘플 개인 데이터 카테고리는 2022년 10월 7일이후 Lite 또는 표준 플랜을 사용하여 IBM Knowledge Catalog 서비스 인스턴스를 작성하는 경우에만 사용 가능합니다. 사용할 수 없음
참조 데이터 세트 계획당 한계입니다. 사용 가능
아티팩트, 카테고리에 대한 사용자 정의 특성 사용 가능 4.6부터 시작하여 관리 메뉴에서 작성하십시오.
아티팩트에 대한 사용자 정의 관계 유료 플랜이 필요합니다. 4.6부터 시작하여 관리 메뉴에서 작성하십시오.
Knowledge Accelerators 엔터프라이즈 플랜이 필요합니다.
자원 허브에서 다운로드하십시오.
4.5에서 시작하는 플랫폼과 함께 제공됩니다.
거버넌스 아티팩트 및 요청에 대한 사용자 정의 워크플로우 구성 통제 아티팩트에 사용 가능합니다. 사용 가능
사용자 정의 카테고리 역할 계획당 한계입니다. 사용 가능
데이터 보호 규칙 내보내기 및 가져오기 임의의 시스템에서 데이터 보호 규칙을 내보내고 동일한 시스템 또는 다른 시스템으로 규칙을 가져오기 위해 API를 사용할 수 있습니다. 세부사항은 데이터 보호 규칙 마이그레이션을 참조하십시오. 임의의 시스템에서 데이터 보호 규칙을 내보내고 규칙을 동일한 시스템 또는 다른 시스템으로 가져오기 위해 API 또는 cpd-cli 명령을 사용할 수 있습니다. 세부사항은 데이터 보호 규칙 마이그레이션을 참조하십시오.
관리 보고서 유료 플랜이 필요합니다. 사용 가능
InfoSphere Information Server 에서 데이터 마이그레이션 사용할 수 없음 4.8부터 사용 가능합니다.

DataStage

다음 표에서는 DataStage on Cloud Pak for Data as a Service 와 DataStage on Cloud Pak for Data 소프트웨어, 버전 4.8, 4.7및 4.6간의 기능 차이점을 설명합니다.

DataStage 의 차이점
기능 서비스로서의 소프트웨어
PX 인스턴스 관리 사전 정의된 크기 세트에서 인스턴스를 프로비저닝할 수 있습니다. Cloud Pak for Data 인스턴스 관리를 사용하여 인스턴스를 더 유연하게 프로비저닝할 수 있습니다.
작업 컴파일
  • OSH는 컴파일 중에 생성됩니다.
  • 런타임 시 변환기가 컴파일됩니다.
  • OSH는 컴파일 중에 생성됩니다.
  • 변환기는 컴파일 시간 동안 컴파일되며 /ds-storage 마운트에 사용할 수 있습니다.
  • 컴파일은 동기식으로 수행됩니다.
작업 런타임 큐에 대기하면서 원하는 만큼의 작업을 제출할 수 있습니다.
  • 동시 작업 실행이 지원됩니다.
  • 동시성은 인스턴스 용량 및 /px-storage/config/wlm.config.xml 파일의 설정에 따라 결정됩니다.
자산 관리 .xls, .xlsx, .xml 및 .json 유형의 파일의 경우 단순 구조만 지원됩니다. 다중 레벨/중첩 스키마를 구문 분석할 수 없습니다. 유형 .csv, .txt, .xls, .xlsx, .xml 및 .json의 파일을 모두 지원할 수 있습니다.
스토리지
  • POSIX 유형 파일 기반 실제 스토리지는 사용할 수 없습니다.
  • Cloud Object Storage 프로젝트 버킷을 사용하여 스토리지를 에뮬레이트합니다.
  • 실제 스토리지는 /px-storage/ds-storage에서 사용할 수 있습니다.
  • PX 런타임 팟에 더 많은 스토리지를 마운트할 수 있습니다. DataStage에서 NFS 마운트 설정을 참조하십시오.
Java Integration 스테이지 DataStage-aaS Anywhere에서 사용 가능 사용 가능
Java 라이브러리 컴포넌트 사용할 수 없음 4.6 부터 사용 가능
일반 JDBC 연결 사용할 수 없음 사용 가능
Excel 사용할 수 없음 사용 가능
AVI DataStage-aaS Anywhere에서 사용 가능 사용 가능
External Source 스테이지 사용할 수 없음 사용 가능
External Target 스테이지 사용할 수 없음 사용 가능
계층 단계
  • XML 구문 분석기 및 JSON 구문 분석기의 단일 파일 또는 파일 세트 옵션을 사용할 수 없습니다.
  • XML 작성기 및 JSON 작성기에 대한 단일 파일, 파일 세트 및 대형 오브젝트 옵션을 사용할 수 없습니다.
사용 가능
SMP S, M, L은 단일 노드, SMP 구성입니다. 원격 런타임 엔진을 사용하여 대체 구성을 설정하십시오. 병렬 작업 로드는 APT_CONFIG_FILE 옵션으로 구성된 논리 파티션을 통해 관리됩니다.
SAP Bulk Extract 연결 사용할 수 없음 사용 가능
SAP Delta Extract 연결 사용할 수 없음 사용 가능
랩된 스테이지 DataStage-aaS Anywhere에서 사용 가능 사용 가능
SAP HANA 연결 사용할 수 없음 사용 가능
ODBC 연결의 텍스트 데이터 소스 사용할 수 없음 사용 가능
빌드 스테이지 DataStage-aaS Anywhere에서 사용 가능 4.0.9 부터 사용 가능
이전/이후 작업 서브루틴을 사용하여 보고서 전송 사용할 수 없음 사용 가능
사용자 정의 스테이지 DataStage-aaS Anywhere에서 사용 가능 사용 가능
Apache HBase 연결 사용할 수 없음 사용 가능
Apache Hive 연결을 위한 Kerberos 인증 사용할 수 없음 사용 가능
사용자 정의 함수 사용할 수 없음 사용 가능
작업 전/후 특성 DataStage-aaS Anywhere에서 사용 가능 사용 가능
데이터 서비스 커넥터 사용할 수 없음 사용 가능
SAD (Slowly Changing Dimension) 스테이지, Surrogate Key Generator 스테이지 및 Transformer 스테이지의 Db2 데이터베이스 시퀀스 사용할 수 없음 4.6 부터 사용 가능
Apache Hive 연결을 대상으로 사용하십시오. (커넥터에서 DataStage 특성 사용 을 선택한 경우에 사용 가능합니다.) 사용할 수 없음 4.6.1 부터 사용 가능
로컬 연결을 사용하여 특성 매개변수화 사용할 수 없음 4.6.1 부터 사용 가능
Operational Decision Manager 단계 사용할 수 없음 4.6.1 부터 사용 가능
배치 공간 사용할 수 없음 4.7.0 부터 사용 가능

watsonx.governance

다음 watsonx.governance 기능은 Cloud Pak for Data as a Service 및 Cloud Pak for Data 소프트웨어, 버전 4.8, 4.7및 4.6:

  • 공정성을 위해 배치 평가
  • 배치 품질 평가
  • 드리프트를 위한 모니터 배치
  • 통찰력 대시보드에서 모델 결과 보기 및 비교
  • 선택한 기계 학습 제공자에서 배치 추가
  • 평가가 지정된 임계값 아래로 떨어질 때 트리거하도록 경보를 설정
  • 사용자 인터페이스 또는 노트북에서 배치 평가
  • 사용자 정의 평가 및 메트릭
  • 모델 팩트시트의 평가에 대한 세부사항 보기

이 표에서는 as-a-service및 소프트웨어 배치 환경에서 Watson OpenScale 서비스 간의 기능 차이, 오퍼링 플랜 간의 차이 및 추가 서비스가 필요한지 여부에 대해 설명합니다.

IBM Watson OpenScale 의 차이점
기능 서비스로서의 소프트웨어
미리 스코어링된 테스트 데이터 업로드 사용할 수 없음 사용 가능
IBM SPSS Collaboration and Deployment Services 사용할 수 없음 사용 가능
일괄처리 사용할 수 없음 사용 가능
사용자 그룹별 액세스 제어 지원 사용할 수 없음 사용 가능
무료 데이터베이스 및 Postgres 플랜 사용 가능 4.8 부터 사용 가능한 Postgres
다중 인스턴스 설정 사용할 수 없음 사용 가능
OpenPages 와 통합 사용할 수 없음 사용 가능
기초 모델 자산 평가 사용할 수 없음 사용할 수 없음

Watson Query

Cloud Pak for Data as a Service에서 데이터 가상화 기능은 Watson Query 서비스에서 제공합니다. Cloud Pak for Data에서 Data Virtualization 서비스는 버전 4.6에서 Watson Query 로 이름이 변경되었습니다. 다음 Data virtualization 기능은 Cloud Pak for Data as a Service 및 Cloud Pak for Data 4.8 및 4.7에서 효과적으로 동일합니다.

  • 지원되는 데이터 소스에 연결
  • 데이터 가상화
  • 정책 및 데이터 보호 규칙을 사용하여 가상 데이터 관리
  • 서비스 모니터링 및 탐색
  • SQL 인터페이스 사용
  • 캐싱
  • 열 마스킹
  • 테이블 보기 및 다시 로드 탐색
  • 통계 콜렉션의 데이터 샘플링
  • 메타데이터 강화

다음 데이터 가상화 기능은 사용자 인터페이스에서는 다르지만 동일한 기본 기능을 제공합니다.

이 표에서는 Cloud Pak for Data as a Service 의 Watson Query 와 Cloud Pak for Data 소프트웨어의 Watson Query (이전에는 Data Virtualization) 간의 기능 차이에 대해 설명합니다.

Watson Query 의 차이점
기능 서비스로서의 소프트웨어
Admin 역할에 대한 향상된 보안: Admin 역할에는 모든 데이터에 대한 기본 액세스 권한이 없습니다. SaaS 에 적용되지 않음 4.8 부터 사용 가능
IBM Knowledge Catalog 데이터 보호 규칙은 항상 Watson Query 데이터에 대해 사용으로 설정됩니다. SaaS 에 적용되지 않음 4.8 부터 사용 가능
통제되지 않은 오브젝트 보안: Watson Query의 IBM Knowledge Catalog 데이터 보호 규칙을 사용하여 통제된 카탈로그에 공개되지 않은 가상화된 오브젝트는 규칙 설정의 기본 데이터 액세스 규칙 설정을 따릅니다. SaaS 에 적용되지 않음 4.8 부터 사용 가능
Presto 데이터 쿼리: Presto 에 대한 연결을 작성하여 Presto의 데이터에 액세스하고 쿼리할 수 있습니다. SaaS 에 적용되지 않음 4.8 부터 사용 가능
쿼리 모드 (최대 푸시다운 및 최대 일관성) SaaS 에 적용되지 않음 4.7 부터 사용 가능
가상화된 데이터에 대한 고급 데이터 마스킹 SaaS 에 적용되지 않음 4.7 부터 사용 가능
데이터 소스 연결 액세스 제한사항 SaaS 에 적용되지 않음 4.7 부터 사용 가능
성능 조정을 위해 형식화된 액세스 플랜 형식화 및 저장 SaaS 에 적용되지 않음 4.7 부터 사용 가능
사용자 활동 및 데이터 액세스를 모니터하기 위한 감사 로깅 사용 가능 4.7 부터 사용 가능
IBM Knowledge Catalog 와 통합 필수 선택적
그룹 기반 권한 부여 및 그룹에 대한 오브젝트 레벨 액세스 사용할 수 없음 사용 가능
원격 커넥터 지원 SaaS 에 적용되지 않음 사용 가능
파일 시스템 기반 데이터 소스 지원(Cloud Object Storage 제외) SaaS 에 적용되지 않음 사용 가능
업로드된 JDBC 드라이버가 필요한 데이터 소스에 연결 (예: SAP HANA, 일반 JDBC ) SaaS 에 적용되지 않음 사용 가능
사용자 인터페이스에서 통계 수집 사용할 수 없음 사용 가능
오브젝트 가상화 중 자동 통계 콜렉션 사용할 수 없음 사용 가능
행 레벨 정책을 사용하여 데이터 관리 지원 사용할 수 없음 사용 가능
데이터 보호 규칙 캐싱 사용할 수 없음 사용 가능
다중 그룹에 대한 액세스 관리 사용할 수 없음 사용 가능
Cloud Object Storage 에서 CSV 또는 TSV 파일 지원 SaaS 에 적용되지 않음 4.6 부터 사용 가능
Cloud Object Storage 의 연결에 대한 저장소의 신임 정보 SaaS 에 적용되지 않음 4.6 부터 사용 가능

자세한 정보

상위 주제: Cloud Pak for Data as a Service

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기