0 / 0
영어 버전 문서로 돌아가기
도구 선택
도구 선택

도구 선택

Cloud Pak for Data as a Service의 핵심 서비스는 초보자부터 전문가에 이르기까지 데이터 준비, 분석 및 모델링에 대한 모든 레벨의 경험이 있는 사용자에게 다양한 도구를 제공합니다. 올바른 도구는 가지고 있는 데이터의 유형, 수행하려는 태스크 및 원하는 자동화의 양에 따라 다릅니다.

적절한 도구를 고르려면 이러한 요인을 고려하십시오.

사용자가 보유한 데이터 유형

  • 구분된 파일의 표 형식 데이터 또는 원격 데이터 소스의 관계형 데이터
  • 이미지 파일
  • 문서의 텍스트 (비구조화) 데이터

수행해야 하는 태스크 유형

  • 데이터 준비: 데이터를 정리하고 쉐이핑하고 시각화하고 구성하며 유효성 검증합니다.
  • 데이터 분석: 데이터에서 패턴과 관계를 식별하고 인사이트를 표시합니다.
  • 모델 빌드: 모델을 빌드, 훈련, 테스트 및 배치하여 예측을 하거나 의사결정을 최적화합니다.

얼마나 많은 자동화를 원하십니까

  • 코드 편집기 도구: Python, R 또는 Scala에 있는 코드를 모두 스파크와 함께 작성하는 데 사용합니다.
  • 그래픽 빌더 도구: 빌더에서 메뉴 및 끌어서 놓기 기능을 사용하여 시각적으로 프로그램을 프로그램합니다.
  • 자동화된 빌더 도구: 제한된 사용자 입력이 필요한 자동 태스크를 구성하는 데 사용합니다.

적절한 도구를 찾으십시오.

표 형식 또는 관계형 데이터용 도구

태스크별 표 형식 또는 관계형 데이터용 도구:

표 형식 또는 관계형 데이터용 도구
도구 도구 유형 데이터 준비 데이터 분석 모델 빌드
Jupyter 노트북 편집기 코드 편집기
연합 학습 코드 편집기
RStudio 코드 편집기
Data Refinery 그래픽 빌더
데이터 개인정보 보호 자동화된 빌더
Watson Query 그래픽 빌더
DataStage 그래픽 빌더
대시보드 편집기 그래픽 빌더
SPSS Modeler 그래픽 빌더
Decision Optimization 모델 빌더 그래픽 빌더 및 코드 편집기
AutoAI 자동화된 빌더
Metadata import 자동화된 빌더
메타데이터 인리치먼트 자동화된 빌더
IBM Match 360 with Watson(베타) 자동화된 빌더
Watson 파이프라인 그래픽 빌더

텍스트 데이터용 도구

텍스트 형식 데이터를 분류하는 모델을 빌드하기 위한 도구:

텍스트 데이터용 도구
도구 코드 편집기 그래픽 빌더 자동화된 빌더
Jupyter 노트북 편집기
RStudio
SPSS Modeler
Watson 파이프라인

이미지 데이터용 도구

이미지를 분류하는 모델을 빌드하기 위한 도구:

이미지 데이터용 도구
도구 코드 편집기 그래픽 빌더 자동화된 빌더
Jupyter 노트북 편집기
RStudio
Watson 파이프라인

도구에 액세스

도구를 사용하려면 해당 도구와 관련된 자산을 작성하거나 해당 도구에 대한 기존 자산을 열어야 합니다. 자산을 작성하려면 새 자산을 클릭한 후 원하는 자산 유형을 선택하십시오. 이 표에는 각 도구에 대해 선택하는 자산 유형이 표시되어 있습니다.

도구 대 자산 유형 맵핑
사용하려는 도구 선택하는 자산 유형
Jupyter 노트북 편집기 Jupyter 노트북 편집기
Data Refinery Data Refinery 플로우
데이터 개인정보 보호 마스킹 플로우
DataStage DataStage 플로우
대시보드 편집기 대시보드
SPSS Modeler 모델러 플로우
Decision Optimization 모델 빌더 Decision Optimization
AutoAI AutoAI 실험
연합 학습 연합 학습 실험
Metadata import Metadata import
메타데이터 인리치먼트 메타데이터 강화
IBM Match 360 with Watson(베타) 마스터 데이터 구성

RStudio로 노트북을 편집하려면 IDE > RStudio 실행을 클릭하십시오.

Jupyter 노트북 편집기

Jupyter 노트북 편집기를 사용하여 코드를 실행하여 데이터를 준비, 시각화 및 분석하거나 모델을 빌드 및 훈련시킬 수 있는 노트북을 작성하십시오.

필요 서비스 Watson Studio

데이터 형식 임의

데이터 크기 임의

데이터 준비, 데이터 분석 또는 모델 작성 방법 스파크에 대한 Python, R 또는 Scala의 쓰기 코드입니다. 코드가 있는 서식있는 텍스트 및 매체를 포함합니다. 원하는 방식으로 모든 종류의 데이터에 대해 작업하십시오. 사전 설치 또는 기타 열린 소스 및 IBM 패키지를 설치하십시오. 스케줄 실행 코드 파일, URL 또는 갤러리에서 노트북을 가져옵니다. 외부에서 노트북의 읽기 전용 사본을 공유합니다.

시작하기 노트북을 작성하려면 새 자산 > 노트북을 클릭하십시오.

자세히 보기 공용 데이터 세트 로드 및 분석 노트북에 관한 비디오 샘플 노트북 노트북 관련 문서

Data Refinery

Data Refinery를 사용하여 그래픽 플로우 편집기로 표 형식의 데이터를 준비하고 시각화하십시오. Data Refinery 플로우를 데이터에 대해 일련의 정렬된 오퍼레이션으로 작성한 다음 실행합니다.

필요 서비스 Watson Studio 또는 Watson Knowledge Catalog

데이터 형식 표 형식: Avro, CSV, JSON, Microsoft Excel (xls및 xlsx 형식) 첫 번째 시트는 연결 및 연결된 데이터 자산을 제외한 경우에만 해당됩니다.) Parquet, SAS "sas7bdat" 확장자 (읽기 전용), TSV (읽기 전용) 또는 구분된 텍스트 데이터 자산
관계형: 관계형 데이터 소스의 테이블

데이터 크기 임의

데이터를 준비하는 방법 60개가 넘는 조작으로 데이터를 정리하고 구체화하며 구성합니다. 정제된 데이터를 새 데이터 세트로 저장하거나 원래 데이터를 업데이트하십시오. 프로파일 데이터를 사용하여 유효성을 검증합니다. 대화식 템플리트를 사용하여 코드 조작, 함수 및 논리 연산자를 사용하여 데이터를 조작할 수 있습니다. 데이터에 대한 반복 조작을 스케줄합니다.

데이터를 분석하는 방법 다중 시각화 차트의 데이터 내에서 패턴, 연결 및 관계를 식별합니다.

시작하기

Data Refinery 플로우를 작성하려면 새 자산 > Data Refinery 플로우를 클릭하십시오.

자세히 보기 Data Refinery 에 대한 비디오 모양 데이터 비디오
Data Refinery 에 대한 문서

Watson Query

Watson Query 를 사용하여 여러 데이터 소스를 데이터 소스 또는 데이터베이스의 단일 자체 밸런싱 콜렉션으로 연결할 수 있습니다.

데이터 형식 관계형: 관계형 데이터 소스의 테이블

데이터 크기 임의

데이터를 준비하는 방법 여러 데이터 소스에 연결하십시오. 가상 테이블을 작성하십시오.

시작하기 가상 테이블을 작성하려면 데이터 > 데이터 가상화를 클릭하십시오. 서비스 메뉴에서 가상화 > 가상화 > 테이블을 클릭하십시오.

자세히 보기 Watson Query 문서

DataStage

그래픽 플로우 편집기로 표 형식의 데이터를 준비하고 시각화하려면 DataStage를 사용하십시오. 사용자는 데이터에 대한 순서 지정된 오퍼레이션의 세트로서 DataStage 플로우를 작성하고 실행합니다.

데이터 형식 표: Avro, CSV, JSON, Parquet, TSV(읽기 전용) 또는 구분된 텍스트 파일
관계형: 관계형 데이터 소스의 테이블

데이터 크기 임의

데이터를 준비하는 방법 높은 성능의 DataStage 병렬 엔진에서 실행할 조정 코드를 생성하는 그래픽 데이터 통합 플로우를 설계하십시오. 결합, 퍼널, 체크섬, 병합, 수정, 중복 제거 및 정렬과 같은 조작을 수행하십시오.

시작하기

DataStage 작성하려면 새 자산 > DataStage를 클릭하십시오.

자세히 보기 DataStage

대시보드 편집기

그래픽 빌더에 대한 분석 결과의 시각화 세트를 작성하려면 대시보드 편집기를 사용하십시오.

필요 서비스 Cognos Dashboard Embedded

데이터 형식 표: CSV 파일 관계형: 일부 관계형 데이터 소스의 테이블

데이터 크기 임의의 크기

데이터를 분석하는 방법 코딩하지 않고 그래프를 작성하십시오. 대시보드에 텍스트, 매체, 웹 페이지, 이미지 및 모양을 포함합니다. 대화식 대시보드를 외부적으로 공유합니다.

시작하기

대시보드를 작성하려면 새 자산 > 대시보드를 클릭하십시오.

자세히 보기

대시보드에 대한 비디오
대시보드에 대한 문서

SPSS Modeler

SPSS Modeler 를 사용하여 데이터를 준비하고 그래픽 빌더에서 플로우 편집기를 사용하여 모델을 빌드하고 훈련하는 플로우를 작성하십시오.

필요 서비스 Watson Studio

데이터 형식 관계형: 관계형 데이터 소스의 테이블 테이블: Excel 파일 (.xls 또는 .xlsx), CSV 파일 또는 SPSS Statistics 파일 (.sav) 텍스트: 지원되는 관계형 테이블 또는 파일에서

데이터 크기 임의

데이터를 준비하는 방법 자동 데이터 준비 기능을 사용합니다. 데이터를 조작하기 위한 SQL문쓰기 정리, 모양, 샘플, 정렬 및 파생 데이터입니다.

데이터를 분석하는 방법 40 이상의 그래프로 데이터를 시각화합니다. 텍스트 필드의 자연어를 식별합니다.

모델을 빌드하는 방법 예측 모델을 빌드합니다. 40개이상의 모델링 알고리즘에서 선택하십시오. 자동 모델링 기능을 사용하십시오. 모델 시계열 또는 지리공간 데이터입니다.
텍스트 데이터 분류. 텍스트 데이터의 개념 사이의 관계를 식별합니다.

시작하기 SPSS Modeler 플로우를 작성하려면 새 자산 > 모델러 플로우를 클릭한 후 IBM SPSS Modeler를 선택하십시오.

자세히 보기 SPSS Modeler -엔터프라이즈 데이터 사이언스 강국 비디오를 위한 새로 고쳐진 UI SPSS Modeler 에 대한 문서

Decision Optimization 모델 빌더(Decision Optimization model builder)

Decision Optimization을 사용하여 Decision Optimization 모델러 또는 Jupyter 노트북에서 최적화 모델을 빌드하고 실행합니다.

필요 서비스 Watson Studio

데이터 형식 표: CSV 파일

데이터 크기 임의

데이터를 준비하는 방법 관련 데이터를 시나리오로 가져오고 편집합니다.

모델을 빌드하는 방법 규범적 결정 최적화 모델을 빌드합니다. Python DOcplex, OPL 또는 자연어 표현식에서 모델을 작성, 가져오기 및 편집합니다. 노트북을 작성, 가져오기 및 편집합니다.

모델을 풀 수 있는 방법 CPLEX 엔진을 사용하여 결정 최적화 모델을 실행 및 해결합니다. 여러 시나리오에 대한 솔루션을 조사하고 비교하십시오. 테이블, 차트 및 참고사항을 작성하여 하나 이상의 시나리오에 대한 데이터 및 솔루션을 시각화할 수 있습니다.

시작하기 Decision Optimization 모델을 작성하려면 새 자산 > Decision Optimization을 클릭하거나 노트북의 경우 새 자산 > 노트북을 클릭하십시오.

자세히 보기 Decision Optimization 에 대한 비디오 Decision Optimization 에 대한 문서

AutoAI 도구

AutoAI 도구를 사용하여 표 형식 데이터를 자동으로 분석하고 예측 모델링 문제에 맞게 사용자 정의된 후보 모델 파이프라인을 생성하십시오.

필요 서비스 Watson Machine Learning

데이터 형식 표: CSV 파일

데이터 크기 모델 유형에 따라 다릅니다. 자세한 내용은 AutoAI 개요 를 참조하십시오.

데이터를 준비하는 방법 자동으로 데이터 변환 (예: 누락된 값 대치 및 텍스트 변환) 을 스칼라 값으로 변환합니다.

모델을 빌드하는 방법 2진 분류, 다중 클래스 분류 또는 회귀 모델을 훈련합니다. AutoAI 훈련 스테이지의 시퀀스를 보여주는 트리 인포그래픽을 보십시오. 교차 검증 점수로 순위 지정된 모델 파이프라인의 리드 보드를 생성합니다. 모델로 파이프라인을 저장하십시오.

시작하기 AutoAI 실험을 작성하려면 새 자산 > AutoAI 실험을 클릭하십시오.

자세히 보기 AutoAI에 대한 문서

연합 학습

연합 학습 도구를 사용하여 분산 데이터를 사용하여 공통 모델을 훈련하십시오. 데이터는 통합되거나 공유되지 않으며 데이터 무결성을 보존하면서 집계된 데이터를 기반으로 모든 참여 당사자에게 모델을 제공합니다.

필요 서비스 Watson Machine Learning

데이터 형식 임의

데이터 크기 임의의 크기

모델을 빌드하는 방법 훈련 프레임워크를 선택하십시오. 공통 모델을 구성하십시오. 공통 모델을 훈련하도록 파일을 구성하십시오. 원격 당사자가 데이터를 교육하도록 하십시오. 공통 모델을 배치하십시오.

시작하기 실험을 작성하려면 새 자산 > Federated Learning 실험을 클릭하십시오.

자세히 보기 연합 학습에 대한 문서

Metadata import

데이터 자산에 대한 기술 및 프로세스 메타데이터를 자동으로 발견하고 프로젝트 또는 카탈로그로 가져오려면 메타데이터 가져오기 도구를 사용하십시오.

필요 서비스 Watson Knowledge Catalog

데이터 형식 임의

데이터 크기 임의의 크기

데이터를 준비하는 방법 연결에서 데이터 소스로 데이터 자산을 가져옵니다.

시작하기 메타데이터를 가져오려면 새 자산 > 메타데이터 가져오기를 클릭하십시오.

자세히 보기 메타데이터 가져오기에 대한 문서 Watson Knowledge Catalog 에 대한 비디오

메타데이터 강화

메타데이터 인리치먼트 도구를 사용하여 데이터 자산을 자동으로 프로파일링하고 프로젝트의 데이터 품질을 분석합니다.

필요 서비스 Watson Knowledge Catalog

데이터 형식 관계형 및 구조화: 관계형 및 비관계형 데이터 소스의 테이블 및 파일 표: Avro, CSV 또는 Parquet 파일

데이터 크기 임의의 크기

데이터를 준비하고 분석하는 방법 프로젝트에서 데이터 자산의 선택 세트를 프로파일하고 분석합니다.

시작하기 데이터를 강화하려면 새 자산 > 메타데이터 강화를 클릭하십시오.

자세히 보기 메타데이터 강화에 대한 문서

IBM Match 360 with Watson

IBM Match 360 with Watson을 사용하여 고객의 디지털 트윈을 표시하는 마스터 데이터 엔티티를 작성합니다. 데이터를 모델링 및 맵핑한 다음 일치 알고리즘을 실행하여 마스터 데이터 엔티티를 작성합니다. 조직의 요구사항을 충족하도록 일치하는 알고리즘을 사용자 정의하고 조정하십시오.

필요 서비스 IBM Match 360 with Watson
IBM Watson Knowledge Catalog

데이터 크기 최대 1,000,000레코드(베타 Lite 계획의 경우)

데이터를 준비하는 방법 조직의 소스에서 데이터를 모델링하고 맵핑합니다. 사용자 정의 가능한 일치 알고리즘을 실행하여 마스터 데이터 엔티티를 작성하십시오. 마스터 데이터 엔티티 및 연관된 레코드를 보고 편집합니다.

시작하기 IBM Match 360 구성 자산을 작성하려면 새 자산 > 마스터 데이터 구성을 클릭하십시오.

자세히 보기 IBM Match 360 with Watson

RStudio IDE

RStudio IDE를 사용하여 데이터를 분석하거나 R 코드를 작성하여 Shiny 애플리케이션을 작성하십시오. RStudio는 프로젝트와 연관되어야 하는 Git 저장소와 통합될 수 있습니다.

필요 서비스 Watson Studio

데이터 형식 임의

데이터 크기 임의의 크기

데이터 준비, 데이터 분석 및 모델 빌드 방법 R의 쓰기 코드 새 앱을 작성합니다. 오픈 소스 라이브러리 및 패키지를 사용합니다. 코드가 있는 서식있는 텍스트 및 매체를 포함합니다. 데이터 준비. 데이터 시각화. 데이터에서 통찰력을 발견합니다. 개방형 소스 라이브러리를 사용하여 모델을 빌드 및 훈련합니다. Git 저장소에서 새 앱을 공유하십시오.

시작하기 RStudio를 사용하려면 IDE 실행 > RStudio를 클릭하십시오.

자세히 보기 RStudio IDE 비디오 개요
RStudio에 대한 비디오
RStudio에 대한 문서

데이터 개인정보 보호

데이터 개인정보 보호 도구를 사용하여 카탈로그에서 마스크된 사본 또는 마스크된 데이터 서브세트를 준비하십시오. 데이터는 데이터 보호 규칙으로 고급 마스킹 옵션을 사용하여 익명화됩니다.

필요 서비스 Watson Knowledge Catalog

데이터 형식 관계형: 관계형 데이터 소스의 테이블

데이터 크기 임의의 크기

데이터 준비, 데이터 분석 또는 모델 빌드 방법 거버넌스된 카탈로그에서 프로젝트로 데이터 자산을 가져옵니다. 마스킹 플로우 작업 정의를 작성하여 데이터 보호 규칙으로 마스크할 데이터를 지정하십시오. 선택적으로 복사된 데이터의 크기를 줄이기 위한 데이터 서브세트입니다. 마스킹된 사본을 실행하여 마스크된 사본을 대상 데이터베이스 연결로 로드합니다.

시작하기 Watson Knowledge Catalog 의 사전 필수 단계가 완료됨인지 확인하십시오. 데이터를 개인화하려면 다음 태스크 중 하나를 수행하십시오.

  • 새 자산 > 데이터 개인정보 보호를 클릭하십시오.
  • 개별 데이터 자산에 대한 메뉴 옵션을 클릭하여 해당 자산을 직접 마스킹하십시오.

자세히 보기 데이터 마스킹에 대한 문서

Watson 파이프라인

파이프라인 캔버스 편집기를 사용하여 데이터를 준비, 시각화 및 분석하거나 모델을 빌드 및 훈련하기 위한 플로우를 작성할 수 있습니다.

데이터 형식 임의

데이터 크기 임의

데이터를 준비하고, 데이터를 분석하거나, 모델을 작성하는 방법 각각의 로그를 포함하는 다양한 노드를 사용하십시오. Python, R, Scala 코드를 실행하기 위한 플로우에 대한 회사 노트북입니다. 원하는 방식으로 모든 종류의 데이터에 대해 작업하십시오. 스케줄 실행이 실행됩니다. Github의 마운트된 PVC, 프로젝트 또는 수집 데이터에서 데이터를 반입합니다. Python 코드로 사용자 정의 구성요소를 작성하십시오. 데이터 품질을 모니터하기 위해 파이프라인을 조정하십시오. 웹 후크를 사용하여 이메일 또는 메시지를 전송하여 플로우의 상태를 최신 상태로 유지하십시오.

시작하기 새 파이프라인을 작성하려면 새 자산 > 파이프라인을 클릭하십시오.

상위 주제: 프로젝트