플랫폼은 협업 작업 영역 및 도구를 제공하며 사용자는 자원 양식으로 플랫폼에 컨텐츠를 제공합니다. 자산 은 데이터, 기타 중요한 정보 또는 데이터에 대해 작업하는 코드에 대한 정보를 포함하는 항목입니다.
자산을 가져오거나 도구를 사용하여 작성하여 자산을 추가합니다. 협업 작업 영역에서 자원에 대해 작업합니다. 사용하는 작업공간은 태스크에 따라 다릅니다.
프로젝트 다른 사용자와 협업하여 데이터에 대해 작업하고 자산을 작성하는 위치입니다. 대부분의 도구는 프로젝트에 있으며 프로젝트에 코드를 포함하는 자산을 실행합니다. 예를 들어, 프로젝트에서 데이터를 가져오거나, 데이터를 준비하거나, 데이터를 분석하거나, 모델을 작성할 수 있습니다. 프로젝트를 참조하십시오.
카탈로그 조직과 공유할 자산을 저장하거나 작업해야 하는 자산을 찾기 위해 이동하는 위치입니다. 카탈로그에서 프로젝트로 자산을 복사하거나 프로젝트에서 카탈로그로 자산을 공개할 수 있습니다. 카탈로그에서 자산 특성 및 메타데이터를 편집할 수 있지만 자산을 실행할 수는 없습니다. 카탈로그를 참조하십시오.
배치 영역 -테스트 또는 프로덕션을 위해 준비된 자산을 배치하고 실행합니다. 프로젝트에서 배치 영역으로 자산을 이동한 후 해당 자산에서 배치를 작성합니다. 필요에 따라 배치를 모니터하고 업데이트합니다. 배치 영역을 참조하십시오.
글로벌 검색 표시줄에서 검색하여 사용자가 협업자인 작업공간에서 자산을 찾을 수 있습니다. 플랫폼 전체에서 자산 검색을 참조하십시오.
자산을 작성하거나 사용하거나 자동화된 프로세스에 의해 업데이트될 때 자산은 특성에 정보를 누적합니다. 일부 특성은 사용자가 제공하며 사용자가 편집할 수 있습니다. 기타 특성은 시스템에서 자동으로 제공됩니다. 대부분의 시스템 제공 특성은 사용자가 편집할 수 없습니다.
자산의 마지막 수정 날짜 필드는 사용자 조치와 시스템 조치를 모두 추적합니다. 시스템 조치는 종종 백그라운드에서 발생하며 자산의 내부 메타데이터에 대한 변경사항만 포함할 수 있습니다.
모든 위치에 있는 자산의 공통 특성
Copy link to section
대부분의 자산 유형에는 해당 자산 유형이 있는 모든 작업공간의 다음 표에 나열된 특성이 있습니다.
자산의 공통 특성
특성
설명
편집 가능?
이름
자산 이름입니다. 최대 255자를 포함할 수 있습니다. 멀티바이트 문자를 지원합니다. 비어 있을 수 없으며, 유니코드 제어 문자를 포함할 수 없고, 공백만 포함할 수 없습니다. 자산 이름은 프로젝트 또는 배치 공간에서 고유하지 않아도 됩니다. 카탈로그에서 자산 이름이 고유해야 하는지 여부는 카탈로그의 중복 처리 방법 세트에 따라 다릅니다.
예
설명
선택사항. 멀티바이트 문자 및 하이퍼링크를 지원합니다.
예
작성 날짜
자산을 작성하거나 가져온 시점의 시간소인입니다.
아니오
작성자 또는 소유자
자산을 작성하거나 가져온 사용자의 사용자 이름 또는 이메일 주소입니다.
아니오
마지막 수정 날짜
자산이 마지막으로 수정된 시간소인입니다.
아니오
마지막 편집자
자산을 마지막으로 수정한 사용자의 사용자 이름 또는 이메일 주소입니다.
아니오
카탈로그의 자산에 대한 공통 특성
Copy link to section
모든 자산에 있는 공통 특성 외에도 카탈로그의 자산에는 다음 표에 나열된 특성 및 페이지가 있습니다.
기본적으로 공용으로 설정됩니다. 이 설정은 개인용으로 설정된 경우 카탈로그의 자산에 대한 액세스를 제한할 수 있습니다. 자산의 소유자 및 구성원만 개인용 자산을 보고 사용할 수 있습니다.
예
액세스 페이지
자산의 소유자 및 구성원입니다. 기본적으로 자산 소유자는 자산을 카탈로그에 추가한 사용자입니다. 자산 구성원은 개인용으로 표시된 자산을 보고 사용할 수 있습니다. 자산에 대한 액세스 제어를 참조하십시오.
예
등급 페이지
선택사항. 카탈로그 협업자는 자산의 등급을 지정하고 검토할 수 있습니다.
예
태그
선택사항. 카탈로그 협업자가 검색을 단순화하기 위해 작성하는 텍스트 레이블입니다. 태그는 최대 255자의 한 문자열로 구성됩니다. 공백, 문자, 숫자, 밑줄, 대시 및 기호 #과 @를 포함할 수 있습니다.
예
관계
선택사항. 자산 개요 페이지의 관련 항목 섹션에 표시되는 관계는 정보용이며 자산에 다른 영향을 주지 않습니다. 동일한 작업공간 또는 다른 작업공간의 자산 사이에 있을 수 있습니다. 예를 들어, 카탈로그의 자산과 프로젝트의 자산 간에 관계를 추가할 수 있습니다. 자산과 아티팩트 사이에 있을 수 있습니다. 예를 들어, 자산과 정책 간의 관계를 추가할 수 있습니다. 관리자는 자산에 대한 사용자 정의 관계를 작성할 수 있습니다. 자산 관계 추가를 참조하십시오.
예
거버넌스 아티팩트
선택사항. 사용자가 자산에 지정한 비즈니스 용어 및 분류입니다. 이러한 할당은 자산에 영향을 줄 수 있습니다. 예를 들어, 지정된 비즈니스 용어는 데이터 보호 규칙의 적용을 트리거할 수 있습니다.
예
자산 유형에 대한 사용자 정의 특성을 작성할 수 있습니다. 사용자 정의 특성은 카탈로그에 있는 자산의 개요 탭에 있는 세부사항 섹션에 표시됩니다. 사용자 정의 특성 및 관계를 참조하십시오.
자산 특성을 편집하려면 필수 권한이 있어야 합니다. 카탈로그에서 자산 편집을 참조하십시오.
도구에서 실행되는 자산의 공통 특성
Copy link to section
일부 자산은 도구 실행과 연관되어 있습니다. 예를 들어, AutoAI 실험 자산은 AutoAI 도구에서 실행됩니다. 도구에서 실행되는 자산을 운영 자산이라고도 합니다. 도구에서 자산을 실행할 때마다 작업을 시작합니다. 작업을 모니터하고 스케줄링할 수 있습니다. 작업은 계산 자원을 사용합니다. 컴퓨팅 리소스는 용량 단위 시간(CUH)으로 측정되며 추적됩니다. 서비스 플랜에 따라 매월 제한된 양의 CUH를 사용하거나 매월 사용하는 CUH에 대해 비용을 지불할 수 있습니다.
도구에서 실행되는 많은 자산의 경우 사용할 컴퓨팅 환경 구성을 선택할 수 있습니다. 일반적으로 더 크고 빠른 환경 구성이 컴퓨팅 리소스를
더 빠르게 사용합니다.
기본 특성 외에도 도구에서 실행되는 대부분의 자산은 프로젝트에 다음 유형의 정보를 포함합니다.
프로젝트의 자산에 대한 특성
특성
설명
편집 가능?
작업공간
환경 정의
자산을 실행하기 위한 환경 템플리트, 하드웨어 스펙 및 소프트웨어 스펙입니다. 환경을 참조하십시오.
예
프로젝트, 공간
설정
자산이 실행되는 방법을 정의하는 정보입니다. 각 자산 유형에 특정합니다.
예
프로젝트
연관된 데이터 자산
자산이 작업 중인 데이터입니다.
예
프로젝트
작업
환경 정의, 스케줄 및 알림 옵션을 포함하여 자산을 실행하는 방법에 대한 정보입니다. 작업을 참조하십시오.
예
프로젝트, 공간
데이터 자산 유형 및 해당 특성
Copy link to section
데이터 자산 유형에는 데이터에 액세스하는 방법을 포함하여 데이터에 대한 메타데이터 및 기타 정보가 포함되어 있습니다.
데이터 자산을 작성하는 방법은 데이터가 있는 위치에 따라 다릅니다.
데이터가 파일에 있는 경우 로컬 시스템에서 프로젝트, 카탈로그 또는 배치 영역으로 파일을 업로드합니다.
데이터가 원격 데이터 소스에 있는 경우 먼저 해당 데이터 소스에 대한 연결을 정의하는 연결 자산을 작성합니다. 그런 다음 연결, 경로 또는 기타 구조, 데이터를 포함하는 테이블 또는 파일을 선택하여 데이터 자산을 작성합니다. 이 유형의 데이터 자산을 연결된 데이터 자산이라고 합니다.
SQL 조회를 지원하는 데이터 소스의 경우, 조회유형의 데이터 자산인 동적 보기를 작성할 수도 있습니다. 이러한 자산을 작성하려면 연결을 선택하고 필요한 데이터만 검색하는 SQL 조회를 제공하십시오.
다음 그래픽은 파일의 데이터 자산이 Cloud Object Storage의 업로드된 파일을 가리키는 방법을 보여줍니다. 연결된 데이터 자산에는 연결 자산이 필요하며 원격 데이터 소스의 데이터를 가리킵니다.
프로젝트, 카탈로그 또는 배치 영역에서 다음 유형의 데이터 자산을 작성할 수 있습니다.
파일의 데이터 자산 로컬 시스템에서 업로드한 파일을 표시합니다. 파일은 작업 공간과 연결된 IBM Cloud Object Storage 인스턴스의 오브젝트 스토리지 컨테이너에 저장됩니다. 파일의 컨텐츠에는 구조화된 데이터, 구조화되지 않은 텍스트 데이터, 이미지 및 기타 유형의
데이터가 포함될 수 있습니다. 임의 형식의 파일로 데이터 자산을 작성할 수 있습니다. 그러나 다른 파일 유형보다 CSV 파일에 대해 더 많은 조치를 수행할 수 있습니다. 데이터 자산의 특성을 참조하십시오.
작업공간에서 파일을 업로드하여 파일에서 데이터 자산을 작성할 수 있습니다. 도구를 사용하여 데이터 파일을 작성하고 이를 자산으로 변환할 수도 있습니다. 예를 들어 Data Refinery, Jupyter 노트북, RStudio 도구를 사용하여 파일에서 데이터 자산을 만들 수 있습니다.
연결된 데이터 자산 원격 데이터 소스에 대한 연결을 통해 액세스되는 테이블, 파일 또는 폴더를 표시합니다. 연결은 연결된 데이터 자산과 연관된 연결 자산에서 정의됩니다. 지원되는 모든 연결에 대해 연결된 데이터 자산을 작성할 수 있습니다. 연결된 데이터 소스에 액세스할 때 데이터는 데이터 소스에서 동적으로 검색됩니다. 데이터 자산의 특성을 참조하십시오.
작업공간의 연결된 데이터 도구를 사용하여 데이터 소스에서 연결된 데이터 자산을 가져올 수 있습니다. 연결된 데이터 자산 세트 (예: 전체 데이터베이스 스키마) 를 가져오려면 프로젝트에서 메타데이터 가져오기 도구를 사용하십시오. Data virtualization 작업공간에서 Data Virtualization 를 사용하여 여러 데이터 소스의 데이터를 컴파일하는 가상 테이블을 작성할 수 있습니다.
프로젝트에서 조회 데이터 액세스 도구를 사용하여 데이터 소스에 있는 하나 이상의 테이블에서 필터링된 데이터를 포함하는 동적 보기를 작성할 수 있습니다.
폴더 자산 IBM Cloud Object Storage에 있는 폴더를 나타냅니다. 폴더 데이터 자산은 연결된 데이터 자산의 특수한 경우입니다. 폴더 및 IBM Cloud Object Storage 연결 자산에 대한 경로를 지정하여 폴더 데이터 자산을 작성합니다. 폴더 데이터 자산과 경로를 공유하는 파일 및
하위 폴더를 볼 수 있습니다. 폴더 데이터 자산 내에서 볼 수 있는 파일 자체는 데이터 자산이 아닙니다. 예를 들어, 지속적으로 업데이트되는 뉴스 피드가 포함된
경로의 폴더 데이터 자산을 작성할 수 있습니다. 데이터 자산의 특성을 참조하십시오.
워크스페이스에서 연결된 데이터 도구를 사용하여 IBM Cloud Object Storage에서 폴더 자산을 가져올 수 있습니다.
연결 자산 데이터 소스에 대한 연결을 작성하는 데 필요한 정보를 포함합니다. 연결 자산의 특성을 참조하십시오.
기본 특성 및 공통 카탈로그 특성 외에도 파일 및 연결된 데이터 자산의 데이터 자산에는 다음 표에 나열된 특성 또는 페이지가 있습니다.
파일 및 연결된 데이터 자산의 데이터 자산 특성
특성 또는 페이지
설명
편집 가능?
작업공간
컬럼
데이터 자산에 있는 열의 특성에 대한 요약입니다. 각 열에 대한 품질 점수, 설명, 지정된 데이터 클래스 및 지정된 비즈니스 용어를 포함합니다. 지정된 데이터 클래스 및 비즈니스 용어는 자산에 영향을 줄 수 있습니다. 예를 들어 할당된 비즈니스 기간은 데이터 보호 규칙의 적용을 트리거할 수 있습니다.
기본 키 및 키 관계 정보: - 기본 키로 설정된 열은 키 아이콘으로 식별됩니다(). 기본 키는 자산 측면 패널에도 표시됩니다. - 자산에 대한 키 관계가 있는 경우 키 관계 보기 링크를 클릭할 수 있습니다. 상위 탭에 기본 키에 대한 모든 관계가 표시됩니다. 하위 탭에서 자산에 외부 키가 포함된 모든 관계를 볼 수 있습니다.
아니오
카탈로그
태그
선택사항. 검색을 단순화하기 위해 사용자가 작성하는 텍스트 레이블입니다. 태그는 최대 255자의 한 문자열로 구성됩니다. 공백, 문자, 숫자, 밑줄, 대시 및 기호 #과 @를 포함할 수 있습니다.
예
프로젝트, 카탈로그
형식
MIME 유형의 파일입니다. 자동으로 감지됩니다.
예
프로젝트, 카탈로그, 공간
자산 세부사항
데이터 크기, 열 및 행 수, 자산 버전에 대한 정보입니다. 프로젝트에서 관계형 데이터의 테이블 유형도 표시됩니다.
아니오
프로젝트, 카탈로그, 공간
소스
스토리지의 데이터 파일 또는 데이터 소스 및 연결에 대한 정보입니다.
아니오
카탈로그, 공간
조회
자산을 생성하는 SQL 조회. 동적 보기 전용.
예
프로젝트
연결 세부사항
연결된 데이터 자산의 경우 경로, 연결 이름, 커넥터 유형 및 연결 소유자입니다. 동적 보기의 경우 연결 이름 및 커넥터 유형만 표시됩니다.
원래 데이터 소스의 제한된 열 및 행 세트를 포함하는 데이터의 미리보기입니다. 자산 컨텐츠 또는 미리보기를 참조하십시오.
아니오
프로젝트, 카탈로그, 공간
프로파일 페이지
데이터의 컨텐츠에 대한 메타데이터 및 통계입니다. 예를 들어, 보강된 자산이 카탈로그에 게시되면 확장된 메타데이터도 게시되며, 이 페이지에는 AI가 생성하거나 편집한 버전일 수 있는 표시 이름과설명이 표시됩니다. 이 정보는 개요 페이지에도 표시됩니다. 프로필를 참조하세요.
예
프로젝트, 카탈로그
데이터 품질 페이지
자산 및 해당 열의 데이터 품질과 적용된 데이터 품질 검사에 대한 정보입니다. 데이터 품질을 참조하십시오.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Some tools perform the same tasks but have different features and levels of automation.
Jupyter notebook editor
Prepare data
Visualize data
Build models
Deploy assets
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
AutoAI
Build models
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
SPSS Modeler
Prepare data
Visualize data
Build models
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Decision Optimization
Build models
Visualize data
Deploy assets
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Data Refinery
Prepare data
Visualize data
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Orchestration Pipelines
Prepare data
Build models
Deploy assets
Automate the model lifecycle, including preparing data, training models, and creating deployments.
RStudio
Prepare data
Build models
Deploy assets
Work with R notebooks and scripts in an integrated development environment.
Federated learning
Build models
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deployments
Deploy assets
Monitor models
Deploy and run your data science and AI solutions in a test or production environment.
Catalogs
Catalog data
Governance
Find and share your data and other assets.
Metadata import
Prepare data
Catalog data
Governance
Import asset metadata from a connection into a project or a catalog.
Metadata enrichment
Prepare data
Catalog data
Governance
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Data quality rules
Prepare data
Governance
Measure and monitor the quality of your data.
Masking flow
Prepare data
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Governance
Governance
Create your business vocabulary to enrich assets and rules to protect data.
Data lineage
Governance
Track data movement and usage for transparency and determining data accuracy.
AI factsheet
Governance
Monitor models
Track AI models from request to production.
DataStage flow
Prepare data
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Data virtualization
Prepare data
Create a virtual table to segment or combine data from one or more tables.
OpenScale
Monitor models
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Data replication
Prepare data
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Master data
Prepare data
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
watsonx.ai Studio
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
watsonx.ai Runtime
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
IBM Knowledge Catalog
Discover, profile, catalog, and share trusted data in your organization.
DataStage
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
Data Virtualization
View, access, manipulate, and analyze your data without moving it.
Watson OpenScale
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Data Replication
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Match360 with Watson
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Manta Data Lineage
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Project
Where you work with data.
> Projects > View all projects
Catalog
Where you find and share assets.
> Catalogs > View all catalogs
Space
Where you deploy and run assets that are ready for testing or production.
> Deployments
Categories
Where you manage governance artifacts.
> Governance > Categories
Data virtualization
Where you virtualize data.
> Data > Data virtualization
Master data
Where you consolidate data into a 360 degree view.