자산 유형 및 특성
협업 작업 영역에서 도구에 대해 작업할 때 자원 양식으로 컨텐츠를 작성합니다. 자산 은 데이터 세트, 모델 또는 데이터에 대해 작업하는 다른 항목에 대한 정보를 포함하는 항목입니다.
자산을 가져오거나 도구를 사용하여 작성하여 자산을 추가합니다. 협업 작업 영역에서 자원에 대해 작업합니다. 사용하는 작업공간은 태스크에 따라 다릅니다.
프로젝트 다른 사용자와 협업하여 데이터에 대해 작업하고 자산을 작성하는 위치입니다. 대부분의 도구는 프로젝트에 있으며 프로젝트에 코드가 포함된 자산을 실행합니다. 예를 들어, 프로젝트에서 데이터를 가져오거나, 데이터를 준비하거나, 데이터를 분석하거나, 모델을 작성할 수 있습니다. 프로젝트를 참조하십시오.
배치 영역 -테스트 또는 프로덕션을 위해 준비된 자산을 배치하고 실행합니다. 프로젝트에서 배치 영역으로 자산을 이동한 후 해당 자산에서 배치를 작성합니다. 필요에 따라 배치를 모니터하고 업데이트합니다. 배치 영역을 참조하십시오.
여러 가지 유형의 자산을 작성할 수 있지만 모든 자산에는 몇 가지 공통 특성이 있습니다.
자산 유형
대부분의 자산 유형을 작성하려면 특정 도구를 사용해야 합니다.
다음 표에는 작성할 수 있는 자산 유형, 작성해야 하는 도구 및 추가할 수 있는 작업공간이 나열되어 있습니다.
자산 유형 | 설명 | 작성 도구 | 작업공간 |
---|---|---|---|
AutoAI 실험 | 후보 예측 모델 파이프라인을 자동으로 생성합니다. | AutoAI | 프로젝트 |
연결된 데이터 자산 | 원격 데이터 소스에 대한 연결을 통해 액세스되는 데이터를 나타냅니다. | 연결된 데이터 도구 | 프로젝트, 공간 |
연결 | 데이터 소스에 연결하기 위한 정보를 포함합니다. | 연결 도구 | 프로젝트, 공간 |
파일의 데이터 자산 | 로컬 시스템에서 업로드한 파일을 나타냅니다. | 업로드 분할창 | 프로젝트, 공간 |
Data Refinery 플로우 | 데이터를 준비합니다. | Data Refinery | 프로젝트, 공간 |
Decision Optimization | 최적화 문제점 해결 | Decision Optimization | 프로젝트 |
연합 학습 실험 | 원격 데이터 소스 세트에서 공통 모델을 훈련합니다. | 연합 학습 | 프로젝트 |
폴더 자산 | IBM Cloud Object Storage의 폴더를 나타냅니다. | 연결된 데이터 도구 | 프로젝트, 공간 |
Jupyter 노트북 | Python 또는 R 코드를 실행하여 데이터를 분석하거나 모델을 작성합니다. | Jupyter 노트북 편집기, AutoAI, 프롬프트 랩 | 프로젝트 |
모델 | 저장되거나 가져온 모델에 대한 정보를 포함합니다. | 실험 또는 모델 훈련을 실행하는 다양한 도구 | 프로젝트, 공간 |
모델 사용 케이스 | 요청에서 프로덕션까지 모델의 라이프사이클을 추적합니다. | watsonx.governance | 재고 |
파이프라인 | 모델 라이프사이클을 자동화합니다. | 오케스트레이션 파이프라인 | 프로젝트 |
프롬프트 템플리트 | 단일 프롬프트. | 프롬프트 랩 | 프로젝트 |
프롬프트 세션 | 프롬프트 랩에서 작업 세션의 히스토리입니다. | 프롬프트 랩 | 프로젝트 |
Python 함수 | 프로덕션에서 모델을 지원하기 위한 Python 코드를 포함합니다. | Jupyter 노트북 편집기 | 프로젝트, 공간 |
스크립트 | 프로덕션에서 모델을 지원하기 위한 Python 또는 R 스크립트를 포함합니다. | Jupyter 노트북 편집기, RStudio | 프로젝트, 공간 |
SPSS Modeler 플로우 | 플로우를 실행하여 데이터를 준비하고 모델을 빌드합니다. | SPSS Modeler | 프로젝트 |
시각화 | 데이터 자산의 시각화를 표시합니다. | 데이터 자산의 시각화 페이지 | 프로젝트 |
합성 데이터 플로우 | 합성 테이블 형식 데이터를 생성합니다. | Synthetic Data Generator | 프로젝트 |
튜닝된 모델 | 조정된 기초 모델. | 튜닝 스튜디오 | 프로젝트 |
튜닝 실험 | 튜닝된 기본 모델을 빌드하는 튜닝 실험입니다. | 튜닝 스튜디오 | 프로젝트 |
자산의 공통 특성
자산을 작성하거나 사용하거나 자동화된 프로세스에서 업데이트할 때 자산은 특성에 정보를 누적합니다. 일부 특성은 사용자가 제공하며 사용자가 편집할 수 있습니다. 기타 특성은 시스템에서 자동으로 제공됩니다. 대부분의 시스템 제공 특성은 사용자가 편집할 수 없습니다.
자산의 마지막 수정 날짜 필드는 사용자 조치와 시스템 조치를 모두 추적합니다. 시스템 조치는 종종 백그라운드에서 발생하며 자산의 내부 메타데이터에 대한 변경사항만 포함할 수 있습니다.
모든 위치의 자산에 대한 공통 특성
대부분의 자산 유형에는 해당 자산 유형이 있는 모든 작업공간의 다음 표에 나열된 특성이 있습니다.
특성 | 설명 | 편집 가능? |
---|---|---|
이름 | 자산 이름입니다. 최대 255자를 포함할 수 있습니다. 멀티바이트 문자를 지원합니다. 비어 있을 수 없으며, 유니코드 제어 문자를 포함할 수 없고, 공백만 포함할 수 없습니다. 자산 이름은 프로젝트 또는 배치 공간에서 고유하지 않아도 됩니다. | 예 |
설명 | 선택사항. 멀티바이트 문자 및 하이퍼링크를 지원합니다. | 예 |
작성 날짜 | 자산을 작성하거나 가져온 시점의 시간소인입니다. | 아니오 |
작성자 또는 소유자 | 자산을 작성하거나 가져온 사용자의 사용자 이름 또는 이메일 주소입니다. | 아니오 |
마지막 수정 날짜 | 자산이 마지막으로 수정된 시간소인입니다. | 아니오 |
마지막 편집자 | 자산을 마지막으로 수정한 사용자의 사용자 이름 또는 이메일 주소입니다. | 아니오 |
도구에서 실행되는 자산의 공통 특성
일부 자산은 도구 실행과 연관되어 있습니다. 예를 들어, AutoAI 실험 자산은 AutoAI 도구에서 실행됩니다. 도구에서 실행되는 자산을 운영 자산이라고도 합니다. 도구에서 자산을 실행할 때마다 작업을 시작합니다. 작업을 모니터하고 스케줄링할 수 있습니다. 작업은 계산 자원을 사용합니다. 컴퓨팅 리소스는 용량 단위 시간(CUH)으로 측정되며 추적됩니다. 서비스 플랜에 따라 매월 CUH의 제한된 양을 사용하거나 매월 사용하는 CUH에 대해 지불할 수 있습니다.
도구에서 실행되는 많은 자산의 경우 사용할 컴퓨팅 환경 구성을 선택할 수 있습니다. 일반적으로 더 크고 빠른 환경 구성이 컴퓨팅 리소스를 더 빠르게 사용합니다.
기본 특성 외에 도구에서 실행되는 대부분의 자산에는 프로젝트에 다음 유형의 정보가 포함되어 있습니다.
특성 | 설명 | 편집 가능? | 작업공간 |
---|---|---|---|
환경 정의 | 자산 실행을 위한 환경 템플리트, 하드웨어 스펙 및 소프트웨어 스펙입니다. 환경을 참조하십시오. | 예 | 프로젝트, 공간 |
설정 | 자산이 실행되는 방법을 정의하는 정보입니다. 각 자산 유형에 특정합니다. | 예 | 프로젝트 |
연관 데이터 자산 | 자산이 작업 중인 데이터입니다. | 예 | 프로젝트 |
작업 | 환경 정의, 스케줄 및 알림 옵션을 포함하여 자산을 실행하는 방법에 대한 정보입니다. 작업을 참조하십시오. | 예 | 프로젝트, 공간 |
데이터 자산 유형 및 해당 특성
데이터 자산 유형에는 데이터에 액세스하는 방법을 포함하여 데이터에 대한 메타데이터 및 기타 정보가 포함되어 있습니다.
데이터 자산을 작성하는 방법은 데이터가 있는 위치에 따라 다릅니다.
- 데이터가 파일에 있는 경우 로컬 시스템에서 프로젝트 또는 배치 영역으로 파일을 업로드합니다.
- 데이터가 원격 데이터 소스에 있는 경우 먼저 해당 데이터 소스에 대한 연결을 정의하는 연결 자산을 작성합니다. 그런 다음 연결, 경로 또는 기타 구조, 데이터를 포함하는 테이블 또는 파일을 선택하여 데이터 자산을 작성합니다. 이 유형의 데이터 자산을 연결된 데이터 자산이라고 합니다.
다음 그래픽은 파일의 데이터 자산이 Cloud Object Storage에서 업로드된 파일을 가리키는 방법을 보여줍니다. 연결된 데이터 자산에는 연결 자산이 필요하며 원격 데이터 소스의 데이터를 가리킵니다.
프로젝트 또는 배치 영역에서 다음 유형의 데이터 자산을 작성할 수 있습니다.
파일의 데이터 자산 로컬 시스템에서 업로드한 파일을 표시합니다. 파일은 작업공간과 연관된 IBM Cloud Object Storage 인스턴스의 오브젝트 스토리지 컨테이너에 저장됩니다. 파일의 컨텐츠에는 구조화된 데이터, 구조화되지 않은 텍스트 데이터, 이미지 및 기타 유형의 데이터가 포함될 수 있습니다. 임의 형식의 파일로 데이터 자산을 작성할 수 있습니다. 그러나 CSV 파일에 대해 다른 파일 유형보다 더 많은 조치를 수행할 수 있습니다. 데이터 자산의 특성을 참조하십시오.
작업공간에서 파일을 업로드하여 파일에서 데이터 자산을 작성할 수 있습니다. 도구를 사용하여 데이터 파일을 작성하고 이를 자산으로 변환할 수도 있습니다. 예를 들어, Data Refinery, Jupyter 노트북 및 RStudio 도구를 사용하여 파일에서 데이터 자산을 작성할 수 있습니다.
연결된 데이터 자산 원격 데이터 소스에 대한 연결을 통해 액세스되는 테이블, 파일 또는 폴더를 표시합니다. 연결은 연결된 데이터 자산과 연관된 연결 자산에서 정의됩니다. 지원되는 모든 연결에 대해 연결된 데이터 자산을 작성할 수 있습니다. 연결된 데이터 소스에 액세스할 때 데이터는 데이터 소스에서 동적으로 검색됩니다. 데이터 자산의 특성을 참조하십시오.
작업공간의 연결된 데이터 도구를 사용하여 데이터 소스에서 연결된 데이터 자산을 가져올 수 있습니다.
폴더 자산 IBM Cloud Object Storage의 폴더를 나타냅니다. 폴더 데이터 자산은 연결된 데이터 자산의 특수한 경우입니다. 폴더 및 IBM Cloud Object Storage 연결 자산에 대한 경로를 지정하여 폴더 데이터 자산을 작성합니다. 폴더 데이터 자산과 경로를 공유하는 파일 및 하위 폴더를 볼 수 있습니다. 폴더 데이터 자산 내에서 볼 수 있는 파일 자체는 데이터 자산이 아닙니다. 예를 들어, 지속적으로 업데이트되는 뉴스 피드가 포함된 경로의 폴더 데이터 자산을 작성할 수 있습니다. 데이터 자산의 특성을 참조하십시오.
작업공간의 연결된 데이터 도구를 사용하여 IBM Cloud Object Storage 에서 폴더 자산을 가져올 수 있습니다.
연결 자산 데이터 소스에 대한 연결을 작성하는 데 필요한 정보를 포함합니다. 연결 자산의 특성을 참조하십시오.
작업공간에서 연결 도구를 사용하여 연결을 작성할 수 있습니다.
데이터 자산 작성 및 가져오기에 대해 자세히 알아보십시오.
파일 및 연결된 데이터 자산의 데이터 자산 특성
기본 특성 외에도 파일 및 연결된 데이터 자산의 데이터 자산에는 다음 표에 나열된 특성 또는 페이지가 있습니다.
특성 또는 페이지 | 설명 | 편집 가능? | 작업공간 |
---|---|---|---|
태그 | 선택사항. 검색을 단순화하기 위해 사용자가 작성하는 텍스트 레이블입니다. 태그는 최대 255자의 한 문자열로 구성됩니다. 공백, 문자, 숫자, 밑줄, 대시 및 기호 #과 @를 포함할 수 있습니다. | 예 | 프로젝트 |
형식 | MIME 유형의 파일입니다. 자동으로 감지됩니다. | 예 | 프로젝트, 공간 |
소스 | 스토리지의 데이터 파일 또는 데이터 소스 및 연결에 대한 정보입니다. | 아니오 | 프로젝트, 공간 |
자산 세부사항 | 데이터 크기, 열 및 행 수, 자산 버전에 대한 정보입니다. | 아니오 | 프로젝트, 공간 |
자산 미리 보기 | 원래 데이터 소스의 제한된 열 및 행 세트를 포함하는 데이터의 미리보기입니다. 자산 컨텐츠 또는 미리보기를 참조하십시오. | 아니오 | 프로젝트, 공간 |
프로파일 페이지 | 데이터의 컨텐츠에 대한 메타데이터 및 통계입니다. 프로파일을 참조하십시오. | 예 | 프로젝트 |
시각화 페이지 | 사용자가 데이터를 이해하기 위해 작성하는 차트 및 그래프입니다. 시각화를 참조하십시오. | 예 | 프로젝트 |
기능 그룹 페이지 | 모델에서 기능으로 사용되는 데이터 자산의 열에 대한 정보입니다. 기능 그룹 관리를 참조하십시오. | 예 | 프로젝트, 공간 |
연결 자산의 특성
연결 자산의 특성은 연결을 작성할 때 선택하는 데이터 소스에 따라 다릅니다. 연결 유형을 참조하십시오. 대부분의 데이터 소스에 대한 연결 자산에는 다음 표에 나열된 특성이 있습니다.
특성 | 설명 | 편집 가능? | 작업공간 |
---|---|---|---|
연결 세부사항 | 데이터 소스를 식별하는 정보입니다. 예를 들어, 데이터베이스 이름, 호스트 이름, IP 주소, 포트, 인스턴스 ID, 버킷, 엔드포인트 URL등이 있습니다. | 예 | 프로젝트, 공간 |
인증 정보 설정 | 신임 정보가 플랫폼에서 공유되는지 (기본값) 또는 각 사용자가 개인 신임 정보를 입력해야 하는지 여부입니다. 모든 데이터 소스가 개인 신임 정보를 지원하는 것은 아닙니다. | 예 | 프로젝트, 공간 |
인증 메소드 | 신임 정보의 형식입니다. 예를 들어, API키 또는 사용자 이름 및 비밀번호입니다. | 예 | 프로젝트, 공간 |
신임 정보 | 데이터 소스 및 지정된 인증 메소드에 필요한 사용자 이름 및 비밀번호, API키 또는 기타 신임 정보입니다. | 예 | 프로젝트, 공간 |
인증서 | 데이터 소스 포트가 SSL 연결 및 SSL 인증서에 대한 기타 정보를 승인하도록 구성되었는지 여부입니다. | 예 | 프로젝트, 공간 |
개인용 연결 | 인터넷에 구체화되지 않은 데이터베이스에 연결하는 방법입니다. 방화벽 뒤의 데이터에 연결을 참조하십시오. | 예 | 프로젝트, 공간 |
자세히 알아보기
상위 주제: IBM watsonx.ai의 개요