0 / 0
영어 버전 문서로 돌아가기
빠른 시작: 합성 테이블 형식 데이터 생성
마지막 업데이트 날짜: 2024년 11월 28일
빠른 시작: 합성 테이블 형식 데이터 생성

IBM watsonx.ai에서 합성 테이블 형식 데이터를 생성하는 방법을 학습하려면 이 튜토리얼을 사용하십시오. 합성 데이터의 이점은 요청 시 데이터를 조달한 후 유스 케이스에 맞게 사용자 정의하고 대량으로 생성할 수 있다는 것입니다. 이 학습서는 그래픽 플로우 편집기 도구인 Synthetic Data Generator를 사용하여 비주얼 플로우 및 모델링 알고리즘을 사용하는 사용자 정의 데이터 스키마 또는 프로덕션 데이터를 기반으로 합성 테이블 형식 데이터를 생성하는 방법을 학습하는 데 도움을 줍니다.

필수 서비스
watsonx.ai 스튜디오

기본 워크플로우에는 다음 태스크가 포함됩니다.

  1. 프로젝트를 여십시오. 프로젝트는 데이터 작업을 위해 다른 사용자와 협업하는 위치입니다.
  2. 프로젝트에 데이터를 추가합니다. 연결을 통해 원격 데이터 소스에서 데이터나 CSV 파일을 추가할 수 있습니다.
  3. 프로젝트에 대한 합성 데이터 플로우를 작성하고 실행하십시오. 그래픽 플로우 편집기 도구 Synthetic Data Generator 를 사용하여 비주얼 플로우 및 모델링 알고리즘을 사용하는 사용자 정의 데이터 스키마 또는 프로덕션 데이터를 기반으로 합성 테이블 데이터를 생성합니다.
  4. 합성 데이터 플로우 및 출력을 검토하십시오.

합성 데이터에 대한 정보 읽기

합성 데이터는 AI 모델을 개선하고 민감한 데이터를 보호하며 편향성을 완화하기 위해 실제 데이터를 보강하거나 대체하기 위해 컴퓨터에서 생성된 정보입니다. 합성 데이터는 실제 예제에서 기계 학습 모델을 훈련시키는 데 제공되는 많은 물류, 윤리 및 개인정보 보호 문제를 완화하는 데 도움이 됩니다.

합성 데이터에 대해 자세히 보기

합성 테이블 데이터 생성에 대한 비디오 보기

비디오 보기 비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 비디오에 표시된 사용자 인터페이스에 약간의 차이가 있을 수 있습니다. 이 비디오는 작성된 학습서와 함께 사용하기 위한 것입니다.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.


학습서를 사용하여 합성 테이블 데이터 생성

이 학습서에서는 다음 태스크를 완료합니다.





이 학습을 완료하기 위한 팁
다음은 이 학습서를 성공적으로 완료하기 위한 몇 가지 팁입니다.

비디오 사진 사용

팁: 비디오를 시작한 후 학습서를 스크롤하면 비디오가 그림 모드로 이동합니다. 픽처 인 픽처를 사용하여 최상의 경험을 얻으려면 비디오 목차를 닫으십시오. 그림 모드를 사용하여 이 학습서의 태스크를 완료할 때 비디오를 따라갈 수 있습니다. 수행할 각 태스크의 시간소인을 클릭하십시오.

다음 애니메이션 이미지는 비디오 픽처 인 픽처 및 목차 기능을 사용하는 방법을 보여줍니다.

그림 및 장을 사용하는 방법

커뮤니티에서 도움 받기

이 튜토리얼에 도움이 필요하면 watsonx 커뮤니티 토론 포럼에서 질문하거나 답변을 찾을 수 있습니다.

브라우저 창 설정

이 튜토리얼을 완료하는 최적의 경험을 위해 한 브라우저 창에서 Cloud Pak for Data 를 열고 두 애플리케이션 간에 쉽게 전환할 수 있도록 다른 브라우저 창에서 이 튜토리얼 페이지를 열어 두십시오. 따라하기 쉽도록 두 개의 브라우저 창을 나란히 배열하는 것을 고려하십시오.

병행 학습서 및 UI

팁: 사용자 인터페이스에서 이 학습서를 완료하는 동안 안내서 둘러보기가 표시되면 나중에를 클릭하십시오.



태스크 1: 프로젝트 열기

자산을 저장할 프로젝트가 필요합니다.

샌드박스 프로젝트를 작성하고 서비스를 연관시키는 방법을 보려면 비디오를 보십시오. 그런 다음 단계에 따라 기존 프로젝트가 있는지 확인하거나 샌드박스 프로젝트를 작성하십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

  1. watsonx 홈 화면에서 프로젝트 섹션으로 스크롤하십시오. 나열된 프로젝트가 있으면 태스크 2로 건너뛰십시오. 프로젝트가 표시되지 않으면 다음 단계에 따라 프로젝트를 작성하십시오.

  2. 샌드박스 프로젝트 작성을 클릭하십시오. 프로젝트가 작성되면 프로젝트 섹션에 샌드박스 프로젝트가 표시됩니다.

추가 정보나 동영상을 보려면 프로젝트 작성을 참조하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 프로젝트 섹션에 샌드박스가 나열된 홈 화면을 표시합니다. 이제 프롬프트 랩을 열 준비가 되었습니다.

샌드박스 프로젝트가 나열된 홈 화면입니다.




태스크 2: 프로젝트에 데이터 추가

학습서 비디오 미리보기 이 작업을 미리 보려면 00:24부터 시작하는 동영상을 시청하세요.

이 학습서에서 사용되는 데이터 세트에는 회사가 고객에 대해 수집하는 일반 정보가 포함되어 있으며 자원 허브에서 사용 가능합니다. 자원 허브에서 데이터 세트를 찾아 프로젝트에 추가하려면 다음 단계를 수행하십시오.

  1. 리소스 허브에서 고객 데이터 집합에 액세스합니다.

  2. 프로젝트에 추가를 클릭하십시오.

  3. 목록에서 프로젝트를 선택하고 추가를 클릭하십시오.

  4. 데이터 세트가 추가된 후 프로젝트 보기를 클릭하십시오.

자원 허브에서 프로젝트로 데이터 자산을 추가하는 방법에 대한 자세한 정보는 노트북에서 데이터 로드 및 액세스를 참조하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 프로젝트의 자산 탭을 표시합니다. 이제 합성 데이터 플로우를 작성할 준비가 되었습니다.

다음 이미지는 프로젝트의 자산 탭을 표시합니다.




태스크 3: 합성 데이터 플로우 작성

학습서 비디오 미리보기 이 작업을 미리 보려면 00:43부터 시작하는 동영상을 시청하세요.

Synthetic Data Generator 를 사용하여 비주얼 플로우 및 모델링 알고리즘을 사용하는 사용자 정의 데이터 스키마 또는 프로덕션 데이터를 기반으로 합성 테이블 데이터를 생성하는 데이터 플로우를 작성하십시오. 프로젝트에서 합성 데이터 플로우 자산을 작성하려면 다음 단계를 수행하십시오.

  1. 프로젝트의 자산 탭에서 새 자산 > 합성 테이블 형식 데이터 생성을 클릭하십시오.
  2. 이름에 Bank customers을(를) 입력하십시오.
  3. 작성을 클릭하십시오.
  4. Synthetic Data Generator 화면에서 최초 사용자를 클릭하고 계속을 클릭하십시오. 이 옵션은 데이터 플로우를 빌드하기 위한 안내된 경험을 제공합니다.
  5. 다음 두 가지 유스 케이스를 검토하십시오.
    • 기존 데이터 활용: 프로덕션 데이터를 기반으로 구조화된 합성 데이터 세트를 생성합니다. 데이터베이스에 연결하고, 파일을 가져오거나 업로드하고, 마스크하고, 내보내기 전에 출력을 생성할 수 있습니다.
    • 사용자 정의 데이터에서 작성: 메타데이터를 기반으로 구조화된 합성 데이터 세트를 생성합니다. 각 테이블 컬럼, 해당 분포 및 상관관계 내에서 데이터를 정의할 수 있습니다.
  6. 기존 데이터 활용 유스 케이스를 선택하고 다음 을 클릭하여 기존 데이터를 가져오십시오.
  7. 자원 허브에서 추가한 고객 데이터 자산을 사용하려면 프로젝트에서 데이터 선택 을 클릭하십시오.
    1. 데이터 자산 > customers.csv를 선택하십시오.
    2. 선택을 클릭하십시오.
    3. 다음 을 클릭하십시오.
  8. 컬럼 목록에서 creditcard_number를 검색하십시오.
    1. CREDITCARD_NUMBER익명화 열에서 를 선택하여 고객의 신용 카드 번호를 마스크하십시오.
    2. 다음 을 클릭하십시오.
  9. 가상 갱신 옵션 페이지에서 기본 설정을 승인하십시오. 이러한 옵션은 데이터의 각 열을 수정하기 위해 후보 통계 분포 세트를 사용하여 프로덕션 데이터를 기반으로 합성 데이터를 생성합니다. 다음을 클릭하십시오.
  10. 파일 이름bank_customers.csv를 입력하고 다음을 클릭하십시오.
  11. 설정을 검토하고 저장 및 실행을 클릭하십시오. Synthetic Data Generator 도구가 데이터 플로우와 함께 표시됩니다. 실행이 완료될 때까지 기다리십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 Synthetic Data Generator에서 열린 데이터 플로우를 표시합니다. 이제 데이터 플로우를 탐색하고 출력을 볼 수 있습니다.

다음 이미지는 Synthetic Data Generator에서 열린 데이터 플로우를 표시합니다.




태스크 4: 데이터 플로우 및 출력 검토

학습서 비디오 미리보기 이 작업을 미리 보려면 01:48부터 시작하는 동영상을 시청하세요.

실행이 완료되면 데이터 플로우를 탐색할 수 있습니다. 합성 데이터 플로우 및 결과를 검토하려면 다음 단계를 수행하십시오.

  1. 팔레트 아이콘 ' 팔레트 '을 클릭하여 노드 패널을 닫습니다.

  2. 가져오기 노드를 두 번 클릭하여 설정을 확인하십시오.

    1. 데이터 특성을 검토하십시오. 도구는 프로젝트에서 데이터 세트를 읽고 적절한 데이터 특성을 채웁니다.
    2. 유형 섹션을 펼치십시오. 도구는 데이터 세트의 값 및 열을 읽습니다.
    3. 취소를 클릭하십시오.
  3. 익명화 노드를 두 번 클릭하여 설정을 확인하십시오.

    1. CREDITCARD_NUMBER 열이 익명으로 설정되었는지 확인하십시오.
    2. 값 익명화 섹션을 펼치십시오. 여기서 값을 익명화하는 방법을 사용자 정의할 수 있습니다.
    3. 취소를 클릭하십시오.
  4. 가상 갱신 노드를 두 번 클릭하여 설정을 확인하십시오.

    1. 기본 설정을 검토하여 소스 고객 데이터 세트의 데이터를 모방하십시오.
    2. 취소를 클릭하십시오.
  5. 생성 노드를 두 번 클릭하여 설정을 확인하십시오.

    1. 합성된 열의 목록을 검토하십시오.
    2. 선택사항: 상관고급 옵션을 검토하십시오.
    3. 취소를 클릭하십시오.
  6. 내보내기 노드를 두 번 클릭하여 설정을 확인하십시오.

    1. 선택사항: 기본적으로 내보낸 데이터는 프로젝트에 저장됩니다. 경로 변경 을 클릭하여 Db2 Warehouse와 같은 연결에 내보낸 데이터를 저장하십시오.
    2. 취소를 클릭하십시오.
  7. 프로젝트 이름을 클릭하여 자산 탭으로 돌아가십시오.

    프로젝트 이동 경로

  8. bank_customers.csv 를 클릭하여 생성된 합성 테이블 형식 데이터의 미리보기를 확인하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 내보낸, 생성된 합성 테이블 형식 데이터 세트를 표시합니다.

다음 이미지는 내보낸 생성된 합성 테이블 형식 데이터 세트를 표시합니다.



다음 단계

watsonx.ai: 에 대한 더 많은 실습 경험을 얻으려면 다음 추가 학습서를 시도해 위치이할 수 있습니다.

추가 자원

  • 비디오를 더 보십시오.

  • 자원 허브에서 샘플 데이터 세트, 프로젝트, 모델, 프롬프트 및 노트북을 찾아 실제 경험을 얻을 수 있습니다.

    노트북 프로젝트에 추가하여 데이터 분석과 모델 구축을 시작할 수 있는 노트북입니다.

    프로젝트 노트북, 데이터 세트, 프롬프트 및 기타 에셋을 포함해 가져올 수 있는 프로젝트입니다.

    데이터 세트 프로젝트에 추가하여 모델을 구체화, 분석 및 구축할 수 있는 데이터 세트입니다.

    프롬프트 프롬프트 랩에서 foundation model 프롬프트하는 데 사용할 수 있는 프롬프트입니다.

    프롬프트 랩에서 사용할 수 있는 모델 파운데이션 모델입니다.

  • watsonx개요

상위 주제: 빠른 시작 학습서

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기