0 / 0
영어 버전 문서로 돌아가기
노트북에서 데이터 로드 및 액세스
마지막 업데이트 날짜: 2024년 11월 21일
노트북에서 데이터 로드 및 액세스

로컬 파일, 무료 데이터 세트 또는 데이터 소스 연결에서 데이터에 액세스하여 노트북에 데이터를 통합할 수 있습니다. 해당 데이터를 노트북의 데이터 구조 또는 컨테이너(예: pandas.DataFrame, numpy.array, Spark RDD 또는 Spark DataFrame)에 로드합니다.

노트북에서 데이터에 대해 작업하기 위해 다음 옵션 중에서 선택할 수 있습니다.

노트북에 데이터를 추가하기 위해 권장되는 방법
옵션 권장 메소드 요구사항 세부사항
로컬 시스템의 파일에서 데이터 추가 데이터를 로드하는 코드 스니펫 추가 파일은 프로젝트에 자산으로 존재해야 합니다. 로컬 시스템에서 파일 추가코드 스니펫을 사용하여 데이터 로드
자원 허브에서 사용 가능한 데이터 세트의 데이터 추가 데이터를 로드하는 코드 스니펫 추가 데이터 세트 (파일) 는 프로젝트에 자산으로 존재해야 합니다. 자원 허브에서 무료 데이터 세트 추가코드 스니펫을 사용하여 데이터 로드
데이터 소스 연결에서 데이터 로드 데이터를 로드하는 코드 스니펫 추가 연결은 프로젝트에 자산으로 존재해야 합니다. 프로젝트에 연결 추가데이터 소스 연결에서 데이터를 로드하는 코드 스니펫 추가
프로젝트 자산 및 메타데이터에 프로그래밍 방식으로 액세스 ibm-watson-studio-lib 사용 프로젝트에 데이터 자산이 있어야 합니다. ibm-watson-studio-lib 라이브러리를 사용하여 데이터 자산과 상호작용
기능 저장소 데이터 작성 및 사용 assetframe-lib 라이브러리 함수 사용 프로젝트에 데이터 자산이 있어야 합니다. Python 용 assetframe-lib 라이브러리를 사용하여 기능 저장소 데이터 작성 및 사용
API 함수 또는 운영 체제 명령을 사용하여 데이터 액세스 예를 들면, wget 해당사항 없음 API 함수 또는 운영 체제 명령을 사용하여 데이터에 액세스
중요: 노트북이 시작된 환경에 노트북에 로드하는 데이터를 저장할 수 있는 충분한 메모리가 있는지 확인하십시오. 환경에는 노트북에 로드되는 데이터의 총 크기보다 상당히 많은 메모리가 있어야 합니다. 판다와 같은 일부 데이터 프레임워크는 메모리에 여러 개의 데이터 사본을 보유할 수 있습니다.

로컬 시스템에서 파일 추가

Jupyterlab 노트북 편집기를 사용하여 로컬 시스템에서 프로젝트로 파일을 추가하려면 다음을 수행하십시오.

  1. 편집 모드에서 노트북을 여십시오.
  2. 도구 모음에서 프로젝트에 자산 업로드 아이콘 프로젝트에 자산 업로드 아이콘 을 클릭하고 파일을 추가하십시오.
팁: 파일을 노트북 사이드바로 끌어올 수도 있습니다.

자원 허브에서 데이터 세트 로드

자원 허브의 데이터 세트에는 열린 데이터가 포함되어 있습니다. 자원 허브에서 공용 데이터 세트에 대해 작업하는 방법을 보려면 이 짧은 비디오를 보십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

자원 허브에서 프로젝트로 데이터 세트를 추가하려면 다음을 수행하십시오.

  1. 탐색 메뉴에서 리소스 허브를 선택합니다.

  2. 추가할 데이터 세트의 카드를 찾으십시오.

    데이터 세트 보기

  3. 프로젝트에 추가를 클릭하고 프로젝트를 선택한 후 추가를 클릭하십시오. 프로젝트 보기를 클릭하면 프로젝트 개요 페이지로 이동합니다. 데이터 자산이 프로젝트 자산 페이지의 데이터 자산 목록에 추가됩니다.

파일에서 데이터 로드

전제조건 이 파일은 프로젝트에 자산으로 존재해야 합니다. 세부사항은 로컬 시스템에서 파일 추가 또는 자원 허브에서 데이터 세트 로드를 참조하십시오.

프로젝트 파일에서 노트북으로 데이터를 로드하려면 다음을 수행하십시오.

  1. 편집 모드에서 노트북을 여십시오.
  2. 코드 조각 코드 스니펫 아이콘 클릭하고 데이터 읽기를 클릭한 다음 프로젝트에서 데이터 파일을 선택합니다. 선택사항을 변경하려면 편집 아이콘을 사용하십시오.
  3. 다른 이름으로 로드 드롭 다운 목록에서 원하는 로드 옵션을 선택하십시오. 신임 정보를 선택하면 파일 액세스 신임 정보만 생성됩니다. 세부사항은 신임 정보 추가를 참조하십시오.
  4. 노트북에서 빈 코드 셀을 클릭한 후 셀에 코드 삽입 을 클릭하여 생성된 코드를 삽입하십시오. 또는 생성된 코드를 클립보드에 복사한 후 코드를 노트북에 붙여넣으십시오.

생성된 코드는 데이터 세트에 대한 작업을 시작하는 빠른 시작 역할을 합니다. 프로덕션 시스템의 경우 삽입된 코드를 주의깊게 검토하여 사용자의 요구를 더 잘 충족하는 사용자 고유의 코드를 작성할지 여부를 판별하십시오.

노트북 언어 및 데이터 형식에 대해 생성되는 데이터 구조를 학습하려면 데이터 로드 지원을 참조하십시오.

데이터 소스 연결에서 데이터 로드

전제조건 IBM 데이터 서비스 또는 외부 데이터 소스에서 데이터를 로드하려면 먼저 프로젝트에 대한 연결을 작성하거나 추가해야 합니다. 프로젝트에 연결 추가를 참조하십시오.

기존 데이터 소스 연결에서 노트북의 데이터 구조로 데이터를 로드하려면 다음을 수행하십시오.

  1. 편집 모드에서 노트북을 여십시오.
  2. 코드 조각 코드 스니펫 아이콘 클릭하고 데이터 읽기를 클릭한 다음 프로젝트에서 데이터 소스 연결을 선택합니다.
  3. 스키마를 선택하고 테이블을 선택하십시오. 선택사항을 변경하려면 편집 아이콘을 사용하십시오.
  4. 로드 옵션을 선택하십시오. 신임 정보를 선택하면 메타데이터만 생성됩니다. 세부사항은 신임 정보 추가를 참조하십시오.
  5. 노트북에서 빈 코드 셀을 누른 다음 셀에 코드를 삽입하십시오. 또는 생성된 코드를 클립보드에 복사한 후 코드를 노트북에 붙여넣으십시오.
  6. 필요한 경우 키 아이콘 표시된 잠긴 데이터 연결에 대한 개인 자격 증명을 입력합니다. 이는 연결을 영구적으로 잠금 해제하는 일회성 단계입니다. 연결을 잠금 해제한 후에는 키 아이콘이 더 이상 표시되지 않습니다. 자세한 정보는 프로젝트에 연결 추가를 참조하십시오.

생성된 코드는 연결에 대한 작업을 시작하기 위한 빠른 시작 역할을 합니다. 프로덕션 시스템의 경우 삽입된 코드를 주의깊게 검토하여 사용자의 요구를 더 잘 충족하는 사용자 고유의 코드를 작성할지 여부를 판별하십시오.

노트북 언어 및 데이터 형식에 대해 생성되는 데이터 구조를 학습하려면 데이터 로드 지원을 참조하십시오.

인증 정보 추가

IBM Cloud Object Storage 있는 파일 또는 연결을 통해 액세스할 수 있는 파일에 액세스하는 고유한 코드를 생성할 수 있습니다. 예를 들어, 스니펫 생성 도구에서 파일 형식을 지원하지 않는 경우에 유용합니다. 신임 정보를 사용하여 노트북 셀의 데이터 구조에 데이터를 로드하기 위한 사용자 고유의 코드를 작성할 수 있습니다.

신임을 추가하려면 다음을 수행하십시오.

  1. 코드 조각 코드 스니펫 아이콘 클릭한 다음 데이터 읽기를 클릭합니다.
  2. 노트북에서 빈 코드 셀을 클릭하고 신임 정보 를 로드 옵션으로 선택한 후 신임 정보를 셀에 로드하십시오. 또한 신임 정보를 클립보드에 복사한 후 노트북에 붙여넣기 위해 클릭할 수 있습니다.
  3. 노트북의 코드에 신임 정보를 삽입하여 데이터에 액세스하십시오. 예를 들어, Python에 대한 블로그. 에서 이 코드를 참조하십시오.

API 함수 또는 운영 체제 명령을 사용하여 데이터에 액세스

노트북에서 API 기능 또는 운영 체제 명령을 사용하여 데이터에 액세스할 수 있습니다. 예를 들어, wget 명령을 사용하여 HTTP, HTTPS 또는 FTP 프로토콜을 사용하여 데이터에 액세스할 수 있습니다. 이러한 유형의 API 함수 및 명령을 사용하는 경우 프로젝트 액세스 토큰을 설정하는 코드를 포함해야 합니다. 수동으로 프로젝트 액세스 토큰 추가를 참조하십시오.

API에 대한 참조 정보는 데이터 및 AI 공통 코어 API를 참조하세요.

상위 주제: 노트북 및 스크립트

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기