빠른 시작: Jupyter 노트북에서 데이터 분석

코드를 실행하여 데이터를 준비, 시각화 및 분석하거나 모델을 빌드 및 훈련시킬 수 있는 노트북을 작성할 수 있습니다. Jupyter 노트북에 대해 읽고 비디오를 시청하고 Python 코드에 대한 지식이 있는 사용자에게 적합한 학습서를 받으십시오.

기본 워크플로우에는 다음 태스크가 포함됩니다.

  1. 프로젝트를 작성합니다. 프로젝트는 데이터 작업을 위해 다른 사용자와 협업하는 위치입니다.
  2. 프로젝트에 데이터를 추가하십시오. 연결을 통해 원격 데이터 소스에서 데이터나 CSV 파일을 추가할 수 있습니다.
  3. 프로젝트에 노트북을 작성합니다.
  4. 코드를 노트북에 추가하여 데이터를 로드하고 분석합니다.
  5. 노트북을 실행하고 결과를 동료와 공유합니다.

노트북에 대해 알아보기

Jupyter 노트북은 대화식 컴퓨팅을 위한 웹 기반 환경입니다. 데이터를 처리하는 작은 코드 조각을 실행할 수 있으며 계산 결과를 즉시 볼 수 있습니다. 노트북에는 데이터에 대해 작업할 때 필요한 모든 구성 요소가 포함됩니다.

  • 데이터
  • 데이터를 처리하는 코드 컴퓨팅
  • 결과 시각화
  • 이해를 높여주는 텍스트 및 풍부한 매체

노트북에 대한 자세한 정보 읽기

노트북에 대한 동영상 보기

비디오 시청 Jupyter 노트북의 기초를 배우려면 이 비디오를 시청하십시오.

이 비디오는 이 문서에 기록된 단계를 수행하는 방법의 대안인 시각적 메소드를 제공합니다.

튜토리얼을 시도하여 노트북 작성

이 튜토리얼에서는 다음을 수행합니다.

  • 프로젝트를 작성하고 갤러리에서 자산을 추가하십시오.
  • 노트북을 작성합니다.
  • 노트북에서 데이터를 분석합니다.
  • 노트북을 편집하고 공유합니다.
  • 노트북을 실행하는 작업을 작성합니다.

이 학습서를 완료하는 데 약 15분이 소요됩니다.

1단계: 프로젝트 작성 및 갤러리에서 자산 추가

{: #step1} 노트북 및 데이터 자산을 저장할 프로젝트가 필요합니다.

  1. 기존 프로젝트가 있는 경우, 이를 여십시오. 기존 프로젝트가 없는 경우 홈 페이지에서 프로젝트 작성을 클릭하거나 프로젝트 페이지에서 새 프로젝트를 클릭하십시오.
  2. 빈 프로젝트 작성을 선택하십시오.
  3. 프로젝트 작성 화면에서 프로젝트에 대한 이름 및 선택적 설명을 추가하십시오.
  4. 기존 오브젝트 스토리지 서비스 인스턴스을(를) 선택하거나 새로 작성하십시오.
  5. 작성을 클릭하십시오.
  6. 탐색 메뉴에서 갤러리를 클릭하십시오.
  7. 관심 있는 데이터 세트를 검색하고 데이터 세트를 선택하십시오.
  8. 프로젝트에 추가를 클릭하십시오.
  9. 목록에서 프로젝트를 선택하고 추가를 클릭하십시오.
  10. 데이터 세트가 추가된 후 프로젝트 보기를 클릭하십시오. 자산 탭에 데이터 세트가 표시됩니다.

자세한 정보 또는 비디오를 시청하려면 프로젝트 작성을(를) 참조하십시오.
노트북에서 액세스할 프로젝트에 갤러리 자산을 추가하는 자세한 정보는 노트북의 데이터 로드 및 액세스을(를) 참조하십시오.

2단계: 프로젝트에 노트북 추가

{: #step2} 프로젝트에 새 노트북을 작성하십시오.

  1. 프로젝트의 자산 페이지에서 새 자산 > 노트북을 클릭하십시오.
  2. 이름 및 설명을 입력하십시오(선택사항).
  3. 이 노트북에 대해 런타임 환경을 선택하십시오.
  4. 작성을 클릭하십시오. 노트북 편집기가 로드되기를 기다리십시오.

3단계: 파일 로드 및 노트북 저장

{: #step3} 데이터를 pandas DataFrame으로 로드하십시오.

  1. 데이터 찾기 및 추가 아이콘을 클릭하십시오.
  2. 파일 탭에서 추가한 데이터 세트 옆에 있는 코드에 삽입 드롭 다운을 클릭하고 pandas DataFrame을(를) 삽입하십시오.
  3. 코드를 실행하려면 실행을 클릭하십시오. 데이터 세트의 처음 몇 행이 표시됩니다.
  4. 노트북의 버전을 저장하려면 파일 > 버전 저장을 클릭하십시오. 노트북을 파일 > 저장과 함께 저장할 수도 있습니다.

4단계: 노트북 찾기 및 편집

{: #step4} 자산 탭에서 저장된 노트북을 찾고 노트북을 편집하십시오.

  1. 자산 탭에서 노트북을 찾으려면 프로젝트로 돌아가십시오.
  2. 노트북을 클릭하면 READ ONLY 모드로 열립니다.
  3. 노트북을 편집하려면 연필 아이콘을 클릭하십시오.
  4. 정보 패널에 액세스하십시오.
  5. 일반 탭에서 노트북의 이름 및 설명을 편집하십시오.
  6. 환경 탭을 클릭하여 노트북을 실행하는 데 사용되는 환경을 변경할 수 있는 위치를 확인하거나 런타임 상태를 중지한 후 다시 시작하도록 업데이트하십시오.

5단계: 노트북의 읽기 전용 버전 공유

{: #step5}동료와 공유할 노트북에 대한 링크를 작성합니다.

  1. 노트북의 읽기 전용 보기를 공유하려면 공유 아이콘을 클릭하십시오.
  2. 링크가 있는 모든 사용자와 공유 토글 단추를 클릭하려면 클릭하십시오.
  3. 링크나 소셜 미디어를 통해 공유하려는 컨텐츠를 선택하십시오.
  4. 닫기를 클릭하십시오.

6단계: 다른 시간에 노트북을 실행하도록 스케줄 지정

{: #step6}특정 시간에 실행하거나 스케줄에 따라 반복하도록 노트북을 스케줄하는 작업을 작성합니다.

  1. 작업 아이콘을 클릭하고 작업 작성을 선택하십시오.
  2. 작업의 이름 및 설명을 제공하고 다음을 클릭하십시오.
  3. 노트북 버전 및 환경 런타임을 선택하고 다음을 클릭하십시오.
  4. (선택사항)전환 단추를 클릭하고 실행 스케줄을 지정하십시오. 작업을 반복할 날짜, 시간 및 날짜를 지정하고 다음을 클릭하십시오.
  5. (선택사항) 이 작업에 대한 알림을 받으려면 토글 단추를 클릭하고 다음을 클릭하십시오.
  6. 세부사항을 검토하고 작성(작업을 작성하지만 즉시 실행하지는 않음) 또는 작성 및 실행(작업을 즉시 실행하려면)을 클릭하십시오.
  7. 작업이 프로젝트의 작업 탭에 표시됩니다.

다음 단계

이제 차후 분석을 위해 이 데이터 세트를 사용할 수 있습니다. 예를 들어, 사용자나 다른 사용자가 다음 태스크를 수행할 수 있습니다.

추가 자원

  • 노트북용 비디오를 더 보십시오.
  • 샘플 데이터 세트 및 노트북을 찾아 갤러리에서 데이터를 정제하는 경험을 얻을 수 있습니다.
  • IBM에서 제공하는 Industry Accelerators(예로 실행할 수 있는 종단간 솔루션 세트)를 사용하여 데이터에 대한 작업을 수행하거나 공통 비즈니스 문제를 해결하도록 사용자 정의할 수 있습니다. 대부분의 액셀러레이터에는 데이터를 분석하고, 모델을 빌드하고, 결과를 표시하는 데 필요한 모든 항목이 있는 샘플 프로젝트가 포함되어 있습니다.

상위 주제: 데이터 분석 및 시각화 시작하기