빠른 시작: Jupyter 노트북에서 데이터 분석
코드를 실행하여 데이터를 준비, 시각화 및 분석하거나 모델을 빌드 및 훈련시킬 수 있는 노트북을 작성할 수 있습니다. Jupyter 노트북에 대해 읽고 비디오를 시청하고 Python 코드에 대한 지식이 있는 사용자에게 적합한 학습서를 받으십시오.
기본 워크플로우에는 다음 태스크가 포함됩니다.
- 프로젝트를 작성합니다. 프로젝트는 데이터 작업을 위해 다른 사용자와 협업하는 위치입니다.
- 프로젝트에 데이터를 추가하십시오. 연결을 통해 원격 데이터 소스에서 데이터나 CSV 파일을 추가할 수 있습니다.
- 프로젝트에 노트북을 작성합니다.
- 코드를 노트북에 추가하여 데이터를 로드하고 분석합니다.
- 노트북을 실행하고 결과를 동료와 공유합니다.
노트북에 대해 알아보기
Jupyter 노트북은 대화식 컴퓨팅을 위한 웹 기반 환경입니다. 데이터를 처리하는 작은 코드 조각을 실행할 수 있으며 계산 결과를 즉시 볼 수 있습니다. 노트북에는 데이터에 대해 작업할 때 필요한 모든 구성 요소가 포함됩니다.
- 데이터
- 데이터를 처리하는 코드 컴퓨팅
- 결과 시각화
- 이해를 높여주는 텍스트 및 풍부한 매체
노트북에 대한 동영상 보기
Jupyter 노트북의 기초를 배우려면 이 비디오를 시청하십시오.
이 비디오는 이 문서에 기록된 단계를 수행하는 방법의 대안인 시각적 메소드를 제공합니다.
튜토리얼을 시도하여 노트북 작성
이 튜토리얼에서는 다음을 수행합니다.
- 프로젝트를 작성하고 갤러리에서 자산을 추가하십시오.
- 노트북을 작성합니다.
- 노트북에서 데이터를 분석합니다.
- 노트북을 편집하고 공유합니다.
- 노트북을 실행하는 작업을 작성합니다.
이 학습서를 완료하는 데 약 15분이 소요됩니다.
1단계: 프로젝트 작성 및 갤러리에서 자산 추가
{: #step1} 노트북 및 데이터 자산을 저장할 프로젝트가 필요합니다.
- 기존 프로젝트가 있는 경우, 이를 여십시오. 기존 프로젝트가 없는 경우 홈 페이지에서 프로젝트 작성을 클릭하거나 프로젝트 페이지에서 새 프로젝트를 클릭하십시오.
- 빈 프로젝트 작성을 선택하십시오.
- 프로젝트 작성 화면에서 프로젝트에 대한 이름 및 선택적 설명을 추가하십시오.
- 기존 오브젝트 스토리지 서비스 인스턴스을(를) 선택하거나 새로 작성하십시오.
- 작성을 클릭하십시오.
- 탐색 메뉴에서 갤러리를 클릭하십시오.
- 관심 있는 데이터 세트를 검색하고 데이터 세트를 선택하십시오.
- 프로젝트에 추가를 클릭하십시오.
- 목록에서 프로젝트를 선택하고 추가를 클릭하십시오.
- 데이터 세트가 추가된 후 프로젝트 보기를 클릭하십시오. 자산 탭에 데이터 세트가 표시됩니다.
자세한 정보 또는 비디오를 시청하려면 프로젝트 작성을(를) 참조하십시오.
노트북에서 액세스할 프로젝트에 갤러리 자산을 추가하는 자세한 정보는 노트북의 데이터 로드 및 액세스을(를)
참조하십시오.
2단계: 프로젝트에 노트북 추가
{: #step2} 프로젝트에 새 노트북을 작성하십시오.
- 프로젝트의 자산 페이지에서 새 자산 > 노트북을 클릭하십시오.
- 이름 및 설명을 입력하십시오(선택사항).
- 이 노트북에 대해 런타임 환경을 선택하십시오.
- 작성을 클릭하십시오. 노트북 편집기가 로드되기를 기다리십시오.
3단계: 파일 로드 및 노트북 저장
{: #step3} 데이터를 pandas DataFrame으로 로드하십시오.
- 데이터 찾기 및 추가 아이콘을 클릭하십시오.
- 파일 탭에서 추가한 데이터 세트 옆에 있는 코드에 삽입 드롭 다운을 클릭하고
pandas DataFrame
을(를) 삽입하십시오. - 코드를 실행하려면 실행을 클릭하십시오. 데이터 세트의 처음 몇 행이 표시됩니다.
- 노트북의 버전을 저장하려면 파일 > 버전 저장을 클릭하십시오. 노트북을 파일 > 저장과 함께 저장할 수도 있습니다.
4단계: 노트북 찾기 및 편집
{: #step4} 자산 탭에서 저장된 노트북을 찾고 노트북을 편집하십시오.
- 자산 탭에서 노트북을 찾으려면 프로젝트로 돌아가십시오.
- 노트북을 클릭하면
READ ONLY
모드로 열립니다. - 노트북을 편집하려면 연필 아이콘을 클릭하십시오.
- 정보 패널에 액세스하십시오.
- 일반 탭에서 노트북의 이름 및 설명을 편집하십시오.
- 환경 탭을 클릭하여 노트북을 실행하는 데 사용되는 환경을 변경할 수 있는 위치를 확인하거나 런타임 상태를 중지한 후 다시 시작하도록 업데이트하십시오.
5단계: 노트북의 읽기 전용 버전 공유
{: #step5}동료와 공유할 노트북에 대한 링크를 작성합니다.
- 노트북의 읽기 전용 보기를 공유하려면 공유 아이콘을 클릭하십시오.
- 링크가 있는 모든 사용자와 공유 토글 단추를 클릭하려면 클릭하십시오.
- 링크나 소셜 미디어를 통해 공유하려는 컨텐츠를 선택하십시오.
- 닫기를 클릭하십시오.
6단계: 다른 시간에 노트북을 실행하도록 스케줄 지정
{: #step6}특정 시간에 실행하거나 스케줄에 따라 반복하도록 노트북을 스케줄하는 작업을 작성합니다.
- 작업 아이콘을 클릭하고 작업 작성을 선택하십시오.
- 작업의 이름 및 설명을 제공하고 다음을 클릭하십시오.
- 노트북 버전 및 환경 런타임을 선택하고 다음을 클릭하십시오.
- (선택사항)전환 단추를 클릭하고 실행 스케줄을 지정하십시오. 작업을 반복할 날짜, 시간 및 날짜를 지정하고 다음을 클릭하십시오.
- (선택사항) 이 작업에 대한 알림을 받으려면 토글 단추를 클릭하고 다음을 클릭하십시오.
- 세부사항을 검토하고 작성(작업을 작성하지만 즉시 실행하지는 않음) 또는 작성 및 실행(작업을 즉시 실행하려면)을 클릭하십시오.
- 작업이 프로젝트의 작업 탭에 표시됩니다.
다음 단계
이제 차후 분석을 위해 이 데이터 세트를 사용할 수 있습니다. 예를 들어, 사용자나 다른 사용자가 다음 태스크를 수행할 수 있습니다.
추가 자원
- 노트북용 비디오를 더 보십시오.
- 샘플 데이터 세트 및 노트북을 찾아 갤러리에서 데이터를 정제하는 경험을 얻을 수 있습니다.
- IBM에서 제공하는 Industry Accelerators(예로 실행할 수 있는 종단간 솔루션 세트)를 사용하여 데이터에 대한 작업을 수행하거나 공통 비즈니스 문제를 해결하도록 사용자 정의할 수 있습니다. 대부분의 액셀러레이터에는 데이터를 분석하고, 모델을 빌드하고, 결과를 표시하는 데 필요한 모든 항목이 있는 샘플 프로젝트가 포함되어 있습니다.
상위 주제: 데이터 분석 및 시각화 시작하기