クイック・スタート: Jupyter ノートブックでのデータを分析する

コードを実行してデータを準備、視覚化、分析したり、モデルを作成してトレーニングしたりするためのノートブックを作成できます。 Jupyter ノートブックについて読み、ビデオを見て、 Python コードに関するある程度の知識を持つユーザーに適したチュートリアルを学習します。

基本的なワークフローには、以下のタスクが含まれます:

  1. プロジェクトを作成する プロジェクトでは、データを処理するために他のユーザーと共同作業を行うことができます。
  2. データをプロジェクトに追加します。 接続を介してリモート・データ・ソースから CSV ファイルまたはデータを追加できます。
  3. プロジェクト内にノートブックを作成します。
  4. ノートブックにコードを追加して、データをロードおよび分析します。
  5. ノートブックを実行し、結果を同僚と共有します。

ノートブックについて読む

Jupyter ノートブックは、対話式計算処理のための Web ベースの環境です。 データを処理する小さいコードを実行して、コンピューティングの結果をすぐに確認することができます。 ノートブックには、データの処理に必要な以下のすべてのビルディング・ブロックが含まれています。

  • データ
  • データを処理するコード計算
  • 結果の視覚化
  • 理解を深めるテキストおよびリッチ・メディア

ノートブックの詳細を読む

ノートブックに関するビデオを見る

ビデオを見る このビデオを見て、Jupyter ノートブックの基本を学習します。

このビデオでは、本書に記載されている手順に従う代わりの方法として、視覚方式を提供します。

ノートブックを作成するためのチュートリアルを試す

このチュートリアルでは、以下を行います。

  • プロジェクトを作成し、ギャラリーからアセットを追加します。
  • ノートブックを作成します。
  • ノートブックでデータを分析します。
  • ノートブックを編集して共有します。
  • ジョブを作成してノートブックを実行します。

このチュートリアルを完了するには、約 15 分かかります。

ステップ 1: プロジェクトを作成し、ギャラリーからアセットを追加する

{: #step1} ノートブックおよびデータ資産を保管するためのプロジェクトが必要です。

  1. 既存のプロジェクトがある場合は、それを開きます。 既存のプロジェクトがない場合は、ホーム・ページで プロジェクトの作成 をクリックするか、 プロジェクト ページで 新規プロジェクト をクリックします。
  2. 「空のプロジェクトの作成」を選択します。
  3. プロジェクトの作成 画面で、プロジェクトの名前と説明 (オプション) を追加してください。
  4. 既存の オブジェクト・ストレージ・サービス・インスタンス {: new_window} を選択するか、新規作成します。
  5. 「作成」をクリックします。
  6. ナビゲーション・メニューから、 ギャラリーをクリックしてください。
  7. 面白いデータ・セットを検索し、そのデータ・セットを選択してください。
  8. プロジェクトに追加をクリックしてください。
  9. リストからプロジェクトを選択し、 追加をクリックしてください。
  10. データ・セットが追加されたら、 プロジェクトの表示をクリックしてください。 資産 タブにデータ・セットが表示されます。

詳細について、またはビデオを見るには、 プロジェクトの作成 {: new_window}を参照してください。
ノートブックでアクセスするためにギャラリー資産をプロジェクトに追加する方法について詳しくは、 ノートブックでのデータのロードとアクセスを参照してください。

ステップ 2: プロジェクトへノートブックを追加する

{: #step2} プロジェクトに新規ノートブックを作成します。

  1. プロジェクトの 資産 ページで、 新規資産 > ノートブックをクリックしてください。
  2. 名前と説明(オプション)を入力します。
  3. このノートブックのランタイム環境を選択してください。
  4. 「作成」をクリックします。 ノートブック・エディターがロードされるまで待ちます。

ステップ 3: ファイルをロードしてノートブックを保存する

{: #step3} pandas DataFrame にデータをロードします。

  1. データの検索と追加 アイコンをクリックしてください。
  2. ファイル タブから、追加したデータ・セットの横にある コードに挿入 ドロップダウンをクリックし、 pandas DataFrameを挿入してください。
  3. 実行 をクリックしてコードを実行します。 データ・セットの最初の数行が表示されます。
  4. ノートブックのバージョンを保存するには、 ファイル > バージョンの保存をクリックしてください。 ファイル > 保存を使用してノートブックを保存することもできます。

ステップ 4: ノートブックを検索して編集する

{: #step4} 「資産」タブで保存したノートブックを見つけ、ノートブックを編集します。

  1. プロジェクトに戻り、資産 タブでノートブックを見つけます。
  2. ノートブックをクリックすると、 READ ONLY モードで開きます。
  3. ノートブックを編集するには、 鉛筆 アイコンをクリックしてください。
  4. 情報 パネルにアクセスします。
  5. 一般 タブで、ノートブックの名前と説明を編集します。
  6. 環境 タブをクリックして、ノートブックの実行に使用される環境を変更できる場所を確認したり、ランタイム状況を停止して再始動するように更新したりすることができます。

ステップ 5: ノートブックの読み取り専用バージョンを共有する

{: #step5} 同僚と共有するノートブックへのリンクを作成します。

  1. ノートブックの読み取り専用ビューを共有する場合は、 共有 アイコンをクリックしてください。
  2. リンクを持つすべてのユーザーに共有 トグル・ボタンをクリックしてオンにします。
  3. リンクまたはソーシャル・メディアを介して共有するコンテンツを選択してください。
  4. 「閉じる」をクリックします。

ステップ 6: ノートブックを違う時刻に実行するようにスケジュールする

{: #step6} 特定の時刻に実行するか、スケジュールに基づいて繰り返すようにノートブックをスケジュールするためのジョブを作成します。

  1. ジョブ アイコンをクリックし、 ジョブの作成を選択してください。
  2. ジョブの名前と説明を入力し、 次へをクリックしてください。
  3. ノートブックのバージョンと環境ランタイムを選択し、 次へをクリックしてください。
  4. (オプション) トグル・ボタンをクリックして実行をスケジュールします。 日付、時刻、およびジョブを繰り返すかどうかを指定し、 次へをクリックしてください。
  5. (オプション) トグル・ボタンをクリックしてこのジョブの通知を受け取り、 次へをクリックしてください。
  6. 詳細を確認し、 作成 (ジョブを作成するが、ジョブを即時に実行しない) または 作成して実行 (ジョブを即時に実行する) のいずれかをクリックします。
  7. ジョブは、プロジェクトの ジョブ タブに表示されます。

次のステップ

これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:

追加リソース

  • 詳しくは、 ノートブックのビデオを参照してください。
  • サンプル・データ・セットとノートブックを検索して、 ギャラリーでデータを洗練させる実践的な経験を得ることができます。
  • IBM が提供する一連のエンドツーエンド・ソリューションである 業界アクセラレーター を使用して、データの処理を迅速化します。これらのソリューションは、例として実行することも、一般的なビジネス問題に対応するためにカスタマイズすることもできます。 ほとんどのアクセラレーターには、データの分析、モデルの作成、および結果の表示に必要なものがすべて備わっているサンプル・プロジェクトも含まれています。

親トピック: データの分析と視覚化の入門