翻訳が最新ではありません
クイック・スタート: Jupyter ノートブックでのデータを分析する
コードを実行してデータを準備、視覚化、分析したり、モデルを作成してトレーニングしたりするためのノートブックを作成できます。 Jupyter ノートブックについて読み、ビデオを見て、 Python コードに関するある程度の知識を持つユーザーに適したチュートリアルを学習します。
基本的なワークフローには、以下のタスクが含まれます:
- サンドボックス・プロジェクトを開きます。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
- プロジェクト内にノートブックを作成します。
- ノートブックにコードを追加して、データをロードおよび分析します。
- ノートブックを実行し、結果を同僚と共有します。
ノートブックについて読む
Jupyter ノートブックは、対話式計算処理のための Web ベースの環境です。 データを処理する小さいコードを実行して、コンピューティングの結果をすぐに確認することができます。 ノートブックには、データの処理に必要な以下のすべてのビルディング・ブロックが含まれています。
- データ
- データを処理するコード計算
- 結果の視覚化
- 理解を深めるテキストおよびリッチ・メディア
ノートブックに関するビデオを見る
このビデオを見て、Jupyter ノートブックの基本を学習します。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
ノートブックを作成するためのチュートリアルを試す
このチュートリアルでは、以下のタスクを実行します:
- タスク 1: プロジェクトを開きます。
- タスク 2: プロジェクトにノートブックを追加する
- タスク 3: ファイルをロードしてノートブックを保存します。
- タスク 4: ノートブックを検索して編集します。
- タスク 5: ノートブックの読み取り専用バージョンを共有します。
- タスク 6: ノートブックを別の時刻に実行するようにスケジュールします。
このチュートリアルを完了するには、約 15 分かかります。
- このチュートリアルを完了するためのヒント
ピクチャー・イン・ピクチャーの使用
ヒント: ビデオを開始してから、チュートリアルをスクロールすると、ビデオはピクチャー・イン・ピクチャー・モードに移行します。 ピクチャー・イン・ピクチャーを最大限に活用するには、ビデオの目次を閉じます。 ピクチャー・イン・ピクチャー・モードを使用して、このチュートリアルのタスクを完了する際にビデオをフォローすることができます。 後続の各タスクのタイム・スタンプをクリックします。以下のアニメーション・イメージは、ビデオ・ピクト・イン・ピクチャーおよび目次フィーチャーの使用方法を示しています。
コミュニティーのヘルプを表示する
このチュートリアルでヘルプが必要な場合は、 Cloud Pak for Data コミュニティー・ディスカッション・フォーラムで質問したり、回答を見つけたりすることができます。
ブラウザー・ウィンドウのセットアップ
このチュートリアルを完了する最適な方法として、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、追跡しやすくすることを検討してください。
ヒント: ユーザー・インターフェースでこのチュートリアルを実行しているときにガイド・ツアーが表示された場合は、 「後で行うこともあります」をクリックします。
上に戻る
- タスク 1: プロジェクトを開く
ノートブックおよびデータ資産を保管するためのプロジェクトが必要です。 サンドボックス・プロジェクトを使用することも、プロジェクトを作成することもできます。 以下のステップに従って、プロジェクトを開き、プロジェクトにデータ資産を追加します。
ナビゲーション・メニュー
から、 「プロジェクト」>「すべてのプロジェクトを表示」 を選択します。
サンドボックス・プロジェクトを開きます。 新規プロジェクトを使用する場合は、以下のようにします。
新規プロジェクトをクリックしてください。
「空のプロジェクトの作成」を選択します。
プロジェクトの名前と説明 (オプション) を入力します。
既存の オブジェクト・ストレージ・サービス・インスタンス を選択するか、または新規作成します。
「作成」 をクリックします。
ナビゲーション・メニューから、 「サンプル」をクリックします。
面白いデータ・セットを検索し、そのデータ・セットを選択してください。
プロジェクトに追加をクリックしてください。
リストからプロジェクトを選択し、 追加をクリックしてください。
データ・セットが追加されたら、 プロジェクトの表示をクリックしてください。
プロジェクトで、 「資産」 タブをクリックしてデータ・セットを表示します。
詳しくは、 プロジェクトの作成を参照してください。
進行状況の確認
以下のイメージは、プロジェクトの「資産」タブを示しています。
上に戻る
- タスク 2: プロジェクトへのノートブックの追加
このタスクをプレビューするには、 00:06からビデオを視聴してください。
プロジェクト内に新規ノートブックを作成するには、以下のステップを実行します。
プロジェクトの 「資産」 タブで、 「新規タスク」>「 Python または R ノートブックでのデータおよびモデルの処理」をクリックします。
名前と説明(オプション)を入力します。
このノートブックのランタイム環境を選択してください。
「作成」 をクリックします。 ノートブック・エディターがロードされるまで待ちます。
進行状況の確認
以下の画像は、ブランクのノートブックを示しています。
上に戻る
- タスク 3: ファイルをロードしてノートブックを保存する
このタスクをプレビューするには、 00:23からビデオを視聴してください。
これで、前にプロジェクトにアップロードしたノートブックのデータ資産にアクセスできるようになりました。 データ・フレームにデータをロードするには、以下の手順を実行します。
ノートブックの空のコード・セルをクリックします。
「コード・スニペット」 アイコン (
) をクリックします。
サイド・ペインで、 「データの読み取り」をクリックします。
プロジェクトからデータを選択をクリックしてください。
プロジェクトからデータ資産を見つけ、 「選択」をクリックします。
「ロード」 ドロップダウン・リストで、希望するロード・オプションを選択します。
「セルにコードを挿入」をクリックします。 データ資産を読み取ってロードするコードがセルに挿入されます。
実行 をクリックしてコードを実行します。 データ・セットの最初の数行が表示されます。
ノートブックのバージョンを保存するには、 ファイル > バージョンの保存をクリックしてください。 ファイル > 保存を使用してノートブックを保存することもできます。
進行状況の確認
以下の画像は、pandas DataFrameを使用したノートブックを示しています。
上に戻る
- タスク 4: ノートブックの検索および編集
このタスクをプレビューするには、 01:19からビデオを視聴してください。
以下の手順に従って、「資産」タブで保存したノートブックを見つけ、ノートブックを編集します。
プロジェクト・ナビゲーション・トレールで、プロジェクト名をクリックしてプロジェクトに戻ります。
「資産」 タブをクリックして、ノートブックを見つけます。
ノートブックをクリックすると、
READ ONLY
モードで開きます。ノートブックを編集するには、 鉛筆 アイコン
をクリックします。
「情報」 アイコン
をクリックして、 「情報」 パネルを開きます。
一般 タブで、ノートブックの名前と説明を編集します。
「環境」 タブをクリックして、ノートブックの実行に使用される環境を変更したり、ランタイム状況を停止して再始動するように更新したりする方法を確認します。
進行状況の確認
以下の画像は、「情報」パネルが表示されたノートブックを示しています。
上に戻る
- タスク 5: ノートブックの読み取り専用バージョンの共有
このタスクをプレビューするには、 01:52からビデオを視聴してください。
ノートブックへのリンクを作成して同僚と共有するには、以下の手順を実行します。
ノートブックの読み取り専用ビューを共有する場合は、 「共有」 アイコン
をクリックします。
リンクを持つすべてのユーザーに共有 トグル・ボタンをクリックしてオンにします。
リンクまたはソーシャル・メディアを介して共有するコンテンツを選択してください。
「コピー」 アイコン
をクリックして、このノートブックへの直接リンクをコピーします。
「閉じる」をクリックします。
進行状況の確認
次の画像は、「共有」ダイアログ・ボックスを示しています。
上に戻る
- タスク 6: ノートブックを別の時刻に実行するようにスケジュールする
このタスクをプレビューするには、 02:08から始まるビデオをご覧ください。
ノートブックを特定の時刻に実行するか、スケジュールに基づいて繰り返すようにスケジュールするには、以下のステップに従ってジョブを作成します。
「ジョブ」 アイコンをクリックし、 「ジョブの作成」を選択します。
ジョブの名前と説明を入力し、 次へをクリックしてください。
ノートブックのバージョンと環境ランタイムを選択し、 次へをクリックしてください。
(オプション) トグル・ボタンをクリックして実行をスケジュールします。 日付、時刻、およびジョブを繰り返すかどうかを指定し、 次へをクリックしてください。
(オプション) トグル・ボタンをクリックしてこのジョブの通知を受け取り、 次へをクリックしてください。
詳細を確認し、 作成 (ジョブを作成するが、ジョブを即時に実行しない) または 作成して実行 (ジョブを即時に実行する) のいずれかをクリックします。
ジョブは、プロジェクトの ジョブ タブに表示されます。
進行状況の確認
次の画像は、「ジョブ」タブを示しています。
上に戻る
次のステップ
これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:
その他のリソース
詳しくは、 ビデオを参照してください。
サンプル内のサンプル・データ・セット、プロジェクト、モデル、プロンプト、およびノートブックを見つけて、ハンズオン・エクスペリエンスを実現します。
ノートブック 。データの分析とモデルの作成を開始するためにプロジェクトに追加できます。
プロジェクト 。ノートブック、データ・セット、プロンプト、およびその他の資産を含むインポートが可能です。
データ・セット 。モデルを詳細化、分析、および作成するためにプロジェクトに追加できます。
プロンプト 。プロンプト・ラボで基盤モデルのプロンプトを出すために使用できます。
プロンプト・ラボで使用できる
基盤モデル 。
親トピック: クイック・スタート・チュートリアル