コードを実行してデータを準備、視覚化、分析したり、モデルを作成してトレーニングしたりするためのノートブックを作成できます。 Jupyter ノートブックについて読み、ビデオを見て、 Python コードに関するある程度の知識を持つユーザーに適したチュートリアルを学習します。
- 必要なサービス
- watsonx.aiスタジオ
基本的なワークフローには、以下のタスクが含まれます:
- プロジェクトを作成する プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
- プロジェクト内にノートブックを作成します。
- ノートブックにコードを追加して、データをロードおよび分析します。
- ノートブックを実行し、結果を同僚と共有します。
ノートブックについて読む
Jupyter ノートブックは、対話式計算処理のための Web ベースの環境です。 データを処理する小規模のコードを実行して、計算結果を即時に表示できます。 ノートブックには、データの処理に必要な以下のすべてのビルディング・ブロックが含まれています。
- データ
- データを処理するコード計算
- 結果の視覚化
- 理解を深めるテキストおよびリッチ・メディア
ノートブックに関するビデオを見る
このビデオを見て、Jupyter ノートブックの基本を学習します。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
ノートブックを作成するためのチュートリアルを試す
このチュートリアルでは、以下のタスクを実行します:
- タスク 1: プロジェクトを開きます。
- タスク 2: プロジェクトにノートブックを追加する
- タスク 3: ファイルをロードしてノートブックを保存します。
- タスク 4: ノートブックを検索して編集します。
- タスク 5: ノートブックの読み取り専用バージョンを共有します。
- タスク 6: ノートブックを別の時刻に実行するようにスケジュールします。
このチュートリアルを完了するには、約 15 分かかります。
このチュートリアルを完了するためのヒント
このチュートリアルを正常に完了するためのヒントを以下に示します。
ビデオ・ピクチャー・イン・ピクチャーの使用
以下のアニメーション・イメージは、ビデオ・ピクチャー・イン・ピクチャーおよび目次機能の使用方法を示しています。
コミュニティーでのヘルプの利用
このチュートリアルでヘルプが必要な場合は、Cloud Pak for DataCommunityディスカッションフォーラムで質問したり、回答を見つけることができます。
ブラウザー・ウィンドウのセットアップ
このチュートリアルを最適に実行するには、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、見やすくすることを検討してください。
タスク 1: プロジェクトを開く
ノートブックおよびデータ資産を保管するためのプロジェクトが必要です。 既存のプロジェクトを使用することも、プロジェクトを作成することもできます。 プロジェクトを開き、データ資産をプロジェクトに追加するには、以下の手順を実行します。
ナビゲーションメニュー「」から、「プロジェクト」 > 「すべてのプロジェクトを表示」を選択する
既存のプロジェクトを開きます。 新規プロジェクトを使用する場合は、以下のようにします。
新規プロジェクトをクリックしてください。
「空のプロジェクトの作成」を選択します。
プロジェクトの名前と説明 (オプション) を入力します。
既存の オブジェクト・ストレージ・サービス・インスタンス を選択するか、または新規作成します。
「作成」 をクリックします。
ナビゲーションメニュー「」から「リソースハブ」をクリックします。
面白いデータ・セットを検索し、そのデータ・セットを選択してください。
プロジェクトに追加をクリックしてください。
リストからプロジェクトを選択し、 追加をクリックしてください。
データ・セットが追加されたら、 プロジェクトの表示をクリックしてください。
プロジェクトで、 「資産」 タブをクリックしてデータ・セットを表示します。
詳しくは、プロジェクトの作成をご覧ください。
ノートブックでアクセスするためのリソース・ハブ・アセットのプロジェクトへの追加については、ノートブックでのデータのロードとアクセスを参照してください。
進捗状況を確認する
以下の画像は、プロジェクトの「資産」タブを示しています。
タスク 2: プロジェクトへのノートブックの追加
このタスクをプレビューするには、00:06から始まるビデオを見てください。
プロジェクト内に新規ノートブックを作成するには、以下のステップを実行します。
あなたのプロジェクトでは、資産タブをクリックして新しい資産 > データとモデルの操作PythonまたはRノートブック。
名前と説明(オプション)を入力します。
このノートブックのランタイム環境を選択してください。
「作成」 をクリックします。 ノートブック・エディターがロードされるまで待ちます。
進捗状況を確認する
以下の画像は、ブランクのノートブックを示しています。
タスク 3: ファイルをロードしてノートブックを保存する
このタスクをプレビューするには、00:23から始まるビデオを見てください。
これで、前にプロジェクトにアップロードしたノートブックのデータ資産にアクセスできるようになりました。 データ・フレームにデータをロードするには、以下の手順を実行します。
ノートブックの空のコード・セルをクリックします。
コードスニペットアイコン()をクリックします。
サイド・ペインで、 「データの読み取り」をクリックします。
プロジェクトからデータを選択をクリックしてください。
プロジェクトからデータ資産を見つけて、 「選択」をクリックします。
「名前を付けてロード」 ドロップダウン・リストで、希望するロード・オプションを選択します。
「セルにコードを挿入」をクリックします。 データ資産を読み取ってロードするコードがセルに挿入されます。
実行アイコン「」をクリックしてコードを実行する。 データ・セットの最初の数行が表示されます。
ノートブックのバージョンを保存するには、 ファイル > バージョンの保存をクリックしてください。 ファイル > 保存を使用してノートブックを保存することもできます。
進捗状況を確認する
以下の画像は、pandas DataFrameを使用したノートブックを示しています。
タスク 4: ノートブックの検索および編集
このタスクをプレビューするには、01:19から始まるビデオを見てください。
「資産」タブで保存したノートブックを見つけて編集するには、以下の手順を実行します。
プロジェクト・ナビゲーション・トレールで、プロジェクト名をクリックしてプロジェクトに戻ります。
「アセット」 タブをクリックしてノートブックを見つけます。
ノートブックをクリックすると、
READ ONLY
モードで開きます。ノートブックを編集するには、鉛筆のアイコン「」をクリックします。
情報アイコン「」をクリックして情報パネルを開く。
一般 タブで、ノートブックの名前と説明を編集します。
「環境」 タブをクリックして、ノートブックの実行に使用される環境を変更する方法、またはランタイム状況を停止してから再始動するように更新する方法を確認します。
進捗状況を確認する
以下の画像は、「情報」パネルが表示されたノートブックを示しています。
タスク 5: ノートブックの読み取り専用バージョンの共有
このタスクをプレビューするには、01:52から始まるビデオをご覧ください。
ノートブックへのリンクを作成して同僚と共有するには、以下の手順に従います。
ノートブックの読み取り専用ビューを共有したい場合は、共有アイコン「」をクリックしてください。
リンクを持つすべてのユーザーに共有 トグル・ボタンをクリックしてオンにします。
リンクまたはソーシャル・メディアを介して共有するコンテンツを選択してください。
コピーアイコン「クリックして、このノートブックへの直接リンクをコピーしてください。
「閉じる」をクリックします。
進捗状況を確認する
次の画像は、「共有」ダイアログ・ボックスを示しています。
タスク 6: ノートブックを別の時刻に実行するようにスケジュールする
このタスクをプレビューするには、 02:08から始まるビデオをご覧ください。
ノートブックを特定の時刻に実行するようにスケジュールするジョブ、またはスケジュールに基づいてノートブックを繰り返すジョブを作成するには、以下の手順を実行します。
ジョブ]アイコンをクリックし、[ジョブの作成]を選択します。
'ジョブの名前と説明を入力し、 次へをクリックしてください。
ノートブックのバージョンと環境ランタイムを選択し、 次へをクリックしてください。
(オプション) トグル・ボタンをクリックして実行をスケジュールします。 日付、時刻、およびジョブを繰り返すかどうかを指定し、 次へをクリックしてください。
(オプション) トグル・ボタンをクリックしてこのジョブの通知を受け取り、 次へをクリックしてください。
詳細を確認し、 作成 (ジョブを作成するが、ジョブを即時に実行しない) または 作成して実行 (ジョブを即時に実行する) のいずれかをクリックします。
ジョブは、プロジェクトの ジョブ タブに表示されます。
進捗状況を確認する
以下の画像は、「ジョブ」タブを示しています。
次のステップ
これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:
その他のリソース
詳しくは、 ビデオを参照してください。
サンプルデータセットとノートブックは、Resource hubでデータの改良を実際に体験できます。
IBM が提供する一連のエンドツーエンド・ソリューションである 業界アクセラレーター を使用して、データの処理を迅速化します。これらのソリューションは、例として実行することも、一般的なビジネス問題に対応するためにカスタマイズすることもできます。 ほとんどのアクセラレーターには、データの分析、モデルの作成、および結果の表示に必要なものがすべて備わっているサンプル・プロジェクトも含まれています。
親トピック: クイック・スタート・チュートリアル