コード・エディター (ノートブック・エディターや RStudio などの統合開発環境 (IDE) など) で Jupyter ノートブックおよびスクリプトを使用して、 Python および R コードを作成、編集、および実行できます。
- ノートブック
- Jupyter ノートブックは、対話式計算処理のための Web ベースの環境です。 ノートブックを使用して、データを処理する小さなコード断片を実行し、計算の結果を即時に表示することができます。 ノートブックには、データを処理するために必要なすべてのビルディング・ブロック (データ、データを処理するコード計算、結果の視覚化、理解を深めるためのテキストとリッチ・メディア) が含まれています。
- スクリプト
- スクリプトは、コマンドとコメントのセットを含むファイルです。 このスクリプトは保存して、後で保存したコマンドを再実行するために使用できます。 ノートブックとは異なり、スクリプト内のコマンドは線形方式でのみ実行できます。
ノートブック
- 必要な権限
- プロジェクト内の 編集者 または 管理者 役割
- ツール
- ノートブック・エディター
- プログラミング言語
- Python および R
- データ・フォーマット
- すべてのタイプ
- コード・サポートは、以下のプロジェクト資産からデータをロードしてアクセスするために使用できます。
- CSV、JSON、.xlsx、.xls ファイルなどのデータ資産
- データベース接続および接続されたデータ資産
データ・ロードのサポートを参照してください。 サポートされるファイル・タイプおよびデータベース・タイプの場合。
- データ・サイズ
- 5 GB。 ファイルがこれより大きい場合は、データを複数のパーツに分割してロードする必要があります。
スクリプト
- 必要な権限
- プロジェクト内の 編集者 または 管理者 役割
- ツール
- RStudio
- プログラミング言語
- R
- データ・フォーマット
- すべてのタイプ
- コード・サポートは、以下のプロジェクト資産からデータをロードしてアクセスするために使用できます。
- CSV、JSON、.xlsx、.xls ファイルなどのデータ資産
- データベース接続および接続されたデータ資産
データ・ロードのサポートを参照してください。 サポートされるファイル・タイプおよびデータベース・タイプの場合。
- データ・サイズ
- 5 GB。 ファイルがこれより大きい場合は、データを複数のパーツに分割してロードする必要があります。
ノートブック・エディターでの作業
ノートブック・エディターは主に、対話式の探索的データ分析プログラミングおよびデータ可視化に使用されます。 ノートブックを編集できるのは、一度に 1 人のユーザーのみです。 他のすべてのユーザーは、ロックされている間は、開いているノートブックに表示モードでのみアクセスできます。
以下のタイプのライブラリーを使用できます。
- ノートブック・ランタイム環境に付属のプリインストールされたオープン・ソース・ライブラリー
- ノートブック・ランタイム環境に付属の追加料金なしで提供される IBM ライブラリー
- ユーザー独自のライブラリー
ノートブックの準備ができたら、ノートブック・エディターからノートブックを直接実行するジョブを作成できます。 ジョブ構成では、ノートブックの実行時に異なる値でノートブックに渡される環境変数を使用できます。
RStudio での作業
RStudio は、R スクリプトまたは Shiny アプリを処理するための統合開発環境です。 RStudio IDE は Spark with R 環境ランタイムで開始できませんが、Spark カーネルにプログラムでアクセスすることにより、R スクリプトと Shiny アプリで Spark を使用できます。
R スクリプトと Shiny アプリは、RStudio IDE でのみ作成および使用できます。 R スクリプトまたは R Shiny デプロイメントのジョブは作成できません。
詳細情報
親トピック: データの分析とモデルの作成