Rは、データ管理を可能にし、テスト、モデル、分析、グラフィックスを含む一般的な統計分析と機械学習パッケージです。IBM watsonx.aiStudio に含まれるRStudio は、R スクリプトを扱うための統合開発環境を提供します。
使用情報と制限
- RStudioはIBM watsonx.aiStudio プロジェクトに統合されています。 プロジェクト作成後に起動できる。
- プロジェクトに関連付けられている IBM Cloud Object Storage バケットに保存されているデータ・ファイルにアクセスして使用することができます。
- RStudioIDEを使用してシャイニーアプリを作成することはできますが、Cloud Pak for Data as a Serviceにデプロイすることはできません。
RStudioIDE の起動
プロジェクトでRStudioIDE を起動します:
プロジェクトのアクション・バーの IDE の起動 メニューから RStudio をクリックしてください。
環境を選択します。
「起動」をクリックします。
環境ランタイムが開始されて、開発環境が開きます。
RStudioの起動に問題がある場合は、 RStudioの起動に関する問題のトラブルシューティングを参照してください。
RStudioIDEの起動に関する問題のトラブルシューティング
RStudioを起動する際に、以下の問題が発生する場合があります:
以前のセッションから破損したRStudioの状態
問題:'
RStudioセッションを開始するときに、以前のセッションから破損したRStudio状態が発生し、セッションが開始されないことがあります。
解決策
After launching the RStudio IDE, at the stage when you select the RStudio environment, select ワークスペースをリセットする. RStudioは、クリーンなRStudioワークスペースでデフォルト設定を使用して起動します。
データ・ファイルの処理
RStudio では、以下のようなさまざまなソースからのデータ・ファイルを処理できます。
RStudio サーバー・ファイル構造内の ファイル 。RStudio の右下セクションにある ファイル をクリックして表示できます。 ここで、フォルダーの作成、ローカル・システムからのファイルのアップロード、およびファイルの削除を行えます。
R でこれらのファイルにアクセスするには、ファイルを含むディレクトリーに作業ディレクトリーを設定する必要があります。 これを行うには、ファイルが含まれているディレクトリーにナビゲートし、 詳細 > 作業ディレクトリーとして設定をクリックします。
RStudio インスタンスの
Home
ディレクトリーに保管されているファイルは、インスタンス内でのみ永続的であり、環境間でもプロジェクト内でも共有できないことに注意してください。このビデオを閲覧して、RStudio にデータをロードする方法を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
プロジェクトに関連付けられた IBM Cloud Object Storage バケットに保管される プロジェクト・データ資産 です。 RStudio を起動すると、 IBM Cloud Object Storage バケット・コンテンツが RStudio
Home
ディレクトリーのproject-objectstorage
ディレクトリーにマウントされます。データ・ファイルを
project-objectstorage
ディレクトリーに表示する場合は、それらを資産としてプロジェクトに追加する必要があります。 プロジェクト資産としてのファイルの追加を参照してください。RStudio の使用中に新しいデータ資産がプロジェクトに追加され、それらにアクセスする場合は、
project-objectstorage
フォルダーを更新する必要があります。Cloud Object Storage との間でのデータの読み取りおよび書き込みの方法を参照してください。
データベース・システムに保存されている データ です。
以下のビデオを視聴して、RStudio で外部データ・ソースに接続する方法を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
/home/rstudio
にマウントされる ローカル・ストレージに保管されるファイル 。home
ディレクトリには 2 GB のストレージ制限があり、RStudioセッションのワークスペースを保存するために使用されます。 各プロジェクトでRStudioを使用するかどうかに関係なく、すべてのプロジェクトで 'home
ディレクトリのストレージに 2 GB が割り当てられていることに注意してください。 結果として、R スクリプト・ファイルと小規模データ・ファイルのみをhome
ディレクトリーに保管する必要があります。 これは、大きなデータ・ファイルや生成された大きな出力を対象としたものではありません。 すべての大容量データ・ファイルは、プロジェクト資産としてアップロードする必要があります。プロジェクト資産は、アクセス元のproject-objectstorage
ディレクトリーにマウントされます。
プロジェクト資産としてのファイルの追加
データファイルをproject-objectstorage
ディレクトリに追加した場合は、データ アセットとしてプロジェクトに追加する必要があります。 これらのファイルをデータ資産としてプロジェクトに追加するには、以下のようにします。
- プロジェクトの Assets ページで、Upload asset to project アイコン をクリックし、Files タブを選択します。
- プロジェクトにアセットとして追加するファイルを選択します。
- 「アクション」リストから データ資産として追加 を選択し、変更を適用します。
キャパシティー使用量およびランタイム・スコープ
RStudio環境ランタイムは、常に環境テンプレートとRStudioセッションユーザーにスコープされます。 watsonx.aiStudio ユーザーが一度にアクティブにできるRStudioセッションは 1 つだけです。 別のプロジェクトで RStudio を開始した場合、そのセッションを停止して、現在作業しているプロジェクトのコンテキストで新しい RStudio セッションを開始するかどうかを尋ねられます。
ランタイム使用量は、アクティブな環境ランタイムによって使用されたキャパシティー・ユニット時間 (CUH) 数で計算されます。 プロジェクトでアクティブな RStudio ランタイムによって使用された CUH は、プロジェクト作成者のアカウントに対して課金されます。 RStudio の 1 時間当たりのキャパシティー・ユニット請求を参照してください。
プロジェクトの 環境 ページで、どの RStudio 環境ランタイムがアクティブであるかを確認できます。 このページからランタイムを停止できます。
注意: CUH カウンターは、ランタイムがアクティブである間は増加し続けるため、RStudio を使用していない場合はランタイムを停止してください。 あなたが明示的にランタイムを停止させなかった場合、2時間のアイドル時間が経過すると、ランタイムはあなたのために停止される。 このアイドル時間の間は CUH を使用し続けることになり、それに対して課金されます。 計算負荷の高い長期ジョブは、24 時間が経過すると強制停止されます。
このビデオを視聴して、RStudio IDE の概要を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
動画のトランスクリプト 時刻 トランスクリプト 00:00 このビデオは、プロジェクト内のRStudio統合開発環境のクイックツアーです。 00:07 どのプロジェクトからでも、RStudioIDE を起動できます。 00:12 RStudioは、統計計算とグラフィックスのためのプログラミング言語であるRのための、フリーでオープンソースの統合開発環境です。 00:22 RStudio には、ソースペイン、コンソールペイン、環境ペイン、ファイルペインの 4 つのペインがあります。 00:32 これらのペインは、作業を整理し、R で実行するさまざまなタスクを分離するのに役立ちます。 00:39 ペインをドラッグしてサイズ変更するか、アイコンを使用してペインを最小化および最大化することができます。 00:47 また、グローバル・オプションでペインを再配置することもできます。 00:53 コンソール・ペインは、R へのインターフェースです。 00:56 これは、R にバンドルされている端末ウィンドウまたはユーザー・インターフェースで表示されるものとまったく同じものです。 01:01 コンソール・ペインには、役立つ機能がいくつか追加されています。 01:06 コンソールからコードを実行するには、コマンドを入力します。 01:11 コマンドの入力を開始すると、入力を開始した文字で始まるコマンドのリストが表示されます。 01:17 リスト内のコマンドを強調表示し、Enter キーを押して挿入します。 01:24 上矢印を使用して、前に入力したコマンドをスクロールします。 01:31 さらにコマンドを発行すると、結果をスクロールできます。 01:36 コンソールをクリアするには、メニュー・オプションを使用します。 01:39 また、タブ補完機能を使用して、そのテキストで始まる機能、オブジェクト、およびデータ・セットのリストを表示することもできます。 01:47 矢印を使用してコマンドを強調表示し、そのコマンドのヘルプを表示します。 01:51 準備ができたら、「Enter」を押して挿入します。 01:55 次に、現行コンテキスト内のそのコマンドのオプションのリストが表示されます。 01:59 例えば、 read.csv 関数の最初の引数は、ファイルです。 02:05 RStudioは作業ディレクトリのフォルダとファイルのリストを表示するので、引数でインクルードするファイルを簡単に見つけることができます。 02:16 最後に、ライブラリーなどのパッケージ名を必要とする関数でタブ補完を使用すると、インストールされているすべてのパッケージのリストが表示されます。 02:28 次に、ソース・ペインを見てみましょう。これは、R コードを作成するためのテキスト・エディターです。 02:34 テキスト・エディターは、R コマンド・ファイルとプレーン・テキスト、およびその他のいくつかの言語をサポートし、コンテキストにおける言語固有の強調表示を含みます。 02:47 また、テキスト・エディターでもタブ入力が使用可能であることに気付きます。 02:53 テキスト・エディターから、単一行のコードを実行することも、複数行のコードを選択して実行することもできます。結果はコンソール・ペインに表示されます。 03:08 コードを R スクリプトとして保存して、共有したり、後で再度実行したりすることができます。 03:15 ビュー機能により、スプレッドシート形式でデータ・フレームを表示する新しいタブが開きます。 03:22 または、独自のウィンドウに表示することもできます。 03:25 これで、スライダーとドロップダウン・メニューを使用して、データをスクロールしたり、列をソートしたり、特定の値を検索したり、行をフィルタリングしたりすることができます。 03:41 「環境」ペインには、「環境」タブ、「履歴」タブ、および「接続」タブがあり、この R セッションで何が起こっているかを追跡します。 03:51 「環境」タブには、セッション中に作成されたグローバル環境に存在する R オブジェクトが含まれています。 03:58 そのため、コンソール・ペインで新規オブジェクトを作成すると、そのオブジェクトは環境ペインに自動的に表示されます。 04:04 また、特定のパッケージに関連するオブジェクトを表示したり、特定の関数のソース・コードを表示したりすることもできます。 04:12 また、データ・セットのリストを表示したり、データ・セットを展開して個々のエレメントを検査したり、データ・セットをソース・ペインで表示したりすることもできます。 04:22 環境の内容を .RData ファイルとして保存できるため、後日その .RData ファイルをロードすることができます。 04:29 ここから、ワークスペースからオブジェクトをクリアすることもできます。 04:33 特定の項目を削除する場合は、グリッド・ビューを使用します。 04:38 例えば、R セッションでメモリーを解放するために削除する大きな項目を簡単に見つけることができます。 04:45 「環境」タブでは、データ・セットをインポートすることもできます。 04:50 インポートを完了する前に、データ・セットのプレビューを表示したり、オプションを変更したりすることができます。 04:55 インポートされたデータがソース・ペインに表示されます。 05:00 「履歴」タブには、コマンド行で実行した各コマンドの履歴が表示されます。 05:05 「環境」タブと同様に、履歴を Rhistory ファイルとして保存することができます。これにより、後日履歴ファイルを開くことができます。 05:11 このタブには、履歴と履歴内の個々の項目をすべてクリアするための同じオプションがあります。 05:17 コマンドを選択してコンソールに送信し、コマンドを再実行してください。 05:23 コマンドをソース・ペインにコピーして、スクリプトに組み込むこともできます。 05:31 「接続」タブで、データ・ソースへの新規接続を作成できます。 05:36 このダイアログ・ボックスの選択項目は、インストールしたパッケージによって異なります。 05:41 例えば、「BLUDB」接続を使用すると、 Db2 Warehouse on Cloud サービスに接続できます。 05:49 「ファイル」ペインには、「ファイル」、「プロット」、「パッケージ」、「ヘルプ」、および「ビューアー」の各タブがあります。 05:55 「ファイル」タブには、作業ディレクトリーの内容が表示されます。 05:59 RStudioはこのディレクトリからファイルをロードし、このディレクトリにファイルを保存します。 06:04 ファイルにナビゲートし、そのファイルをクリックしてソース・ペインに表示します。 06:09 ここから、アップロードする個々のファイルを選択するか、アップロードするすべてのファイルを含む .zip ファイルを選択して、新規フォルダーを作成し、ファイルをアップロードすることができます。 06:25 ここから、ファイルおよびフォルダーを削除したり名前変更したりすることもできます。 06:30 R 内のファイルにアクセスするには、データ・フォルダーを作業ディレクトリーとして設定する必要があります。 06:36 setwd コマンドがコンソールで実行されたことが分かります。 06:43 プロジェクト内のデータ資産にアクセスするには、プロジェクト・フォルダーを開きます。 06:50 「プロット」タブには、プロット、hist、ggplot、xyplot などの R のプロット関数の結果が表示されます。 07:00 矢印を使用してさまざまなプロットをナビゲートしたり、ズームを使用してグラフのフルスクリーンを表示したりすることができます。 07:09 ここから個別のプロットまたはすべてのプロットを削除することもできます。 07:13 指定された解像度でプロットをグラフィックまたは印刷ファイルとして保存するには、「エクスポート」オプションを使用します。 07:21 「パッケージ」タブには、システム・ライブラリーに現在インストールされているパッケージが表示されます。 07:26 検索バーを使用すると、特定のパッケージを素早く見つけることができます。 07:30 検査されるパッケージは、現行セッションでライブラリー・コマンドを使用して既にロードされたパッケージです。 07:38 ここから追加のパッケージをチェックしてロードするか、パッケージのチェック・マークを外して現行セッションから切り離すことができます。 07:45 コンソール・ペインに結果が表示されます。 07:48 パッケージ名の横にある「X」を使用して、システム・ライブラリーから削除します。 07:54 インストールする新規パッケージを検索したり、任意のパッケージの最新バージョンに更新したりすることもできます。 08:03 いずれかのパッケージをクリックすると、「ヘルプ」タブが開き、そのパッケージの追加情報が表示されます。 08:09 ここから、関数を検索して、さらにヘルプを得ることができます。 08:13 また、コンソールからヘルプ・コマンドを使用するか、または単に疑問符 (?) の後に機能を入力して、その機能に関するヘルプを表示することができます。 08:21 「ビューアー」タブに HTML 出力が表示されます。 08:25 一部の R 関数は、レポートおよび対話式グラフを表示するための HTML を生成します。 08:31 R Markdownパッケージは、"Viewer "タブで表示できるレポートを作成します。 08:38 Shiny パッケージにより、「ビューアー」タブで表示できる Web アプリケーションが作成されます。 08:44 その他のパッケージは htmlwidgets フレームワーク上に構築され、Java ベースの対話式視覚化が組み込まれています。 08:54 視覚化を「RPubs.com」という名前の無料サイトに公開することもできます。 09:01 以上、RStudioIDE について簡単に説明しました。 09:05 Cloud Pak for Data as a Serviceドキュメントで、RStudioに関するその他のビデオをご覧ください。
親トピック: ノートブックおよびスクリプト