About cookies on this site Our websites require some cookies to function properly (required). In addition, other cookies may be used with your consent to analyze site usage, improve the user experience and for advertising. For more information, please review your cookie preferences options. By visiting our website, you agree to our processing of information as described in IBM’sprivacy statement. To provide a smooth navigation, your cookie preferences will be shared across the IBM web domains listed here.
資料の 英語版 に戻る薬物治療のグラフを見る
薬物治療のグラフを見る
チュートリアルをプレビューする
チュートリアルを試す
モデラーのフローとデータセットのサンプル
図1: サンプルモデラーの流れ 
タスク 1:サンプルプロジェクトを開く
タスク2:データ資産の調査
タスク3:分布図とデータ監査図を調べる
図2: 出力を見る薬剤タイプ 
図3: 出力を見る:7フィールド]のデータ監査 
課題4:散布図の作成と探求
タスク5:ウェブ・チャートの作成と探索
課題6:高度なビジュアライゼーションを探求する
タスク 7: Derive ノードの探索
タスク 8: フィルタノードとタイプノードの探索
タスク9:モデルの生成
タスク10:分析ノードの作成
サマリー
今後のステップ
最終更新: 2025年2月12日
このチュートリアルは、医学研究者がどのように研究のためにコンパイルし、ビジュアル化することができるかの例を提供します。 検死官は、全員が同じ病気を患っている患者のデータを収集した。 治療過程において、それぞれの患者は 5 種類の薬品のうちのいずれかで効果がありました。 そこで、今後同じ疾患を持つ患者にどの薬品が効果的かを、データ・マイニングを使用して特定していきます。
チュートリアルをプレビューするCopy link to section
Copy link to section
このチュートリアルのステップをプレビューするには、このビデオをご覧ください。 動画で表示されているユーザーインターフェースと若干異なる場合があります。 このビデオは、文章によるチュートリアルの補足資料としてご利用いただくことを目的としています。 このビデオでは、このドキュメントのコンセプトとタスクを視覚的に学習する方法を提供しています。
チュートリアルを試すCopy link to section
Copy link to section
このチュートリアルでは、以下のタスクを実行します:
モデラーのフローとデータセットのサンプルCopy link to section
Copy link to section
このチュートリアルでは、サンプル・プロジェクトの「Drug Treatment - Exploratory Graphs」フローを使用します。 使用したデータファイルはdrug1n.csvである。 次の図は、モデラーのフロー例を示しています。

この例で使用されるデータフィールドは以下の通りである:
データ・フィールド | 説明 |
---|---|
|
患者の年齢 (数値) |
|
または
|
|
血圧: 、 、または
|
|
血中コレステロール: または
|
|
血液中のナトリウム濃度 |
|
血液中のカリウム濃度 |
|
患者に効果があった処方薬 |
タスク 1:サンプルプロジェクトを開くCopy link to section
Copy link to section
サンプル・プロジェクトには、いくつかのデータ・セットとモデラー・フローのサンプルが含まれています。 サンプルプロジェクトをまだお持ちでない場合は、 チュートリアルのトピックを参照してサンプルプロジェクトを作成してください。 次に、以下の手順でサンプルプロジェクトを開きます:
- watsonxのナビゲーションメニュー から
を選択し 、[プロジェクト] > [すべてのプロジェクトを表示] を選択します。
- SPSS ModelerProjectをクリックします。
- アセット」タブをクリックすると、データセットとモデラーフローが表示されます。
進捗状況を確認する
次の図は、プロジェクトのAssetsタブを示しています。 これで、このチュートリアルに関連するサンプルモデラーフローで作業する準備ができました。
タスク2:データ資産の調査Copy link to section
Copy link to section
薬物治療 - 探索的グラフにはいくつかのノードがあります。 以下の手順に従って、Data Assetノードを調べます:
- Assetsタブから、Drug Treatment - Exploratory Graphsモデラーフローを開き、キャンバスがロードされるのを待つ。
- drug1n.csvノードをダブルクリックします。 このノードは、プロジェクト内のdrug1n.csvファイルを指すData Assetノードです。
- ファイル形式のプロパティを確認します。
- オプション:データのプレビューをクリックすると、完全なデータセットが表示されます。
進捗状況を確認する
次の図は、Data Assetノードを示しています。 これで、分布図とデータ監査図を調べる準備ができた。

タスク3:分布図とデータ監査図を調べる Copy link to section
Copy link to section
データ・マイニングの際は、多くの場合、視覚的な要約を作成してデータを検討すると便利です。 SPSS Modelerには、要約したいデータの種類に応じて、さまざまな種類のグラフが用意されています。 例えば、各薬剤に反応した患者の割合を調べるには、薬剤タイプ(分布)ノードを探索します。 以下の手順でチャートをいくつか見てみよう:
- Drug type (Distribution)ノードをダブルクリックしてプロパティを表示します。
- 「キャンセル」をクリックします。
- 薬剤タイプ(Distribution)ノードにカーソルを合わせ、実行アイコン「
」をクリックする。
- 出力とモデル」ペインで、薬剤タイプ出力をクリックして結果を表示します。

チャートはデータの形を見るのに役立つ。 薬品
で効果が出た患者が最も多く、薬品 Y
および B
が最も少ないことが分かります。C
あるいは、7 Fields (Data Audit)ノードをアタッチして実行すると、すべてのフィールドの分布とヒストグラムを一度に見ることができます。
- データ資産」ノードの後にある「7 フィールド(データ監査)」出力ノードをダブルクリックします。
- 7 フィールド(データ監査)ノードにカーソルを合わせ、実行アイコン「
」をクリックする。
- 出力とモデル]ペインで、[7 フィールド(データ監査)]出力をクリックして結果を表示します。

進捗状況を確認する
次の図は、このフローを示しています。 これで散布図を作成して調べる準備ができました。

課題4:散布図の作成と探求Copy link to section
Copy link to section
ターゲット変数である'
にどのような要因が影響するかを見ることができる。 研究者としては、ナトリウムおよびカリウムの血中濃度が重要な因子であることが分かっています。 これらの濃度はいずれも数値であるため、薬剤カテゴリーをカラーオーバーレイとして使用したナトリウム対カリウムの散布図を作成することができます。 以下の手順に従って散布図を作成し、探索してください:Drug
- パレットのGraphsセクションから、Plotノードをキャンバス上にドラッグします。
- ノードにカーソルを合わせ、Edit Titleボタンをクリックし、名前を'Na vに変更する。 K.
- Plotノードをdrug1n.csvデータアセットノードに接続します。
- をダブルクリックする Na v. K (Plot)ノードのプロパティを編集する。
- プロット・セクションで、Xフィールドとして'
を、Yフィールドとして'Na
を、オーバーレイ・セクションで、カラー・フィールドとして'K
を選択する。Drug
- 保存 をクリックします。
- にカーソルを合わせる Na v. K(プロット)ノードをクリックし、実行アイコン'
をクリックする。
- 出力とモデル」ペインで、「Na vをクリックする。 K出力で結果を見る。
プロットは明らかに閾値を示している。 閾値より高い値では、薬剤「
」は常に正しい薬剤である。 そして、閾値未満の値では、薬剤「Y
」は決して正しい薬剤ではない。 この閾値は、ナトリウム(Y
)とカリウム(Na
)の比である。K
進捗状況を確認する
次の図は散布図である。 これでウェブ・チャートの作成と探索の準備は整った。

タスク5:ウェブ・チャートの作成と探索 Copy link to section
Copy link to section
データ・フィールドの多くがカテゴリーであるため、異なるカテゴリー間の関連性をマッピングするウェブ・チャートをプロットしてみることもできる。 以下の手順に従って、ウェブチャートを探索してください:
- パレットのグラフセクションから、Webノードをキャンバス上にドラッグし、drug1n.csvデータアセットノードに接続します。
- Webノードをダブルクリックしてプロパティを編集します。
- Fieldsセクションで、Add columnsをクリックする。
(血圧の場合)と「BP
列を選択する。Drug
- 保存 をクリックします。
- Webノードにカーソルを合わせ、実行アイコン「
」をクリックする。
- アウトプットとモデルペインで、「ウェブ出力をクリックして結果を表示する。
プロットから、明らかに薬物「
」は3段階の血圧すべてに関連している。 この結果は当然である。あなたはすでに、薬剤「Y
」が最適な状況を決定しているのだから。Y
しかし、薬品
を無視して他の薬品に注目すると、薬品 Y
と A
も高血圧と関係することが、分かります。 薬品 B
と C
が低血圧と関係しています。 また、通常の血圧は薬品 X
にと関係しています。 とはいえ、特定の患者に対して「X
」と「A
、あるいは「B
」と「C
薬剤をどのように選択すればいいのか、まだわからない。 この場合、モデリングが役に立つ。X
進捗状況を確認する
以下の画像は、ウェブ・プロットを示している。 これで高度なビジュアライゼーションを探求する準備が整いました。

課題6:高度なビジュアライゼーションを探求するCopy link to section
Copy link to section
これまでのセクションでは、さまざまなタイプのグラフ・ノードを使用した。 データを調べるもう 1 つの方法は、高度な視覚化機能を使用することです。 以下の手順に従って、高度なチャートを作成し、探索してください:
- パレットのGraphsセクションから、Chartsノードをキャンバス上にドラッグし、drug1n.csvデータアセットノードに接続します。
- Chartsノードをダブルクリックしてプロパティを表示します。
- Launch Chart Builderボタンをクリックします。
ここでは、さまざまな視点からデータを探索し、データ内のパターン、接続、および関係を識別するための高度なグラフを選択して作成することができます。 モデラーのフローに戻る前に、いくつかのグラフを作成してみる。
進捗状況を確認する
次の図は3Dチャートの例である。 これでDeriveノードを探索する準備が整いました。

タスク 7: Derive ノードの探索Copy link to section
Copy link to section
課題4の散布図で見たように、ナトリウムとカリウムの比率は、薬剤Yを使用するタイミングを予測するようです。 各レコードについて、この比率の値を含むフィールドを導き出すことができる。 このフィールドは、後で 5 つの薬品のそれぞれを使用するタイミングを予測するモデルを構築する際に役立つこともあります。
以下の手順に従って、Derive ノードを探索してください:
- Na_to_K (Derive)ノードをダブルクリックしてプロパティを編集する。
- エクスプレッションのセクションを見てください。 Na/Kは、ナトリウムの値をカリウムの値で割って新しい面積を求めるので、この式になります。また、 電卓アイコンをクリックして
、 式ビルダー を開くことで、式を作成することもできます。これは、組み込みの関数、オペランド、フィールドおよびそれらの値のリストを使用して、対話的に式を作成する方法です。
- キャンセルをクリックしてプロパティに戻り、もう一度キャンセルをクリックしてフローに戻る。
- パレットのGraphsセクションから、Histogramノードをキャンバス上にドラッグし、それをNa_to_K (Derive)ノードに接続する。
- ヒストグラム・ノードをダブルクリックしてプロパティを表示します。
- ヒストグラム・ノードのプロパティで、プロットするフィールドとしてNa_to_K を指定し、カラー・オーバーレイ・フィールドとしてDrug を指定する。
- 保存 をクリックします。
- ヒストグラム・ ノードにカーソルを合わせ、実行アイコン「
」をクリックする。
- 出力とモデル]ペインで、[ヒストグラム]出力をクリックして結果を表示します。
このグラフから、「
値が約15以上の場合、「Na_to_K
薬剤が選択されると結論づけることができる。Y
進捗状況を確認する
次の画像はヒストグラムである。 これでFilterノードとTypeノードを探索する準備が整いました。

タスク 8: フィルタノードとタイプノードの探索Copy link to section
Copy link to section
データを探索し、操作することによって、いくつかの仮説を立てることができる。 血中のカリウムに対するナトリウムの比率が、血圧と同様に薬品の選択に影響するようです。 ただし、これですべての関係性を完全に説明することはできません。 モデリングはいくつかの答えを与えてくれる。 まず、以下の手順に従って、FilterノードとTypeノードを探索します:
- Discard Fields (Filter)ノードをダブルクリックしてプロパティを表示します。
- 派生フィールド'
が使用されるため、元のフィールド'Na_to_K
と'Na
はフィルターアウトされ、モデリングアルゴリズムで二度使用されることはない。K
図4: filter ノードのプロパティー - 「キャンセル」をクリックします。
- Define Types (Type)」ノードをダブルクリックしてプロパティを表示します。
- Typeノードでは、使用するフィールドのタイプと、それらがどのように結果の予測に使用されるかを示すことができる。
Drug
フィールドのロールがTargetに設定されていることに注目してください。 他のフィールドの役割はInputに設定され、予測値として使用される。Drug
図 5. type ノードのプロパティー - 「キャンセル」をクリックします。
進捗状況を確認する
次の図は、このフローを示しています。 これでモデルを生成する準備が整いました。

タスク9:モデルの生成Copy link to section
Copy link to section
以下の手順に従って、C5.0ノードを使用してモデルを生成してください:
- Drug (C5.0)ノードにカーソルを合わせ、実行アイコン'
をクリックします。
- Outputs and models(出力とモデル)ペインで、Drugモデルをクリックして結果を表示します。
ツリーダイアグラムは、C5.0ノードによって生成されるルールのセットをツリー形式で表示します。 さて、パズルの欠けているピースが見えてきただろう。 Na-to-K 比が
未満で高血圧の人は、年齢によって選択される薬品が決定されます。 低血圧の人の場合は、コレステロール・レベルが最適な予測値と考えられます。14.829
ツリー内のノードにカーソルを合わせると、血圧カテゴリーごとのケース数およびケースの信頼度パーセントなどの詳細を確認できます。
進捗状況を確認する
次の図はツリー図である。 これで分析ノードを作成する準備ができました。

タスク10:分析ノードの作成Copy link to section
Copy link to section
分析ノードを使用してモデルの精度を評価するには、以下の手順に従ってください:
- パレットのOutputs(出力)セクションから、Analysis(分析)ノードをキャンバス上にドラッグし、Drug(C5.0)モ デルのナゲットに接続します。
- 分析ノードにカーソルを合わせ、実行アイコン「
」をクリックします。
- アウトプットとモデルペインで、「薬剤]の分析出力をクリックして結果を表示する。
Analysisノードの出力は、この人工データセットで、モデルがデータセット内のすべてのレコードについて薬剤の選択を正しく予測したことを示している。 実際のデータセットで100%の精度を見ることはまずありませんが、分析ノードを使用することで、モデルが特定のアプリケーションで許容できる精度かどうかを判断することができます。
進捗状況を確認する
以下の画像は分析出力を示している。

サマリーCopy link to section
Copy link to section
この例では、薬物治療に関するグラフを作成し、それを使って、将来同じ病気の患者にどの薬が適切かを調べる方法を紹介した。
今後のステップCopy link to section
Copy link to section
これで、他の SPSS® Modeler チュートリアルを試す準備ができました。