0 / 0
資料の 英語版 に戻る
薬物治療のグラフを見る
最終更新: 2024年12月11日
薬物治療のグラフを見る
このチュートリアルは、医学研究者がどのように研究のためにコンパイルし、ビジュアル化することができるかの例を提供します。 検死官は、全員が同じ病気を患っている患者のデータを収集した。 治療過程において、それぞれの患者は 5 種類の薬品のうちのいずれかで効果がありました。 そこで、今後同じ疾患を持つ患者にどの薬品が効果的かを、データ・マイニングを使用して特定していきます。

チュートリアルを試す

このチュートリアルでは、以下のタスクを実行します:

モデラーのフローとデータセットのサンプル

このチュートリアルでは、サンプル・プロジェクトの「Drug Treatment - Exploratory Graphs」フローを使用します。 使用したデータファイルはdrug1n.csvである。 次の図は、モデラーのフロー例を示しています。

図1: サンプルモデラーの流れ
サンプルモデラーの流れ

この例で使用されるデータフィールドは以下の通りである:
データ・フィールド 説明
Age 患者の年齢 (数値)
Sex MまたはF
BP 血圧: HIGHNORMAL、または LOW
Cholesterol 血中コレステロール: NORMAL または HIGH
Na 血液中のナトリウム濃度
K 血液中のカリウム濃度
Drug 患者に効果があった処方薬

タスク 1:サンプルプロジェクトを開く

サンプル・プロジェクトには、いくつかのデータ・セットとモデラー・フローのサンプルが含まれています。 サンプル・プロジェクトをまだお持ちでない場合は、チュートリアル・トピックを参照してサンプル・プロジェクトを作成してください。 次に、以下の手順でサンプルプロジェクトを開きます:

  1. Cloud Pak for Dataナビゲーションメニューナビゲーション・メニュー」から、Projects > View all Projetsをc選択します。
  2. SPSS ModelerProjectをクリックします。
  3. アセット」タブをクリックすると、データセットとモデラーフローが表示されます。

チェックポイントのアイコン進捗状況を確認する

次の図は、プロジェクトのAssetsタブを示しています。 これで、このチュートリアルに関連するサンプルモデラーフローで作業する準備ができました。

サンプル・プロジェクト

先頭に戻る

タスク2:データ資産の調査

薬物治療 - 探索的グラフにはいくつかのノードがあります。 以下の手順に従って、Data Assetノードを調べます:

  1. Assetsタブから、Drug Treatment - Exploratory Graphsモデラーフローを開き、キャンバスがロードされるのを待つ。
  2. drug1n.csvノードをダブルクリックします。 このノードは、プロジェクト内のdrug1n.csvファイルを指すData Assetノードです。
  3. ファイル形式のプロパティを確認します。
  4. オプション:完全なデータセットを表示するには、データのプレビューをクリックします。

チェックポイントのアイコン進捗状況を確認する

次の図は、Data Assetノードを示しています。 これで、分布図とデータ監査図を調べる準備ができた。

データ資産

先頭に戻る

タスク3:分布図とデータ監査図を調べる

データ・マイニングの際は、多くの場合、視覚的な要約を作成してデータを検討すると便利です。 SPSS Modelerには、要約したいデータの種類に応じて、さまざまな種類のグラフが用意されています。 例えば、各薬剤に反応した患者の割合を調べるには、薬剤タイプ(分布)ノードを探索します。 以下の手順でチャートをいくつか見てみよう:

  1. Drug type (Distribution)ノードをダブルクリックしてプロパティを表示します。
  2. 「キャンセル」をクリックします。
  3. 薬剤タイプ(Distribution)ノードにカーソルを合わせ、実行アイコン「」をクリックする。
  4. 出力とモデル」ペインで、薬剤タイプ出力をクリックして結果を表示します。
図2: 出力を見る薬剤タイプ
出力を見る薬剤タイプ

チャートはデータのを見るのに役立つ。 薬品 Y で効果が出た患者が最も多く、薬品 B および C が最も少ないことが分かります。

あるいは、7 Fields (Data Audit)ノードをアタッチして実行すると、すべてのフィールドの分布とヒストグラムを一度に見ることができます。

  1. データ資産」ノードの後にある「7 フィールド(データ監査)」出力ノードをダブルクリックします。
  2. 7 フィールド(データ監査)ノードにカーソルを合わせ、実行アイコン「」をクリックする。
  3. 出力とモデル]ペインで、[7 フィールド(データ監査)]出力をクリックして結果を表示します。
図3: 出力を見る:7フィールド]のデータ監査
データ監査表

チェックポイントのアイコン進捗状況を確認する

次の図は、このフローを示しています。 これで散布図を作成して調べる準備ができました。

出力とモデルペインが表示されたモデラーフロー

先頭に戻る

課題4:散布図の作成と探求

ターゲット変数である'Drugにどのような要因が影響するかを見ることができる。 研究者としては、ナトリウムおよびカリウムの血中濃度が重要な因子であることが分かっています。 これらの濃度はいずれも数値であるため、薬剤カテゴリーをカラーオーバーレイとして使用したナトリウム対カリウムの散布図を作成することができます。 以下の手順に従って散布図を作成し、探索してください:

  1. パレットのGraphsセクションから、Plotノードをキャンバス上にドラッグします。
  2. ノードにカーソルを合わせ、Edit Titleボタンをクリックし、名前を'Na vに変更する。 K.
  3. Plotノードをdrug1n.csvデータアセットノードに接続します。
  4. をダブルクリックする Na v. K (Plot)ノードのプロパティを編集する。
  5. プロット・セクションで、Xフィールドとして'Naを、Yフィールドとして'Kを、オーバーレイ・セクションで、カラー・フィールドとして'Drugを選択する。
  6. 保存 をクリックします。
  7. にカーソルを合わせる Na v. K(プロット)ノードをクリックし、実行アイコン'をクリックする。
  8. 出力とモデル」ペインで、「Na vをクリックする。 K出力で結果を見る。

プロットは明らかに閾値を示している。 閾値より高い値では、薬剤「Y」は常に正しい薬剤である。 また、閾値未満の値では、薬剤「Y」は決して正しい薬剤ではない。 この閾値は、ナトリウム(Na)とカリウム(K)の比である。

チェックポイントのアイコン進捗状況を確認する

次の図は散布図である。 これでウェブ・チャートの作成と探索の準備は整った。

薬剤分布の散布図

先頭に戻る

タスク5:ウェブ・チャートの作成と探索

データ・フィールドの多くがカテゴリーであるため、異なるカテゴリー間の関連性をマッピングするウェブ・チャートをプロットしてみることもできる。 以下の手順に従って、ウェブチャートを探索してください:

  1. パレットのグラフセクションから、Webノードをキャンバス上にドラッグし、drug1n.csvデータアセットノードに接続します。
  2. Webノードをダブルクリックしてプロパティを編集します。
  3. Fieldsセクションで、Add columnsをクリックする。 BP(血圧の場合)と「Drug列を選択する。
  4. 保存 をクリックします。
  5. Webノードにカーソルを合わせ、実行アイコン「」をクリックする。
  6. アウトプットとモデルペインで、「ウェブ出力をクリックして結果を表示する。

プロットから、明らかに薬物「Y」は3段階の血圧すべてに関連している。 この結果は当然である。あなたはすでに、薬剤「Y」が最適な状況を決定しているのだから。

しかし、薬品 Y を無視して他の薬品に注目すると、薬品 AB も高血圧と関係することが、分かります。 薬品 CX が低血圧と関係しています。 また、通常の血圧は薬品 Xにと関係しています。 とはいえ、特定の患者に対して「A」と「B、あるいは「C」と「X薬剤をどのように選択すればいいのか、まだわからない。 この場合、モデリングが役に立つ。

チェックポイントのアイコン進捗状況を確認する

以下の画像は、ウェブ・プロットを示している。 これで高度なビジュアライゼーションを探求する準備が整いました。

薬品と血圧の Web グラフ

先頭に戻る

課題6:高度なビジュアライゼーションを探求する

これまでのセクションでは、さまざまなタイプのグラフ・ノードを使用した。 データを調べるもう 1 つの方法は、高度な視覚化機能を使用することです。 以下の手順に従って、高度なチャートを作成し、探索してください:

  1. パレットのGraphsセクションから、Chartsノードをキャンバス上にドラッグし、drug1n.csvデータアセットノードに接続します。
  2. Chartsノードをダブルクリックしてプロパティを表示します。
  3. Launch Chart Builderボタンをクリックします。

    ここでは、さまざまな視点からデータを探索し、データ内のパターン、接続、および関係を識別するための高度なグラフを選択して作成することができます。 モデラーのフローに戻る前に、いくつかのグラフを作成してみる。

チェックポイントのアイコン進捗状況を確認する

次の図は3Dチャートの例である。 これでDeriveノードを探索する準備が整いました。

高度な視覚化

先頭に戻る

タスク 7: Derive ノードの探索

課題4の散布図で見たように、ナトリウムとカリウムの比率は、薬剤Yを使用するタイミングを予測するようです。 各レコードについて、この比率の値を含むフィールドを導き出すことができる。 このフィールドは、後で 5 つの薬品のそれぞれを使用するタイミングを予測するモデルを構築する際に役立つこともあります。

以下の手順に従って、Derive ノードを探索してください:

  1. Na_to_K (Derive)ノードをダブルクリックしてプロパティを編集する。
  2. エクスプレッションのセクションを見てください。 Na/Kは、ナトリウムの値をカリウムの値で割って新しい面積を求めるので、この式になります。

    また、「電卓アイコンアイコンの「実行アイコンクリックして「エクスプレッション・ビルダー開き、式を作成することもできます。これは、関数、オペランド、フィールドとその値の組み込みリストを使用して、式を対話的に作成する方法です。
  3. キャンセルをクリックしてプロパティに戻り、キャンセルをもう一度クリックしてフローに戻る。
  4. パレットのGraphsセクションから、Histogramノードをキャンバス上にドラッグし、それをNa_to_K (Derive)ノードに接続する。
  5. ヒストグラム・ノードをダブルクリックしてプロパティを表示します。
  6. ヒストグラム・ノードのプロパティで、プロットするフィールドとしてNa_to_K を指定し、カラー・オーバーレイ・フィールドとしてDrug を指定する。
  7. 保存 をクリックします。
  8. ヒストグラム・ ノードにカーソルを合わせ、実行アイコン「」をクリックする。
  9. 出力とモデル]ペインで、[ヒストグラム]出力をクリックして結果を表示します。

このグラフから、「Na_to_K値が約15以上の場合、「Y薬剤が選択されると結論づけることができる。

チェックポイントのアイコン進捗状況を確認する

次の画像はヒストグラムである。 これでFilterノードとTypeノードを探索する準備が整いました。

ヒストグラム・ノード

先頭に戻る

タスク 8: フィルタノードとタイプノードの探索

データを探索し、操作することによって、いくつかの仮説を立てることができる。 血中のカリウムに対するナトリウムの比率が、血圧と同様に薬品の選択に影響するようです。 ただし、これですべての関係性を完全に説明することはできません。 モデリングはいくつかの答えを与えてくれる。 まず、以下の手順に従って、FilterノードとTypeノードを探索します:

  1. Discard Fields (Filter)ノードをダブルクリックしてプロパティを表示します。
  2. 派生フィールド'Na_to_Kが使用されるため、元のフィールド'Naと'Kはフィルターアウトされ、モデリングアルゴリズムで二度使用されることはない。

    図4: filter ノードのプロパティー
    filter ノードのプロパティー
  3. 「キャンセル」をクリックします。
  4. Define Types (Type)」ノードをダブルクリックしてプロパティを表示します。
  5. Typeノードでは、使用するフィールドのタイプと、それらがどのように結果の予測に使用されるかを示すことができる。 DrugフィールドのroleがTargetに設定されていることに注目し、'Drugが予測したいフィールドであることを示す。 他のフィールドの役割はInputに設定され、予測値として使用される。

    図 5. type ノードのプロパティー
    type ノードのプロパティー
  6. 「キャンセル」をクリックします。

チェックポイントのアイコン進捗状況を確認する

次の図は、このフローを示しています。 これでモデルを生成する準備が整いました。

出力とモデルペインが表示されたモデラーフロー

先頭に戻る

タスク9:モデルの生成

以下の手順に従って、C5.0ノードを使用してモデルを生成してください:

  1. Drug (C5.0)ノードにカーソルを合わせ、実行アイコン'をクリックします。
  2. Outputs and models(出力とモデル)ペインで、Drugモデルをクリックして結果を表示します。

    ツリーダイアグラムは、C5.0ノードによって生成されるルールのセットをツリー形式で表示します。 さて、パズルの欠けているピースが見えてきただろう。 Na-to-K 比が 14.829 未満で高血圧の人は、年齢によって選択される薬品が決定されます。 低血圧の人の場合は、コレステロール・レベルが最適な予測値と考えられます。

    ツリー内のノードにカーソルを合わせると、血圧カテゴリーごとのケース数およびケースの信頼度パーセントなどの詳細を確認できます。

チェックポイントのアイコン進捗状況を確認する

次の図はツリー図である。 これで分析ノードを作成する準備ができました。

ツリー図の出力

先頭に戻る

タスク10:分析ノードの作成

分析ノードを使用してモデルの精度を評価するには、以下の手順に従ってください:

  1. パレットのOutputs(出力)セクションから、Analysis(分析)ノードをキャンバス上にドラッグし、Drug(C5.0)モ デルのナゲットに接続します。
  2. 分析ノードにカーソルを合わせ、実行アイコン「」をクリックします。
  3. アウトプットとモデルペインで、「薬剤]の分析出力をクリックして結果を表示する。

    Analysisノードの出力は、この人工データセットで、モデルがデータセット内のすべてのレコードについて薬剤の選択を正しく予測したことを示している。 実際のデータセットで100%の精度を見ることはまずありませんが、分析ノードを使用することで、モデルが特定のアプリケーションで許容できる精度かどうかを判断することができます。

チェックポイントのアイコン進捗状況を確認する

次の画像は分析出力を示している。

分析の出力

先頭に戻る

サマリー

この例では、薬物治療に関するグラフを作成し、それを使って、将来同じ病気の患者にどの薬が適切かを調べる方法を紹介した。

次のステップ

これで、他のSPSS® Modelerチュートリアルを試す準備ができました。

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細