0 / 0
資料の 英語版 に戻る
Data Refinery でのデータの視覚化
最終更新: 2024年10月04日
Data Refinery でのデータの視覚化

グラフィカルな方法で情報を視覚化することで、データに対する洞察が得られます。 データを視覚化して変更を確認しながら、Data Refinery フローにステップを追加できます。 視覚化を使用してさまざまな視点からデータを探索することで、そのデータ内のパターン、接続、および関係を識別したり、大量の情報を迅速に理解したりすることができます。

SPSS Modeler フロー内で、これらの同じグラフを使用してデータを視覚化することもできます。 ノード・パレットの「グラフ」セクションで使用可能なグラフ・ノードを使用します。 グラフ・ノードをダブルクリックして、「プロパティー」ペインを開きます。 次に、「図表ビルダーの起動」をクリックして図表ビルダーを開き、ノードに関連付ける 1 つ以上のグラフ定義を作成します。

グラフの例

データを視覚化するには、以下の手順を実行します。

  1. Data Refinery から、「視覚化」タブをクリックします。
  2. グラフから始めるか、列を選択します。
  • 使用可能なグラフのいずれかをクリックします。 次に、ページの左側に表示される「DETAILS」ペインに列を追加します。
  • 作業対象の列を選択します。 推奨されるグラフには、そのグラフ名の横にドットが表示されます。 グラフをクリックして、データを視覚化します。
重要: 使用可能なグラフ・タイプは、選択した列に基づいて、関連性が最も高いものから最も低いものの順に並べられます。 グラフ・タイプでサポートされているデータ・タイプの列がデータ・セット内にない場合、そのグラフは使用できません。 グラフで列のデータ・タイプがサポートされていない場合、その列をそのグラフで選択することはできません。 グラフの名前の横にあるドットは、データに最適なグラフを示しています。

グラフ

以下のグラフが含まれています。

  • 3D グラフは、各列を直方体として描画して 3D 効果を持たせることによって、3 次元座標系でデータを表示します。

  • 棒グラフは、データのカテゴリーを横に並べて表示し、比較するのに便利です。 棒は任意の順序にできます。 また、高いものから低いものへ、低いものから高いものへと並べ替えることもできます。

  • 箱ひげ図は、多くのグループまたはデータ・セット間の分布を比較します。 データのグループのばらつき (そのデータの散らばり、偏り、および外れ値) を表示します。

  • バブル グラフは、グループ内の各カテゴリをバブルとして表示します。

  • ろうそく足チャートは、株、金融商品、または通貨の価格の変化を表示する財務チャートの一種です。

  • 円充填グラフは、階層型データを、入れ子になった領域のセットとして表示します。

  • カスタマイズされたグラフでは、JSON 入力に基づいてグラフを描画できます。

  • 二重 Y 軸グラフは、2 つの Y 軸変数を使用してデータ間の関係を示します。

  • エラー・バーは、値の誤差または不確実性を示します。 値がどの程度正確であるか、または逆に値が真の値からどの程度外れているかの概略を示します。

  • 評価グラフは、バイナリー分類子の品質を測定する複数のグラフを結合したものです。 入力には、実際の (ターゲット) 値、予測値、および確信度 (0 または 1) の 3 つの列が必要です。 カットオフ・グラフ内のスライダーを移動すると、他のグラフが動的に更新されます。 ROC とその他のグラフは、分類の標準的な尺度です。

  • ヒート・マップ・グラフは、データを色として表示することで、活動レベルや密度を表現します。 通常、小さい値は寒色で表示され、大きい値は暖色で表示されます。

  • ヒストグラム グラフはデータの度数分布を示します。

  • 折れ線グラフは、ある列の要約統計量を別の列の値ごとに計算し、それらの値を結ぶ線を描画することによって、データの傾向を経時的に示します。

  • マップ・グラフは地点データを示し、値を比較したり、複数の地域にわたってカテゴリーを表示したりできるようにします。

  • 数学的曲線グラフは、入力された式に基づく曲線のグループを表示します。 このグラフでは、データ・セットを使用しません。 代わりに、分布図などの別のグラフのデータ・セットと結果を比較するために使用します。

  • マルチグラフは、棒グラフ、折れ線グラフ、円グラフ、分布図グラフから最大で 4 つを組み合わせて表示します。 異なるデータを使用して、同じ種類のグラフを複数表示できます。 例えば、異なる列のデータを含む 2 つの円グラフを表示できます。

  • 複数系列グラフでは、複数のデータ・セットまたは複数の列のデータが、直線またはバーで結ばれた一連の点として表示されます。

  • 並行座標グラフは、データの行 (プロファイル) を表示して比較し、類似点を探します。 それぞれの行が線になり、行の各列の値がその線上の点で表されます。

  • 円グラフは比率を表示します。 系列のそれぞれの値は、比率に応じた扇形として表示されます。 円は、値の総計を表します。

  • 人口ピラミッドは、カテゴリ全体の変数の度数分布を示します。 通常、人口統計データの変化を示すために使用されます。

  • Q-Q (Quantile-Quantile) プロット・グラフは、分布の期待値と観測値を比較するために観測値の分位をプロットします。

  • レーダー・チャートは、軸 (半径) 上に表した 3 つ以上の量的変数を 1 つの放射状の図にまとめたものです。 データは各軸にプロットされ、線で結ばれて隣接する軸に結合されます。 レーダー・チャートは相関関係を示し、分類されたデータを比較するのに役立ちます。

  • 関係グラフは、さまざまな種類の線を使用してデータ列の相互関係とその関係の強さを示します。

  • 分布行列グラフは、相互に列をマップし、それらの分布図と相関を表示します。 複数の列と、それらの相互の相関の強度を比較するために使用します。

  • 散布図は、2 つの列の値を表示して比較することによって相関 (ある変数が別の変数の影響をどの程度受けているか) を示します。

  • サンバースト・チャートは、階層化円グラフと類似していて、さまざまなカテゴリーのさまざまな比率が同時に複数レベルで表示されます。

  • Theme River グラフは、経時的変化を表示する特殊なフロー・グラフを使用します。

  • 時系列グラフは、連続した時間間隔でのデータ点を示します。

  • t-SNE グラフは、高次元のデータ・セットを視覚化するのに役立ちます。 高次元データを 2 次元空間または 3 次元空間に埋め込んで分布図として視覚化するのに便利です。

  • ツリー・チャートは、階層型データを、カテゴリー上さまざまなブランチに分割して表示します。 さまざまなカテゴリーのさまざまなデータ・セットをソートするために使用されます。 ツリー・チャートは、ルート・ノード、メンバー間の関係と接続を表すブランチと呼ばれる線の接続、子ノードを持たないリーフ・ノードで構成されます。

  • ツリー マップ グラフは、階層型データを、入れ子になった領域のセットとして表示します。 グループ間、およびグループに入れ子になった単一要素間のサイズを比較するときに使用します。

  • ワード・クラウド・グラフは、それぞれの単語をその出現頻度に比例したサイズにすることで、テキストの中の単語の頻度を表示します。

アクション

以下の任意のアクションを実行できます。

  • やり直す: 視覚化と「DETAILS」ペインをクリアし、視覚化の開始ページに戻ります。

  • フィールド値またはフィールド・ラベルのどちらを表示するのかを指定します。 このオプションは、ラベルを定義した場合は SPSS Modeler にのみ適用されます。 例えば、「性別」フィールドがあり、値が 0 のラベルを女性として定義し、値が 1 のラベルを男性として定義したとします。 ラベルが定義されていない場合は、値が表示されます。

  • 視覚化のダウンロード:

    • グラフ・イメージのダウンロード: 現在のグラフのイメージを含む PNG ファイルをダウンロードします。

    • グラフ詳細のダウンロード: 現在のグラフの詳細を含む JSON ファイルをダウンロードします。

  • すべてのグラフに適用するグローバル設定の指定

グラフ・アクション

使用可能なグラフ・アクションは、グラフによって異なります。 グラフ・アクションには、次のものがあります。

  • ズーム

  • リストア: グラフを通常のスケールで表示します

  • データの選択: グラフで選択した「データ」タブのデータを強調表示します

  • 選択をクリア: 「データ」タブのデータから強調表示を削除します

詳細情報

データの視覚化 – 適切なグラフ・タイプを選択する方法

親トピック: データの精製

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細