グラフィカルな方法で情報を視覚化することで、データに対する洞察が得られます。 データを視覚化して変更を確認しながら、Data Refinery フローにステップを追加できます。 視覚化を使用してさまざまな視点からデータを探索することで、そのデータ内のパターン、接続、および関係を識別したり、大量の情報を迅速に理解したりすることができます。
SPSS Modeler フロー内で、これらの同じグラフを使用してデータを視覚化することもできます。 ノード・パレットの「グラフ」セクションで使用可能なグラフ・ノードを使用します。 グラフ・ノードをダブルクリックして、「プロパティー」ペインを開きます。 次に、「図表ビルダーの起動」をクリックして図表ビルダーを開き、ノードに関連付ける 1 つ以上のグラフ定義を作成します。
データを視覚化するには、以下の手順を実行します。
- Data Refinery から、「視覚化」タブをクリックします。
- グラフから始めるか、列を選択します。
- 使用可能なグラフのいずれかをクリックします。 次に、ページの左側に表示される「DETAILS」ペインに列を追加します。
- 作業対象の列を選択します。 推奨されるグラフには、そのグラフ名の横にドットが表示されます。 グラフをクリックして、データを視覚化します。
グラフ
以下のグラフが含まれています。
3D グラフは、各列を直方体として描画して 3D 効果を持たせることによって、3 次元座標系でデータを表示します。
棒グラフは、データのカテゴリーを横に並べて表示し、比較する場合に便利です。 バーは任意の順序にすることが可能です。 また、高いものから低いものへ、低いものから高いものへと並べ替えることもできます。
箱ひげ図は、多くのグループまたはデータ・セット間の分布を比較します。 データのグループのばらつき (そのデータの散らばり、偏り、および外れ値) を表示します。
バブル・チャートは、グループ内の各カテゴリーをバブルとして表示します。
ろうそく足チャートは、株、金融商品、または通貨の価格の変化を表示する財務チャートの一種です。
円充填グラフは、階層型データを、入れ子になった領域のセットとして表示します。
カスタマイズされたグラフでは、JSON 入力に基づいてグラフを描画できます。
二重 Y 軸グラフは、2 つの Y 軸変数を使用してデータ間の関係を示します。
エラー・バーは、値の誤差または不確実性を示します。 値がどの程度正確であるか、または逆に値が真の値からどの程度外れているかの概略を示します。
評価グラフは、バイナリー分類子の品質を測定する複数のグラフを結合したものです。 実際の (ターゲット) 値、予測値、確信度 (0 または 1) の入力用の 3 つの列が必要です。 カットオフ・グラフ内のスライダーを動かすと、他のグラフが動的に更新されます。 ROC とその他のグラフは分類子の標準の測定です。
ヒート・マップ・グラフは、データを色として表示することで、活動レベルや密度を表現します。 通常、小さい値は寒色で表示され、大きい値は暖色で表示されます。
ヒストグラム・グラフは、データの度数分布を示します。
折れ線グラフは、ある列の要約統計量を別の列の値ごとに計算し、それらの値を結ぶ線を描画することによって、データの傾向を経時的に示します。
マップ・グラフは地点データを示し、値を比較したり、複数の地域にわたってカテゴリーを表示したりできるようにします。
数学的曲線グラフは、入力された式に基づく曲線のグループを表示します。 このグラフではデータ・セットを使用しません。 代わりに、このグラフを使用して別のグラフ (分布図グラフなど) のデータ・セットと結果を比較します。
マルチグラフは、棒グラフ、折れ線グラフ、円グラフ、分布図グラフから最大で 4 つを組み合わせて表示します。 異なるデータを使用して、同じ種類のグラフを複数表示できます。 例えば、異なる列のデータを含む 2 つの円グラフを表示できます。
複数系列グラフでは、複数のデータ・セットまたは複数の列のデータが、直線またはバーで結ばれた一連の点として表示されます。
並行座標グラフは、データの行 (プロファイル) を表示して比較し、類似点を探します。 それぞれの行が線になり、行の各列の値がその線上の点で表されます。
円グラフは比率を表示します。 系列のそれぞれの値は、比率に応じた扇形として表示されます。 円は値の総合計を表します。
人口ピラミッド・グラフは、カテゴリー全体の変数の度数分布を示します。 通常、人口統計データの変化を示すために使用されます。
Q-Q (Quantile-Quantile) プロット・グラフは、分布の期待値と観測値を比較するために観測値の分位をプロットします。
レーダー・チャートは、軸 (半径) 上に表した 3 つ以上の量的変数を 1 つの放射状の図にまとめたものです。 各軸にデータがプロットされ、線を接続して隣接する軸に結合されます。 レーダー・チャートは相関関係を示し、分類されたデータを比較するのに役立ちます。
関係グラフは、さまざまな種類の線を使用してデータ列の相互関係とその関係の強さを示します。
分布図行列グラフは、列を相互にマップし、列の分布図および相関を表示します。 複数の列、および列間の相関の強さを比較する場合に使用します。
分布図は、2 つの列の値を表示して比較することによって、相関 (ある変数が別の変数の影響をどの程度受けているか) を示します。
日輪形グラフは、各種カテゴリーの各種比率が同時に複数レベルで表示される階層化円グラフに似ています。
Theme River グラフは、経時的変化を表示する特殊なフロー・グラフを使用します。
時系列グラフは、連続した時間間隔でのデータ点を示します。
t-SNE グラフは、高次元のデータ・セットを視覚化するのに役立ちます。 高次元データを 2 次元空間または 3 次元空間に埋め込んで分布図として視覚化するのに便利です。
ツリー・グラフでは、異なるブランチに分類して分割された階層データが表示されます。 異なるカテゴリーで各種データ・セットをソートする場合に使用します。 ツリー・チャートは、ルート・ノード、メンバー間の関係と接続を表すブランチと呼ばれる線の接続、子ノードを持たないリーフ・ノードで構成されます。
ツリー・マップ・グラフは、階層型データを、入れ子になった領域のセットとして表示します。 グループ間、およびグループに入れ子になった単一要素間のサイズを比較するときに使用します。
ワード・クラウド・グラフは、それぞれの単語を度数に比例したサイズにすることで、テキストの中の単語の頻度を表示します。
アクション
以下の任意のアクションを実行できます。
やり直す: 視覚化と「DETAILS」ペインをクリアし、視覚化の開始ページに戻ります。
フィールド値またはフィールド・ラベルのどちらを表示するのかを指定します。 このオプションは、ラベルを定義した場合は SPSS Modeler にのみ適用されます。 例えば、「性別」フィールドがあり、値が 0 のラベルを女性として定義し、値が 1 のラベルを男性として定義したとします。 ラベルが定義されていない場合は、値が表示されます。
視覚化のダウンロード:
グラフ・イメージのダウンロード: 現在のグラフのイメージを含む PNG ファイルをダウンロードします。
グラフ詳細のダウンロード: 現在のグラフの詳細を含む JSON ファイルをダウンロードします。
すべてのグラフに適用するグローバル設定の指定
グラフ・アクション
使用可能なグラフ・アクションは、グラフによって異なります。 グラフ・アクションには、次のものがあります。
ズーム
リストア: グラフを通常のスケールで表示します
データの選択: グラフで選択した「データ」タブのデータを強調表示します
選択をクリア: 「データ」タブのデータから強調表示を削除します
もっと見る
親トピック: データの精製