SPSS Modelerでは、データを処理するフローを設定し、さまざまなモデリング技法を試すことができます。 モデリング・プロセスを通じて、予測分析に使用できる調整済みモデルを作成します。
建物の流れ
フローは、キャンバス上で接続する一連のノードである。
- フロー
- フローとは、シーケンスで接続されたデータ処理操作のグループのことである。 フローは、各オペレーションにおけるデータの流れを表す。 データは、データ・ソースから一連のオペレーションを経て、最後まで流れる。 通常、フローはモデルや、表やグラフのようなデータ出力のタイプで終わる。
フローは、キャンバスにノードを追加し、それらを接続することによって作成されます。
- キャンバス
- キャンバスは、 SPSS Modelerの主な作業領域であり、フローを構築する場所です。
- ノード
- ノードは、モジュール化された自己完結型の操作の集合体である。 ノードはこれらの操作をグラフィカルに表現する方法で、各ノードには固有のアイコンがある。 これらのノードは、より複雑なデータ処理のために、キャンバス上のフローで互いにリンクさせることができる。
フローにモデリングノードを追加できる。 各モデリング・ノードは、それぞれ異なるモデリング手法である。 フローに複数のモデリング・ノードを追加して、データを使ってさまざまなモデリング技法を試すことができます。 フローの設定が完了したら、フローを実行して、データを処理し、モデリングノードで分析します。
モデリング・プロセス
結果を予測する能力は予測分析の中心的な目標であり、モデリングプロセスを理解することが SPSS Modelerを使用する鍵です。
モデルとは、データの入力フィールドまたは変数のセットに基づいて結果を予測するために使用できるルール、数式、または方程式のセットです。 例えば、金融機関はモデルを使用して、過去の申請者に関する既知の情報に基づき、融資申請者のリスクが低いか高いかを予測することができます。 調整されたモデルは、 SPSS Modelerで作業する目的の1つです。
モデリングは何度も繰り返し行われる。 通常、デフォルト・パラメーターを使用するモデリング・ノードを複数実行することがあります。 その後、モデリング・ノードのパラメータを微調整したり、データ準備フェーズに戻ってモデリング・ノードのデータを調整したりすることができます。
SPSS Modelerは、機械学習、人工知能、統計学から取り入れたさまざまなモデリング手法を提供します。 ノードパレットで利用可能なメソッドを使用して、データから新しい情報を導き出し、予測モデルを開発することができます。 各手法によって、利点や適した問題の種類が異なります。
これらのモデリング・ノードから有望な結果が得られたら、そのモデリング・ノードをモデルとして保存できます。 このモデルは、リアルタイムの予測分析に使用するためにプロモーションされ、展開されることができる。
ノード・パレット
ノードパレットには、 SPSS Modelerで利用可能なすべてのノードがあります。 機能別にグループ分けされている。 ノードパレットにある任意のノードをフローに追加できます。
ノードパレットの詳細については、 ノードパレットを参照してください。
SuperNodes
フローの全部または一部を SuperNodeとして保存することができます。 この SuperNodeは、他のフローでノードと同じように使うことができる。 SuperNodeを使用すると、キャンバスを乱雑にするような長いノードのシーケンスを追加することなく、フローに複雑なレイヤーの処理を追加できます。
SuperNodes,の詳細については、 SuperNodesを参照してください。