SPSS Modelerのワークフローは、CRISP-DM(Cross-Industry Standard Process for Data Mining)手法に基づいて構築されています。 この方法論は、 SPSS Modelerでの作業を、いくつかのフェーズを持つ大規模プロジェクトに組み込むものです。 SPSS Modelerで作業するフェーズでは、プロジェクトを使用して作業と資産を管理します。
データマイニングのフェーズ
CRISP-DMの方法論には次のような段階がある。
- ビジネスの理解
- このフェーズでは、データマイニングのビジネス目標についてできるだけ多くの洞察を得るようにする。 利害関係者に会い、 SPSS Modelerを使用した作業がビジネス目標や問題にどのように対応するかを判断します。
詳しくは、「 データの理解と準備 」を参照。
- データの理解
- SPSS Modelerでフローを構築する前に、データを収集し、理解する必要があります。 時間をかけて、データの構造、関係、パターンを理解する。
詳しくは、「 データの理解と準備 」を参照。
- データの準備
- SPSS Modelerでモデルをトレーニングする前に、データを準備する必要があります。 時間をかけてデータを処理し、データマイニングで使用するために最適化する。
詳しくは、「 データの理解と準備 」を参照。
- モデリング
- SPSS Modeler フローを構築してデータを探索し、さまざまなモデルを試し、関係を調査して有用な情報を見つけます。
詳しくは、 フローとモデルの構築を参照。
- デプロイメント
予測モデルを構築し、トレーニングした後、 watsonx.ai Runtime サービスがあれば、 watsonx.ai Runtime にプロモーションすることができる。
詳細については、 SPSS Modelerのフローとモデルのプロモートを参照してください。
- 評価
- モデルとその予測の質を評価する。 例えば、 分析ノードをフローに追加して、モデルの予測の正確さを評価することができます。 評価ノードを使用して予測モデルを比較し、最適なものを見つけることもできます。
プロジェクトおよびデータ資産の処理
SPSS Modelerでの作業はすべてプロジェクト内で行われます。 プロジェクトは、すべてのデータ資産とフローを保持する。
- プロジェクトの詳細については、 プロジェクトでの作業を参照してください
- フローで使用するデータをプロジェクトに追加する方法については、 プロジェクトにデータを追加するを参照してください。
SPSS Modelerをデータベースなどのデータソースに接続することで、 SPSS Modelerでのデータアクセスを容易にすることができます。
データ接続の詳細については、 サポートされているデータソースを参照してください
SPSS Modeler Subscription または SPSS Modeler クライアントで作成されたストリーム( .str )をインポートできます。 インポートされたフローに1つ以上のインポートノードまたはエクスポートノードが含まれている場合、フローを開くときにノードを変換するよう求められます。
詳細については、 SPSS Modeler ストリームのインポートを参照してください。
スクリプティング
SPSS Modelerでは、スクリプトを使用してタスクを自動化できます。 R、 Python、 Python for Spark、およびControl Language for Expression Manipulation(CLEM)でスクリプトを書くことができる。 CLEMは、フローを流れるデータストリームを分析・操作するための言語です。
詳細はスクリプトと自動化を参照。