Le flux de travail dans SPSS Modeler est construit autour de la méthodologie Cross-Industry Standard Process for Data Mining (CRISP-DM). Cette méthodologie intègre votre travail dans SPSS Modeler dans un projet plus vaste comportant plusieurs phases. Les phases au cours desquelles vous travaillez dans SPSS Modeler utilisent des projets pour gérer votre travail et vos actifs.
Phases de l'exploration de données
La méthodologie CRISP-DM comporte les phases suivantes.
- Compréhension de l'entreprise
- Au cours de cette phase, essayez d'obtenir autant d'informations que possible sur les objectifs de l'entreprise en matière d'exploration de données. Rencontrez les parties prenantes et déterminez comment votre travail avec SPSS Modeler répond aux objectifs ou aux problèmes de l'entreprise.
Pour plus d'informations, voir Comprendre et préparer les données.
- Compréhension des données
- Vous devez collecter et comprendre vos données avant de construire des flux dans SPSS Modeler. Prenez le temps de comprendre la structure des données, les relations et les modèles de vos données.
Pour plus d'informations, voir Comprendre et préparer les données.
- Préparation des données
- Vous devez préparer vos données avant de former des modèles dans SPSS Modeler. Prenez le temps de traiter vos données afin qu'elles soient optimisées pour l'exploration de données.
Pour plus d'informations, voir Comprendre et préparer les données.
- Modélisation
- Créez des flux SPSS Modeler pour explorer vos données, essayer différents modèles et étudier les relations pour trouver des informations utiles.
Pour plus d'informations, voir Construire des flux et des modèles.
- Déploiement
Après avoir élaboré et formé un modèle prédictif, vous pouvez le promouvoir sur watsonx.ai Runtime si vous disposez du service watsonx.ai Runtime.
Pour plus d'informations, voir Promouvoir les flux et les modèles SPSS Modeler.
- Évaluation
- Évaluez la qualité de vos modèles et de leurs prévisions. Par exemple, vous pouvez ajouter des nœuds d' analyse à vos flux pour évaluer la précision des prédictions de votre modèle. Vous pouvez également utiliser un nœud d' évaluation pour comparer les modèles prédictifs et trouver le meilleur.
Gestion des projets et des actifs de données
Tout votre travail avec SPSS Modeler est effectué dans le cadre d'un projet. Un projet contient tous vos actifs et flux de données.
- Pour plus d'informations sur les projets, voir Travailler dans des projets
- Pour plus d'informations sur l'ajout de données à votre projet en vue de leur utilisation dans un flux, voir Ajouter des données à un projet.
Vous pouvez connecter SPSS Modeler à une source de données telle qu'une base de données pour faciliter l'accès à vos données dans SPSS Modeler.
Pour plus d'informations sur la connexion des données, voir Sources de données prises en charge
Vous pouvez importer un flux ( .str ) créé dans SPSS Modeler Subscription ou SPSS Modeler client. Si le flux importé contient un ou plusieurs nœuds d'importation ou d'exportation, vous êtes invité à convertir les nœuds lorsque vous ouvrez le flux.
Pour plus d'informations, voir Importer un flux SPSS Modeler.
Scriptage
Vous pouvez utiliser des scripts dans SPSS Modeler pour automatiser des tâches. Vous pouvez écrire des scripts en R, Python ou Python for Spark, ainsi qu'en langage de contrôle pour la manipulation d'expressions (CLEM). CLEM est un langage qui permet d'analyser et de manipuler les flux de données à travers vos flux.
Pour plus d'informations, voir Script et automatisation.