Phases du projet pour l'exploration des données dans SPSS Modeler
Le flux de travail dans SPSS Modeler est construit autour de la méthodologie Cross-Industry Standard Process for Data Mining (CRISP-DM). Cette méthodologie intègre votre travail dans SPSS Modeler dans un projet plus vaste comportant plusieurs phases. Les phases au cours desquelles vous travaillez dans SPSS Modeler utilisent des projets pour gérer votre travail et vos actifs.
Figure 1 : Phases des projets SPSS Modeler
Phases de l'exploration de données
Copy link to section
La méthodologie CRISP-DM comporte les phases suivantes.
Compréhension de l'entreprise
Au cours de cette phase, essayez d'obtenir autant d'informations que possible sur les objectifs de l'entreprise en matière d'exploration de données. Rencontrez les parties prenantes et déterminez comment votre travail avec SPSS Modeler répond aux objectifs ou aux problèmes de l'entreprise.
Vous devez collecter et comprendre vos données avant de construire des flux dans SPSS Modeler. Prenez le temps de comprendre la structure des données, les relations et les modèles de vos données.
Vous devez préparer vos données avant de former des modèles dans SPSS Modeler. Prenez le temps de traiter vos données afin qu'elles soient optimisées pour l'exploration de données.
Évaluez la qualité de vos modèles et de leurs prévisions. Par exemple, vous pouvez ajouter des nœuds d' analyse à vos flux pour évaluer la précision des prédictions de votre modèle. Vous pouvez également utiliser un nœud d' évaluation pour comparer les modèles prédictifs et trouver le meilleur.
Gestion des projets et des actifs de données
Copy link to section
Tout votre travail avec SPSS Modeler est effectué dans le cadre d'un projet. Un projet contient tous vos actifs et flux de données.
Vous pouvez importer un flux ( .str ) créé dans SPSS Modeler Subscription ou SPSS Modeler client. Si le flux importé contient un ou plusieurs nœuds d'importation ou d'exportation, vous êtes invité à convertir les nœuds lorsque vous ouvrez le flux.
Vous pouvez utiliser des scripts dans SPSS Modeler pour automatiser des tâches. Vous pouvez écrire des scripts en R, Python ou Python for Spark, ainsi qu'en langage de contrôle pour la manipulation d'expressions (CLEM). CLEM est un langage qui permet d'analyser et de manipuler les flux de données à travers vos flux.