Dans SPSS Modeler, vous configurez des flux pour traiter les données et expérimenter différentes techniques de modélisation. Grâce au processus de modélisation, vous créez un modèle accordé que vous pouvez utiliser pour l'analyse prédictive.
Flux de construction
Un flux est une série de nœuds que vous connectez sur le canevas.
- Flux
- Un flux est un groupe d'opérations de traitement de données qui sont reliées en séquences. Les flux représentent le flux de données à travers chaque opération. Les données circulent depuis la source de données jusqu'à la fin, en passant par la séquence d'opérations. En général, un flux se termine par un modèle ou un type de données, tel qu'un tableau ou un graphique.
Les flux sont créés en ajoutant des nœuds sur le canevas et en les connectant.
- Canevas
- Le canevas est la principale zone de travail de SPSS Modeler, et c'est là que vous construisez vos flux.
- Noeuds
- Un nœud est un ensemble modulaire et autonome d'opérations. Les nœuds sont un moyen graphique de représenter ces opérations, et chaque nœud possède une icône unique. Ces nœuds peuvent être reliés entre eux sur le canevas dans un flux pour un traitement plus complexe des données.
Vous pouvez ajouter des nœuds de modélisation à votre flux. Chaque nœud de modélisation correspond à une technique de modélisation différente. Vous pouvez ajouter plusieurs nœuds de modélisation à votre flux pour essayer différentes techniques de modélisation avec vos données. Après avoir configuré votre flux, vous pouvez l'exécuter pour que vos données soient traitées et analysées par les nœuds de modélisation.
Le processus de modélisation
La capacité à prédire un résultat est l'objectif central de l'analyse prédictive, et la compréhension du processus de modélisation est la clé de l'utilisation de SPSS Modeler.
Un modèle est un ensemble de règles, de formules ou d'équations qui peuvent être utilisées pour prédire un résultat sur la base d'un ensemble de champs d'entrée ou de variables provenant de vos données. Par exemple, une institution financière peut utiliser un modèle pour prédire si les emprunteurs représentent un risque important ou peu de risque, en fonction des informations déjà connues sur le passé de ces emprunteurs. Un modèle adapté est l'un des objectifs du travail avec SPSS Modeler.
La modélisation est réalisée en plusieurs itérations. En règle générale, vous pouvez exécuter plusieurs nœuds de modélisation qui utilisent les paramètres par défaut. Vous pouvez alors affiner les paramètres du nœud de modélisation ou revenir à la phase de préparation des données pour ajuster les données du nœud de modélisation.
SPSS Modeler propose diverses méthodes de modélisation issues de l'apprentissage automatique, de l'intelligence artificielle et des statistiques. Vous pouvez utiliser les méthodes disponibles dans la palette de nœuds pour obtenir de nouvelles informations à partir de vos données et pour développer des modèles prédictifs. Chaque méthode possède ses propres avantages et est donc plus adaptée à certains types de problème spécifiques.
Si vous obtenez des résultats prometteurs à partir de l'un de ces nœuds de modélisation, vous pouvez enregistrer le nœud de modélisation en tant que modèle. Ce modèle peut ensuite être promu et déployé pour être utilisé dans l'analyse prédictive en temps réel.
Palette de noeuds
La palette des nœuds contient tous les nœuds disponibles dans SPSS Modeler. Ils sont organisés en groupes selon leur fonction. Vous pouvez ajouter à votre flux n'importe quel nœud de la palette des nœuds.
Pour plus d'informations sur la palette des nœuds, voir Palette des nœuds.
SuperNodes
Vous pouvez enregistrer tout ou partie de votre flux en tant que SuperNode. Ce SuperNode peut ensuite être utilisé comme un nœud dans d'autres flux. Vous pouvez utiliser un SuperNode pour ajouter des couches complexes de traitement à un flux sans ajouter une longue séquence de nœuds susceptibles d'encombrer votre canevas.
Pour plus d'informations sur les SuperNodes, voir SuperNodes.