De nombreux noeuds SPSS Modeler génèrent des objets de sortie, tels que des modèles, des graphiques et des données tabulaires. Un grand nombre de ces sorties contiennent des valeurs utiles qui peuvent être utilisées par des scripts pour guider les exécutions suivantes. Ces valeurs sont regroupées dans des conteneurs de contenu (appelés simplement conteneurs) auxquels on peut accéder à l'aide de balises ou d'ID qui identifient chaque conteneur. Le mode d'accès aux valeurs dépends du format ou "modèle de contenu" utilisé par ce conteneur.
Par exemple, de nombreuses sorties de modèles prédictifs utilisent une variante de XML appelée PMML pour représenter des informations sur le modèle, telles que les champs qu'un arbre de décision utilise à chaque division, ou comment les neurones d'un réseau neuronal sont connectés et avec quels points forts. Les sorties de modèle qui utilisent PMML fournissent un modèle de contenu XML qui permet d'accéder à ces informations. Par exemple :
stream = modeler.script.stream()
# Assume the flow contains a single C5.0 model builder node
# and that the datasource, predictors, and targets have already been
# set up
modelbuilder = stream.findByType("c50", None)
results = []
modelbuilder.run(results)
modeloutput = results[0]
# Now that we have the C5.0 model output object, access the
# relevant content model
cm = modeloutput.getContentModel("PMML")
# The PMML content model is a generic XML-based content model that
# uses XPath syntax. Use that to find the names of the data fields.
# The call returns a list of strings match the XPath values
dataFieldNames = cm.getStringValues("/PMML/DataDictionary/DataField", "name")
SPSS Modeler prend en charge les modèles de contenu suivants dans le scriptage :
- Le modèle de contenu de tableau donne accès à des données tabulaires simples représentées sous forme de lignes et de colonnes.
- Le modèle de contenu XML donne accès au contenu stocké au format XML.
- Le modèle de contenu JSON donne accès au contenu stocké au format JSON.
- Le modèle de contenu de statistiques de colonne donne accès à des statistiques récapitulatives d'un champ spécifique.
- Le modèle de contenu de statistiques de colonne par paire donne accès à des statistiques récapitulatives entre deux champs ou les valeurs de deux champs distincts.
- Série temporelle
- Analyse discriminante
- MRAA
- Tous les noeuds d'extension
- Tous les noeuds de modélisation de base de données