Muchos nodos de SPSS Modeler producen objetos de salida como modelos, gráficos y datos tabulares. Muchas de estas salidas contienen valores útiles que los scripts pueden utilizar para guiar las ejecuciones posteriores. Estos valores se agrupan en contenedores de contenido (denominados simplemente contenedores) a los que se puede acceder utilizando etiquetas o identificadores que identifican cada contenedor. La forma en que se accede a estos valores depende del formato o "modelo de contenido" utilizado por el contenedor.
Por ejemplo, muchas salidas de modelos predictivos utilizan una variante de XML denominada PMML para representar información sobre el modelo como, por ejemplo, qué campos utiliza un árbol de decisiones en cada división, o cómo se conectan las neuronas de una red neuronal y con qué puntos fuertes. Los resultados del modelo que utilizan PMML proporcionan un modelo de contenido XML que se puede utilizar para acceder a esa información. Por ejemplo:
stream = modeler.script.stream()
# Assume the flow contains a single C5.0 model builder node
# and that the datasource, predictors, and targets have already been
# set up
modelbuilder = stream.findByType("c50", None)
results = []
modelbuilder.run(results)
modeloutput = results[0]
# Now that we have the C5.0 model output object, access the
# relevant content model
cm = modeloutput.getContentModel("PMML")
# The PMML content model is a generic XML-based content model that
# uses XPath syntax. Use that to find the names of the data fields.
# The call returns a list of strings match the XPath values
dataFieldNames = cm.getStringValues("/PMML/DataDictionary/DataField", "name")
SPSS Modeler da soporte a los siguientes modelos de contenido en scripts:
- El Modelo de contenido de tabla proporciona acceso a los datos tabulares sencillos representados como filas y columnas.
- El Modelo de contenido XML proporciona acceso a contenido almacenado en formato XML.
- El modelo de contenido JSON proporciona acceso a contenido almacenado en formato JSON.
- El Modelo de estadísticas de columna proporciona acceso a estadísticas de resumen sobre un campo específico.
- El Modelo de contenido de estadísticas de columna por pares proporciona acceso a estadísticas de resumen entre dos campos o valores entre dos campos separados.
- Serie temporal
- Discriminante
- SLRM
- Todos los nodos de extensión
- Todos los nodos de modelado de bases de datos