Puede especificar propiedades para aplicarlas al flujo actual.
Para establecer propiedades de flujo, pulse el icono Propiedades de flujo .
Puede configurar las propiedades siguientes.
Opciones
- Tema general
- Número máximo de filas para mostrar en la presentación preliminar de los datos
- Cuando obtenga una vista previa de los datos de un nodo, puede especificar el número de filas que se van a mostrar.
- Limitar miembros para campos nominales
- El tipo de datos de los campos nominales (conjunto) pasa a ser Sin tipo cuando el número de miembros supera el número máximo de miembros que ha establecido en Número máximo de miembros. Esta opción es útil cuando se trabaja con campos nominales grandes. Cuando el nivel de medición de un campo se establece en Sin tipo, su rol se establece automáticamente en Ninguno. Los campos establecidos en Ninguno no están disponibles para el modelado.
- Fecha/hora
- Importar fecha/hora/indicación de fecha y hora como
- Seleccione si desea utilizar un formato de fecha y hora para almacenar datos en campos de fecha y hora o si desea importarlos como variables de cadena.
- Utilizar microsegundos en campos de indicación de fecha y hora
- Si tiene datos de indicación de fecha y hora que se miden en microsegundos, puede habilitar esta opción para utilizar los datos más precisos en los flujos. Para habilitar la opción, seleccione este recuadro de selección y Serie para el valor Importar fecha/hora/indicación de fecha y hora como .Nota: Esta opción sólo funciona para conectores que admitan pushback SQL.
- Formato de fecha
- Seleccione el formato de fecha que desea utilizar para los campos de almacenamiento de fechas o cuando las funciones de fecha de CLEM interpreten cadenas de caracteres como fechas.
- Formato de hora
- Seleccione el formato de hora que desea utilizar para los campos de almacenamiento de horas o cuando las funciones de hora de CLEM interpreten cadenas de caracteres como horas.
- Admitir fecha/mín. negativos
- Para los formatos de hora, seleccione si las diferencias de hora negativas se interpretan en relación con el día o la hora anterior.
- Línea base de fecha (1 de enero)
- Seleccione los años de la línea base (siempre el 1 de enero) que deben utilizar las funciones de fecha de CLEM que funcionan con una sola fecha.
- Fechas de 2 dígitos comienzan a partir de
- Especifique el año de corte para añadir dígitos de siglo para los años que se expresan solo con 2 dígitos. Por ejemplo, si se especifica 1930 como el año de corte presupone que 05/11/02 está en el 2002. El mismo valor utilizará el siglo 20 para las fechas posteriores al 30; por lo tanto, 05/11/73 se presupone que está en el 1973.
- Huso horario
- Seleccione cómo se elige el huso horario para ser utilizado con la expresión
datetime_now
de CLEM.- Si selecciona Servidor, el huso horario se utiliza desde donde se ejecuta el tiempo de ejecución de SPSS Modeler (a veces esta hora es la misma que la opción Cliente ). O si el flujo utiliza datos de una base de datos y la base de datos soportada utiliza la retrotracción de SQL, la expresión
datetime_now
utiliza la hora de la base de datos. - Si selecciona Cliente, se utiliza el huso horario de la máquina en la que se ha instalado SPSS Modeler.
- De forma alternativa, puede seleccionar cualquier valor de la Hora Universal Coordinada para el huso horario.
- Si selecciona Servidor, el huso horario se utiliza desde donde se ejecuta el tiempo de ejecución de SPSS Modeler (a veces esta hora es la misma que la opción Cliente ). O si el flujo utiliza datos de una base de datos y la base de datos soportada utiliza la retrotracción de SQL, la expresión
- Formatos numéricos
- Puede especificar el número de posiciones decimales que se utilizarán cuando SPSS Modeler muestre números reales en formatos estándar, científicos o de visualización de moneda.
- Optimización
- Puede utilizar estos valores para optimizar el rendimiento de flujo.
- Habilitar reescritura de flujo
- La reescritura de flujo reordena los nodos de un flujo en segundo plano para que la operación sea más eficiente, sin alterar la semántica del flujo.
- Optimizar expresiones CLEM
- Esta opción permite al optimizador buscar expresiones CLEM que se pueden preprocesar antes de que se ejecute el flujo para aumentar la velocidad de proceso. Por ejemplo, si tiene una expresión como
log(salary)
, el optimizador calcula el valor de salario real y lo pasa para su proceso. Esta opción se puede utilizar para mejorar la retrotracción de SQL y el rendimiento de SPSS Modeler . - Optimizar ejecución de sintaxis
- Este método de reescritura de flujo aumenta la eficiencia de las operaciones que tienen más de un nodo que contiene la sintaxis de SPSS Statistics . La optimización se logra combinando los comandos de sintaxis en una única operación, en lugar de ejecutar cada operación como separada.
- Optimizar otra ejecución
- Este método de reescritura de flujos incrementa la eficacia de las operaciones que no se pueden delegar a la base de datos. La optimización se consigue reduciendo la cantidad de datos del flujo lo antes posible. El flujo se reescribe para enviar operaciones más cerca del origen de datos mientras se mantiene la integridad de los datos. Este cambio reduce los datos en sentido descendente para operaciones costosas, como por ejemplo uniones.
- Activar procesamiento paralelo
- Cuando se ejecuta en un sistema con varios procesadores, esta opción permite al sistema equilibrar la carga entre esos procesadores, lo que puede dar como resultado un rendimiento más rápido. El uso de varios nodos o el uso de los siguientes nodos individuales puede beneficiarse del proceso paralelo: C5.0, Fusionar (por clave), Ordenar, Bin (métodos de clasificación y mosaico) y Agregar (utilizando uno o más campos clave).
- Generar SQL
- Esta opción envía de nuevo el proceso SQL a la base de datos. La activación o desactivación de esta opción sólo afecta a los nuevos flujos que cree. No puede conmutar el valor de un flujo existente. Para obtener más información sobre cómo utilizar esta opción con flujos, consulte Optimización de SQL.
- Almacenamiento en memoria caché de base de datos (sólo SQL). Para que se ejecuten los flujos que generan SQL en la base de datos, se pueden almacenar los datos en la memoria caché a mitad del flujo en una tabla temporal de la base de datos, en lugar del sistema de archivos. Cuando se combina con la optimización de SQL, esta opción puede dar como resultado ganancias significativas en el rendimiento. Por ejemplo, el resultado de un flujo que fusiona varias tablas para crear una vista de minería de datos se puede guardar en caché y reutilizar cuando sea necesario. Con el almacenamiento en memoria caché de base de datos habilitado, pase el cursor por encima de cualquier nodo no terminal del flujo y, a continuación, pulse el menú de desbordamiento y seleccione . Los datos se almacenan ahora en la memoria caché en este nodo, y la memoria caché se crea automáticamente directamente en la base de datos la próxima vez que se ejecute el flujo. Esto permite generar SQL para nodos posteriores en la ruta, mejorando aún más el rendimiento. Si lo prefiere, esta opción se puede desactivar si es necesario, por ejemplo, cuando las directivas o los permisos excluyen los datos que se escriben en la base de datos. Si el almacenamiento en memoria caché de base de datos o la optimización de SQL no está habilitada, la memoria caché se graba en el sistema de archivos.
- Utilizar conversión relajada (sólo SQL). Esta opción permite la conversión de datos de cadenas a números y viceversa si están almacenados en un formato adecuado. Por ejemplo, si los datos se almacenan como cadena en una base de datos, pero contienen un número significativo, los datos se pueden convertir para utilizarlos cuando se realice la retrotracción.
- Esta opción envía de nuevo el proceso SQL a la base de datos. La activación o desactivación de esta opción sólo afecta a los nuevos flujos que cree. No puede conmutar el valor de un flujo existente. Para obtener más información sobre cómo utilizar esta opción con flujos, consulte Optimización de SQL.
- Registro
- Mostrar SQL en el registro de mensajes durante la ejecución
- Especifica si el SQL generado durante la ejecución del flujo se debe pasar al registro de mensajes.
- Visualizar generación de SQL en el registro de mensajes durante la preparación
- Durante la vista previa del flujo, especifica si se pasa al registro de mensajes una vista previa del SQL que se generará.
- Formato SQL
- Especifica si cualquier SQL que se muestre en el registro debe contener funciones SQL nativas o funciones ODBC estándar con el formato
{fn FUNC(…)}
, tal como las genera SPSS Modeler. La primera confía en la funcionalidad del controlador ODBC que puede no implementarse. - Volver a dar formato a SQL para mejorar la legibilidad
- Especifica si se debe dar formato a SQL que se muestre en el registro para mejorar la legibilidad.
- Mostrar estado de registros
- Especifica si los registros se deben generar cuando lleguen a los nodos terminales. Especifique un número para utilizar para actualizar el estado cada N registros.
Parámetros
Los parámetros son variables definidas por el usuario que se guardan y persisten con el flujo actual o SuperNode. Los parámetros se utilizan a menudo en los scripts para controlar el comportamiento del script, y también se puede acceder a ellos desde la interfaz de usuario.Puede definir parámetros para utilizarlos en expresiones de CLEM y en scripts. Los parámetros definidos en las propiedades de flujo están disponibles para todos los nodos del flujo. Los parámetros establecidos para un SuperNode no están disponibles fuera del SuperNode. Si guarda un flujo, también se guardarán los parámetros establecidos para ese flujo.
Para obtener más información sobre los parámetros, consulte Parámetros de flujo y SuperNode.
Pulse Añadir valor y especifique la información siguiente para el nuevo parámetro:
- Nombre
- Este es el nombre con el que se hace referencia al parámetro en las expresiones. Por ejemplo, para crear un parámetro para una temperatura mínima, puede especificar minvalue.
Cuando se utilizan parámetros en expresiones CLEM, se colocan entre comillas simples, por ejemplo,
'$P-minvalue'
. No especifique el prefijo$P-
. Indica un parámetro en expresiones CLEM. - Etiqueta
- Lista el nombre descriptivo de cada parámetro que se ha creado.
- Almacenamiento
- Indica cómo se almacenan los valores de datos en el parámetro. Por ejemplo, si los valores tienen ceros iniciales que desea conservar (como
008
), seleccione Serie como tipo de almacenamiento. De lo contrario, los ceros se eliminan del valor. - Valor
- Lista el valor actual para cada parámetro, que puede cambiar según sea necesario. Los valores de los parámetros de fecha deben especificarse en la notación estándar ISO (AAAA-MM-DD).
- Medida
- Seleccione el nivel de medición que se utiliza para describir las características del parámetro. Puede cambiar este valor para reflejar la forma en que desea utilizar el parámetro. Por ejemplo, Sin tipo indica que el parámetro puede tener cualquier valor compatible con su almacenamiento.
- ¿Solicitar?
- Seleccione esta opción si desea que se solicite a los usuarios que especifiquen un valor para este parámetro cuando inicien el tiempo de ejecución. Puede utilizar esta opción donde es posible que tenga que especificar valores diferentes para el mismo parámetro en diferentes ocasiones.
Valores globales
En la pestaña Globales de las propiedades de flujo, puede ver los valores globales establecidos para el flujo actual. Los valores globales se crean utilizando un nodo Val. globales para determinar estadísticas como, por ejemplo, la media, la suma o la desviación estándar para los campos seleccionados.
Después de que se ejecute un nodo Val. globales , estos valores pasan a estar disponibles para diversos usos en las operaciones de flujo.
No puede editar valores globales en la tabla aquí en las propiedades de flujo, pero puede borrar todos los valores globales de un flujo.
Anotaciones
Si necesita describir un flujo a otros en su organización, puede adjuntar comentarios explicativos a flujos, nodos y nuggets de modelo. Otros pueden ver estos comentarios en pantalla o incluso imprimir una imagen del flujo que incluye sus comentarios.
Utilice el separador Anotaciones de las propiedades de flujo para añadir anotaciones de texto al flujo. Estas notas sólo son visibles cuando la pestaña Anotaciones está abierta, excepto que las anotaciones de flujo también se pueden mostrar como comentarios en pantalla.