Niveles de medición
La medida, a la que también se denomina nivel de medición, describe el uso de los campos de datos en SPSS Modeler.
Puede especificar la Medida en las propiedades de nodo de un nodo de importación o de un nodo Tipo. Por ejemplo, puede que desee definir la medida para un campo con valores enteros con los valores 1
y 0
para Marca. Esto suele indicar que 1 = True
y 0 = False
.
Almacenamiento frente a medición. Tenga en cuenta que el nivel de medición de un campo difiere de su tipo de almacenamiento, que indica si los datos están almacenados como una cadena, un número entero, un número real, una fecha, una hora o una indicación de fecha y hora. Aunque puede modificar tipos de datos en cualquier punto de un flujo mediante un nodo Tipo, el almacenamiento se debe determinar en el origen cuando se leen los datos (aunque luego lo puede modificar mediante una función de conversión).
- Valor predeterminado. Los datos cuyo tipo de almacenamiento y valores son desconocidos (por ejemplo, porque todavía no se han leído) se muestran como Valor predeterminado.
- Continuo. Se usa para describir valores numéricos, como el rango de 0–100 o 0,75–1,25. Un valor continuo pueden ser un número entero, un número real o la fecha/hora.
- Categóricas. Se utiliza en el caso de los valores de cadena, cuando se desconoce un número exacto de valores distintos. Se trata de un tipo de datos sin instanciar, lo que significa que toda la información posible acerca del almacenamiento y utilización de los datos aún no se conoce. Después de leer los datos, el nivel de medición será Flag, Nominalo Typeless, en función del número máximo de miembros para los campos nominales especificados.
- Marca. Se utiliza para datos con dos valores distintos que indican la presencia o ausencia de un rasgo, como
true
yfalse
,Yes
yNo
, o0
y1
. Los valores utilizados pueden variar, pero siempre se debe designar como el valor "true" y el otro como el valor "false". Los datos pueden representarse como texto, número entero, número real, fecha, hora o marca de tiempo. - Nominal. Se utiliza para describir datos con varios valores distintos, cada uno de los cuales se trata como un miembro de un equipo, como por ejemplo
small/medium/large
. Los datos nominales pueden tener cualquier almacenamiento: numérico, cadena o fecha/hora. Tenga en cuenta que si se establece el nivel de medición en Nominal no se modifican automáticamente los valores en el almacenamiento de serie. - Ordinal. Se utiliza para describir datos con varios valores distintos que tienen un orden inherente. Por ejemplo, las categorías salariales o las clasificaciones de satisfacción pueden escribirse como datos ordinales. El orden se define a través del orden de clasificación natural de los elementos de datos. Por ejemplo,
1, 3, 5
es el orden de clasificación predeterminado para un conjunto de enteros, mientras queHIGH, LOW, NORMAL
(ascendente alfabéticamente) es el orden de un conjunto de series. El nivel de medición ordinal le permite definir un conjunto de datos categóricos como datos ordinales para mostrarlos, generar modelos y exportarlos a otras aplicaciones (como por ejemplo IBM SPSS Statistics) que reconozcan datos originales como un tipo diferenciado. Puede utilizar un campo ordinal en cualquier punto donde pueda utilizarse un campo nominal. Además, los campos de cualquier tipo de almacenamiento (real, entero, cadena, fecha, hora, etc.) pueden definirse como ordinal. - Sin tipo. Se utiliza para datos que no se ajustan a ninguno de los tipos Valor predeterminado, Continua, Categórico, Indicador, Nominal u Ordinal, para campos con un solo valor o para datos nominales donde el conjunto tiene más miembros que el máximo definido. Sin tipo también es útil para los casos en los que el nivel de medición sería de otro modo un conjunto con muchos miembros (como un número de cuenta). Cuando seleccione Sin tipo para un campo, el rol se establece automáticamente en Ninguno, con el ID de registro como la única alternativa. El tamaño máximo predeterminado de los conjuntos es de 250 valores exclusivos.
- Recopilación. Se utiliza para identificar datos no geoespaciales que se registran en una lista. Una recopilación es, de forma efectiva, un campo de lista de profundidad cero, donde los elementos de la lista tienen uno de los niveles de medición de los demás.
- Geoespacial. Se utiliza con el tipo de almacenamiento Lista para identificar datos geoespaciales. Las listas pueden ser campos de Lista de enteros o Lista de reales con una profundidad de lista entre cero y dos, inclusive.
Puede especificar manualmente los niveles de medición o bien dejar que el software lea los datos y determine el nivel de medición según los valores que lee. Asimismo, si tiene varios campos de datos continuos que deberían tratarse como datos categóricos, puede seleccionar una opción para convertirlos. Consulte Conversión de datos continuos.
Para utilizar la escritura automática
- En un nodo Tipo, establezca la columna Modalidad de valor en Lectura para los campos deseados. Así se pondrán los metadatos a disposición de todos los nodos que se encuentran a continuación en la ruta.
- Pulse en Leer valores para leer inmediatamente los valores del origen de datos.
Para establecer manualmente el nivel de medición para un campo
- Seleccione un campo de la tabla.
- En la lista desplegable de la columna Medida, seleccione un nivel de medición para el campo.
- Como alternativa, puede utilizar los recuadros de selección para seleccionar varios campos y luego utilizar el menú desplegable de nivel superior para establecer el nivel de medición para todos los campos seleccionados a la vez.