Puede utilizar el nodo Activo de datos para extraer datos de orígenes de datos remotos que utilizan conexiones o desde el sistema local. En primer lugar, debe crear la conexión.
Nota para las conexiones a una base de datos de Planning Analytics, debe elegir una vista (no un cubo).
También puede extraer datos de un archivo de datos local (se da soporte a.csv, .txt, .json, .xls, .xlsx, .sav y .sas). Solo se importa la primera hoja de las hojas de cálculo. En las propiedades del nodo, en DATOS, seleccione uno o más archivos de datos para cargar. También puede arrastrar y soltar el archivo de datos del sistema de archivos local en el lienzo.
Establecimiento de opciones de formato de datos
Inferir estructura de datos
SPSS Modeler procesa una muestra de los registros de los datos para inferir la estructura de los datos y los tipos de datos. Ajuste el número para Inferir recuento de registros si los primeros 1000 registros no son una buena muestra para el número de registros que tiene. A veces, SPSS Modeler puede realizar inferencias incorrectas sobre la estructura de los datos. Para obtener más información, consulte Resolución de problemas de SPSS Modeler.
Importación de datos de un archivo de SPSS Statistics
Si importa datos de un archivo SPSS Statistics (.sav), están disponibles las opciones siguientes:
- Leer nombres y etiquetas. Seleccione esta opción para leer los nombres de variable y las etiquetas en SPSS Modeler. Esta opción está habilitada de forma predeterminada y los nombres de variable se muestran en el nodo Tipo. Las etiquetas se muestran en gráficos, navegadores de modelos y otros tipos de resultados. De forma predeterminada, la representación de etiquetas en los resultados está desactivada.
- Lea las etiquetas como nombres. Seleccione esta opción para leer las etiquetas de variable descriptivas del archivo SPSS Statistics .sav en lugar de los nombres de campo cortos, y utilice estas etiquetas como nombres de variable en SPSS Modeler.
- Leer datos y etiquetas. Seleccione esta opción para leer los valores reales y las etiquetas de valor en SPSS Modeler. Esta opción está habilitada de forma predeterminada y los valores se muestran en el nodo Tipo. Las etiquetas de valor se muestran en el Generador de expresiones, gráficos, navegadores de modelos y otros tipos de resultados.
- Leer etiquetas como datos. Seleccione esta opción si desea utilizar las etiquetas de valor del archivo .sav en lugar de los códigos numéricos o simbólicos que se utilizan para representar los valores. Por ejemplo, si selecciona esta opción para datos con un campo de género cuyos valores de
1
y2
representan hombre y mujer, convierte el campo en una serie e importamale
yfemale
como los valores reales.Es importante tener en cuenta los valores perdidos en los datos de SPSS Statistics antes de seleccionar esta opción. Por ejemplo, si un campo numérico utiliza etiquetas sólo para valores perdidos (
0
= No Answer,–99
= Desconocido), al seleccionar la opción Leer etiquetas como datos sólo importa las etiquetas de valor No Answer y Desconocido y convierte el campo en una serie. En estos casos, debe importar los propios valores y establecer los valores perdidos en un nodo Tipo.
Utilice la información de formato de campo para determinar el almacenamiento. Si deselecciona esta opción, los valores de campo formateados en el archivo .sav como enteros (por ejemplo, los campos especificados como Fn.0 en la Vista de variables en IBM SPSS Statistics) se importan utilizando el almacenamiento de enteros. El resto de los valores de campos excepto las cadenas se importan como números reales.
Si selecciona esta opción (valor predeterminado), todos los valores de campo excepto las series se importan como números reales, tanto si se formatean en el archivo .sav como enteros o no.
Indicación de fecha y hora como fecha. De forma predeterminada, todos los valores de indicación de fecha y hora se muestran como fechas. Deseleccione esta opción para alterar temporalmente este comportamiento.
Utilización de SQL para extraer datos
SELECT
de SQL para extraer filas o columnas de datos de una base de datos. El campo Vía de acceso de origen no se aplica si está utilizando la modalidad SQL Query .
select * from GOSALES.ORDER_DETAILS
where UNIT_COST > 40,000 LIMIT 4
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
select "Age", "Sex" from testuser.canvas_drug
Esta característica de SQL solo debe utilizarse para extraer datos. Tenga cuidado de no manipular los datos de la base de datos.
- Amazon Redshift
- Apache Hive
- Apache Impala
- Compose for PostgreSQL
- Db2 on Cloud
- Db2 Warehouse
- Google BigQuery
- Informix
- Microsoft SQL Server
- MySQL
- Netezza
- Oracle
- Pivotal Greenplum
- Salesforce.com
- Snowflake
- SAP ASE
- SAP IQ
- Teradata