0 / 0
Volver a la versión inglesa de la documentación
Nodo Activo de datos
Última actualización: 22 nov 2024
Nodo Activo de datos (SPSS Modeler)

Puede utilizar el nodo Activo de datos para extraer datos de orígenes de datos remotos que utilizan conexiones o desde el sistema local. En primer lugar, debe crear la conexión.

Nota para las conexiones a una base de datos de Planning Analytics, debe elegir una vista (no un cubo).

También puede extraer datos de un archivo de datos local (se da soporte a.csv, .txt, .json, .xls, .xlsx, .sav y .sas). Solo se importa la primera hoja de las hojas de cálculo. En las propiedades del nodo, en DATOS, seleccione uno o más archivos de datos para cargar. También puede arrastrar y soltar el archivo de datos del sistema de archivos local en el lienzo.

Nota: Puede importar un flujo (.str) a ' watsonx.ai Studio ' que fue creado en SPSS Modeler Subscription o SPSS Modeler cliente. Si la ruta importada contiene uno o más nodos de importación o exportación, se le solicitará que convierta los nodos. Consulte Importación de un flujo de SPSS Modeler.

Establecimiento de opciones de formato de datos

Los distintos países utilizan símbolos diferentes para separar la parte entera de la parte fraccionaria de un número. Por ejemplo, algunos países utilizan una coma (4,5) en lugar de un punto (4.5). Y los países utilizan a veces símbolos diferentes para separar los campos de los datos. Por ejemplo, puede utilizar dos puntos o tabuladores en lugar de comas para separar los campos. Puede especificar cuál de estos símbolos utilizar. Efectúe una doble pulsación en el nodo para abrir sus propiedades y especificar formatos de datos.
Figura 1. Opciones de delimitador de campos y de símbolo decimal
Opciones de delimitador de campos y de símbolo decimal

Inferir estructura de datos

SPSS Modeler procesa una muestra de los registros de los datos para inferir la estructura de los datos y los tipos de datos. Ajuste el número para Inferir recuento de registros si los primeros 1000 registros no son una buena muestra para el número de registros que tiene. A veces, SPSS Modeler puede realizar inferencias incorrectas sobre la estructura de los datos. Para obtener más información, consulte Resolución de problemas de SPSS Modeler.

Importación de datos de un archivo de SPSS Statistics

Si importa datos de un archivo SPSS Statistics (.sav), están disponibles las opciones siguientes:

Nombres de variables. Seleccione un método para manejar nombres de variables y etiquetas al importar desde un archivo SPSS Statistics .sav. Los metadatos que elija incluir aquí se conservan durante todo el trabajo enSPSS Modeler y se pueden volver a exportar para utilizarlos en IBM SPSS Statistics.
  • Leer nombres y etiquetas. Seleccione esta opción para leer los nombres de variable y las etiquetas en SPSS Modeler. Esta opción está habilitada de forma predeterminada y los nombres de variable se muestran en el nodo Tipo. Las etiquetas se muestran en gráficos, navegadores de modelos y otros tipos de resultados. De forma predeterminada, la representación de etiquetas en los resultados está desactivada.
  • Lea las etiquetas como nombres. Seleccione esta opción para leer las etiquetas de variable descriptivas del archivo SPSS Statistics .sav en lugar de los nombres de campo cortos, y utilice estas etiquetas como nombres de variable en SPSS Modeler.
Valores. Seleccione un método de manejo de valores y etiquetas al importar desde un archivo SPSS Statistics .sav. Los metadatos que elija incluir aquí persisten durante todo el trabajo en SPSS Modeler y se pueden exportar de nuevo para utilizarlos en SPSS Statistics.
  • Leer datos y etiquetas. Seleccione esta opción para leer los valores reales y las etiquetas de valor en SPSS Modeler. Esta opción está habilitada de forma predeterminada y los valores se muestran en el nodo Tipo. Las etiquetas de valor se muestran en el Generador de expresiones, gráficos, navegadores de modelos y otros tipos de resultados.
  • Leer etiquetas como datos. Seleccione esta opción si desea utilizar las etiquetas de valor del archivo .sav en lugar de los códigos numéricos o simbólicos que se utilizan para representar los valores. Por ejemplo, si selecciona esta opción para datos con un campo de género cuyos valores de 1 y 2 representan hombre y mujer, convierte el campo en una serie e importa male y female como los valores reales.

    Es importante tener en cuenta los valores perdidos en los datos de SPSS Statistics antes de seleccionar esta opción. Por ejemplo, si un campo numérico utiliza etiquetas sólo para valores perdidos (0 = No Answer, –99 = Desconocido), al seleccionar la opción Leer etiquetas como datos sólo importa las etiquetas de valor No Answer y Desconocido y convierte el campo en una serie. En estos casos, debe importar los propios valores y establecer los valores perdidos en un nodo Tipo.

Utilice la información de formato de campo para determinar el almacenamiento. Si deselecciona esta opción, los valores de campo formateados en el archivo .sav como enteros (por ejemplo, los campos especificados como Fn.0 en la Vista de variables en IBM SPSS Statistics) se importan utilizando el almacenamiento de enteros. El resto de los valores de campos excepto las cadenas se importan como números reales.

Si selecciona esta opción (valor predeterminado), todos los valores de campo excepto las series se importan como números reales, tanto si se formatean en el archivo .sav como enteros o no.

Indicación de fecha y hora como fecha. De forma predeterminada, todos los valores de indicación de fecha y hora se muestran como fechas. Deseleccione esta opción para alterar temporalmente este comportamiento.

Utilización de SQL para extraer datos

En las propiedades del nodo de importación de activos de datos, en Modalidad, puede seleccionar Consulta SQL si desea utilizar SQL personalizado para importar datos de una base de datos. Utilice una sentencia SELECT de SQL para extraer filas o columnas de datos de una base de datos. El campo Vía de acceso de origen no se aplica si está utilizando la modalidad SQL Query .
Figura 2. Consulta SQL personalizada
Consulta SQL personalizada
El ejemplo siguiente extraer determinadas filas de datos de una tabla de base de datos:
select * from GOSALES.ORDER_DETAILS
where  UNIT_COST > 40,000 LIMIT 4
Y este ejemplo extrae determinadas columnas de datos de una tabla de base de datos:
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
La sintaxis SQL que utilice puede variar en función de la plataforma de base de datos. Por ejemplo, si extrae datos de una base de datos Informix , Informix requiere que los nombres de campo estén entre comillas dobles. Por ejemplo:
select "Age", "Sex" from testuser.canvas_drug

Esta característica de SQL solo debe utilizarse para extraer datos. Tenga cuidado de no manipular los datos de la base de datos.

Las bases de datos siguientes dan soporte actualmente a esta característica personalizada de SQL:
  • Amazon Redshift
  • Apache Hive
  • Apache Impala
  • Compose for PostgreSQL
  • Db2 on Cloud
  • Db2 Warehouse
  • Google BigQuery
  • Informix
  • Microsoft SQL Server
  • MySQL
  • Netezza
  • Oracle
  • Pivotal Greenplum
  • Salesforce.com
  • Snowflake
  • SAP ASE
  • SAP IQ
  • Teradata
Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información