Nodo Asset dati (SPSS Modeler) | IBM Cloud Pak for Data as a Service

Torna alla versione inglese della documentazione

Nodo Asset dati

Ultimo aggiornamento: 22 nov 2024

Nodo Asset dati (SPSS Modeler)

È possibile utilizzare il nodo Asset dati per estrarre i dati dalle origini dati remote che utilizzano le connessioni o dal computer locale. Prima, è necessario creare la connessione.

Notare che per le connessioni ad un database Planning Analytics, è necessario scegliere una vista (non un cubo).

È anche possibile estrarre dati da un file di dati locale (sono supportati.csv, .txt, .json, .xls, .xlsx, .save .sas ). Dai fogli di calcolo viene importato solo il primo foglio. Nelle proprietà del nodo, in DATI, selezionare uno o più file di dati da caricare. È anche possibile trascinare e rilasciare il file di dati dal file system locale nell'area di disegno.

Nota: è possibile importare un flusso (.str) in 'watsonx.ai Studio creato in SPSS Modeler Subscription o SPSS Modeler client. Se il flusso importato contiene uno o più nodi di importazione o esportazione, viene richiesto di convertire i nodi. Vedere Importazione di un flusso SPSS Modeler.

Impostazione delle opzioni del formato dati

I diversi Paesi utilizzano simboli diversi per separare la parte intera da quella frazionaria di un numero. Ad esempio, alcuni Paesi usano una virgola (4,5) invece di un punto (4.5). Inoltre, a volte i Paesi utilizzano simboli diversi per separare i campi dei dati. Ad esempio, si possono usare i due punti o le tabulazioni invece delle virgole per separare i campi. È possibile specificare quali di questi simboli utilizzare. Fare doppio clic sul nodo per aprirne le proprietà e specificare i formati dati.

Figura 1. Opzioni Delimitatore di campo e Simbolo decimale

Deduzione della struttura dati

SPSS Modeler elabora un campione di record nei dati per dedurre la struttura dei dati e i tipi di dati. Regolare il numero per Inferisci conteggio record se i primi 1000 record non sono un campione valido per il numero di record di cui si dispone. A volte, SPSS Modeler può fare inferenze non corrette sulla struttura dei dati. Per ulteriori informazioni, consultare Troubleshooting SPSS Modeler.

Importazione di dati da un file SPSS Statistics

Se si importano dati da un file SPSS Statistics (.sav), sono disponibili le seguenti opzioni:

Nomi variabili. Selezionare un metodo di gestione dei nomi e delle etichette di variabile dopo l'importazione da un file .sav di IBM SPSS Statistics. I metadati che si sceglie di includere qui persistono per tutto il lavoro inSPSS Modeler e possono essere esportati di nuovo per l'utilizzo in IBM SPSS Statistics.

Leggi nomi ed etichette. Selezionare per leggere sia i nomi che le etichette di variabile in SPSS Modeler. Questa opzione è abilitata per impostazione predefinita e i nomi delle variabili vengono visualizzati nel nodo Tipo. Le etichette vengono visualizzate in grafici, browser di modelli e altri tipi di output. La visualizzazione delle etichette nell'output è disabilitata per impostazione predefinita.
Leggi etichette come nomi. Selezionare per leggere le etichette di variabile descrittive dal file SPSS Statistics .sav piuttosto che i nomi di campo brevi e utilizzare tali etichette come nomi di variabile in SPSS Modeler.

Valori. Selezionare un metodo di gestione di valori ed etichette dopo l'importazione da un file .sav di IBM SPSS Statistics. I metadati che si sceglie di includere qui persistono per tutto il lavoro in SPSS Modeler e possono essere esportati di nuovo per l'utilizzo in SPSS Statistics.

Leggi dati ed etichette. Selezionare questa opzione per leggere sia i valori effettivi che le etichette valore in SPSS Modeler. Questa opzione è abilitata per impostazione predefinita e i valori stessi vengono visualizzati nel nodo Tipo. Le etichette valore vengono visualizzate nel Builder di espressioni, nei grafici, nei browser dei modelli e in altri tipi di output.
Leggi etichette come dati. Selezionare se si desidera utilizzare le etichette valore dal file .sav piuttosto che i codici numerici o simbolici utilizzati per rappresentare i valori. Ad esempio, selezionando questa opzione per i dati con un campo sesso i cui valori di 1 e 2 rappresentano maschio e femmina, il campo viene convertito in una stringa e viene importato male e female come valori effettivi.
È importante considerare i valori mancanti nei dati di SPSS Statistics prima di selezionare questa opzione. Ad esempio, se un campo numerico utilizza le etichette solo per i valori mancanti (0 = Nessuna risposta, –99 = Sconosciuto), selezionando l'opzione Leggi etichette come dati si importano solo le etichette valore Nessuna risposta e Sconosciuto e si converte il campo in una stringa. In questi casi, è consigliabile importare i valori stessi e impostare i valori mancanti in un nodo Tipo.

Utilizza informazioni sul formato di campo per determinare l'archiviazione. Se si deseleziona questa opzione, i valori dei campi formattati nel file .sav come numeri interi (ad esempio, i campi specificati come Fn.0 nella Vista variabile in IBM SPSS Statistics) vengono importati utilizzando l'archiviazione di numeri interi. Tutti i valori degli altri campi tranne le stringhe vengono importati come numeri reali.

Se si seleziona questa opzione (impostazione predefinita), tutti i valori dei campi tranne le stringhe vengono importati come numeri reali, che siano formattati o meno come numeri interi nel file .sav.

Leggi data/ora come data. Per impostazione predefinita, tutti i valori di data/ora sono visualizzati come date. Deselezionare questa opzione per sostituire questo comportamento.

Utilizzo di SQL per inserire dati

Nelle proprietà del nodo di importazione Asset dati, in Modalità, è possibile selezionare Query SQL se si desidera utilizzare SQL personalizzato per importare i dati da un database. Utilizzare un'istruzione SQL SELECT per estrarre righe o colonne di dati da un database. Il campo Percorso di origine non si applica se si utilizza la modalità SQL Query .

Il seguente esempio inserisce alcune righe di dati da una tabella di database:

select * from GOSALES.ORDER_DETAILS
where  UNIT_COST > 40,000 LIMIT 4

E questo esempio inserisce alcune colonne di dati da una tabella di database:

select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS

La sintassi SQL utilizzata può variare in base alla piattaforma del database. Ad esempio, se si estraggono i dati da un database Informix , Informix richiede che i nomi dei campi siano racchiusi tra virgolette. Ad esempio:

select "Age", "Sex" from testuser.canvas_drug

Questa funzione SQL deve essere utilizzata solo per inserire i dati. Fare attenzione a non manipolare i dati nel database.

Questa funzione SQL personalizzata attualmente è supportata dai seguenti database:

Amazon Redshift
Apache Hive
Apache Impala
Compose for PostgreSQL
Db2 on Cloud
Db2 Warehouse
Google BigQuery
Informix
Microsoft SQL Server
MySQL
Netezza
Oracle
Pivotal Greenplum
Salesforce.com
Snowflake
SAP ASE
SAP IQ
Teradata