È possibile utilizzare il nodo Asset dati per estrarre i dati dalle origini dati remote che utilizzano le connessioni o dal computer locale. Prima, è necessario creare la connessione.
Notare che per le connessioni ad un database Planning Analytics, bisogna selezionare una vista (non un cubo).
È anche possibile estrarre dati da un file di dati locale (sono supportati.csv, .txt, .json, .xls, .xlsx, .save .sas ). Dai fogli di calcolo viene importato solo il
primo foglio. Nelle proprietà del nodo, in DATI, selezionare uno o più file di dati da
caricare. È anche possibile trascinare e rilasciare il file di dati dal file system locale nell'area di disegno.
Nota: è possibile importare un flusso (.str) in watsonx.ai creato nel client SPSS Modeler Subscription o SPSS Modeler . Se il flusso importato contiene uno o più nodi di importazione o esportazione, viene richiesto di convertire i nodi. Vedere Importazione di un flusso SPSS Modeler.
Impostazione delle opzioni del formato dati
Copy link to section
I diversi Paesi utilizzano simboli diversi per separare la parte intera da quella frazionaria di un numero. Ad esempio, alcuni Paesi usano una virgola (4,5) invece di un punto (4.5). Inoltre, a volte i Paesi utilizzano simboli diversi per separare i campi dei dati. Ad esempio, si possono usare i due punti o le tabulazioni invece delle virgole per separare i campi. È possibile specificare quali di questi simboli utilizzare. Fare doppio clic sul nodo per aprirne le proprietà e specificare i formati dati.Figura 1. Opzioni Delimitatore di campo e Simbolo decimale
Deduzione della struttura dati
Copy link to section
SPSS Modeler elabora un campione di record nei dati per dedurre la struttura dei dati e i tipi di dati. Regolare il numero per Inferisci conteggio record se i primi 1000 record non sono un campione valido per il numero di record di cui si dispone. A volte, SPSS Modeler può fare inferenze non corrette sulla struttura dei dati. Per ulteriori informazioni, consultare Troubleshooting SPSS Modeler.
Importazione dei dati da un file SPSS Statistics
Copy link to section
Se si importano i dati da un file SPSS Statistics
(.sav), sono disponibili le seguenti opzioni:
Nomi variabili. Selezionare un metodo di gestione dei nomi delle variabili e delle etichette
all'atto dell'importazione da un file SPSS Statistics .sav. I metadati che si sceglie di includere qui persistono per tutto il lavoro inSPSS Modeler e possono essere esportati di nuovo per l'utilizzo in IBM SPSS Statistics.
Leggi nomi ed etichette. Selezionare per leggere sia i nomi che le etichette di variabile in SPSS Modeler. Questa opzione è abilitata per impostazione predefinita e i nomi delle variabili vengono visualizzati nel nodo Tipo. Le etichette vengono visualizzate in grafici, browser di modelli e altri tipi di output. Come impostazione predefinita, la visualizzazione delle etichette in output è disabilitata.
Leggi etichette come nomi. Selezionare per leggere le etichette di variabile descrittive dal file SPSS Statistics .sav piuttosto che i nomi di campo brevi e utilizzare tali etichette come nomi di variabile in SPSS Modeler.
Valori. Selezionare un metodo di gestione dei valori e delle etichette al momento dell'importazione
da un file SPSS Statistics .sav. I metadati che si sceglie di includere qui persistono per tutto il lavoro in SPSS Modeler e possono essere esportati di nuovo per l'utilizzo in SPSS Statistics.
Leggi dati ed etichette. Selezionare questa opzione per leggere sia i valori effettivi che le etichette valore in SPSS Modeler. Questa opzione è abilitata per impostazione predefinita e i valori stessi vengono visualizzati nel nodo Tipo. Le etichette valore vengono visualizzate nel Builder di espressioni, nei grafici, nei browser dei modelli e in altri tipi di output.
Leggi etichette come dati. Selezionare se si desidera utilizzare le etichette valore dal file .sav piuttosto che i codici numerici o simbolici utilizzati per rappresentare i valori. Ad esempio, selezionando questa opzione per i dati con un campo sesso i cui valori di 1 e 2 rappresentano maschio e femmina, il campo viene convertito in una stringa e viene importato male e female come valori effettivi.
È importante considerare i valori mancanti nei dati di SPSS Statistics prima di selezionare questa opzione. Ad esempio, se un campo numerico utilizza le etichette solo per i valori mancanti (0 = Nessuna risposta, –99 = Sconosciuto), selezionando l'opzione Leggi etichette come dati si importano solo le etichette valore Nessuna risposta e Sconosciuto e si converte il campo in una stringa. In questi casi, bisogna importare i valori stessi ed impostare i valori mancanti in
un nodo Tipo.
Utilizzare le informazioni del formato campo per determinare l'archiviazione. Se si deseleziona questa opzione, i valori dei campi formattati nel file .sav come numeri interi (ad esempio, i campi specificati come Fn.0 nella Vista variabile in IBM SPSS Statistics) vengono importati utilizzando l'archiviazione di numeri interi. Tutti i valori degli altri campi tranne le stringhe vengono importati come numeri reali.
Se si seleziona questa opzione (predefinita), tutti i valori di campo ad eccezione delle stringhe vengono importati come numeri
reali, sia che siano formattati nel file .sav come numeri interi o meno.
Leggi data/ora come data. Per impostazione predefinita, tutti i valori data/ora vengono mostrati
come date. Deselezionare questa opzione per sovrascrivere questa modalità.
Utilizzo di SQL per inserire dati
Copy link to section
Nelle proprietà del nodo di importazione Asset dati, in Modalità, è possibile
selezionare Query SQL se si desidera utilizzare SQL personalizzato per importare i
dati da un database. Utilizzare un'istruzione SQL SELECT per estrarre righe o colonne di dati da un database. Il campo Percorso di origine non si applica se si utilizza la modalità SQL Query .Figura 2. Query SQL personalizzata
Il seguente esempio inserisce alcune righe di dati da una tabella di database:
select * from GOSALES.ORDER_DETAILS
where UNIT_COST > 40,000 LIMIT 4
Copy to clipboardCopiato negli appunti
E questo esempio inserisce alcune colonne di dati da una tabella di database:
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
Copy to clipboardCopiato negli appunti
La sintassi SQL utilizzata può variare in base alla piattaforma del database. Ad esempio, se si estraggono i dati da un database Informix , Informix richiede che i nomi dei campi siano racchiusi tra virgolette. Ad esempio:
select "Age", "Sex" from testuser.canvas_drug
Copy to clipboardCopiato negli appunti
Questa funzione SQL deve essere utilizzata solo per inserire i dati. Fare attenzione a non manipolare
i dati nel database.
Questa funzione SQL personalizzata attualmente è supportata dai seguenti database: