È possibile utilizzare il nodo Asset dati per estrarre i dati dalle origini dati remote che utilizzano le connessioni o dal computer locale. Prima, è necessario creare la connessione.
Notare che per le connessioni ad un database Planning Analytics, è necessario scegliere una vista (non un cubo).
È anche possibile estrarre dati da un file di dati locale (sono supportati.csv, .txt, .json, .xls, .xlsx, .save .sas ). Dai fogli di calcolo viene importato solo il primo foglio. Nelle proprietà del nodo, in DATI, selezionare uno o più file di dati da caricare. È anche possibile trascinare e rilasciare il file di dati dal file system locale nell'area di disegno.
Impostazione delle opzioni del formato dati
Deduzione della struttura dati
SPSS Modeler elabora un campione di record nei dati per dedurre la struttura dei dati e i tipi di dati. Regolare il numero per Inferisci conteggio record se i primi 1000 record non sono un campione valido per il numero di record di cui si dispone. A volte, SPSS Modeler può fare inferenze non corrette sulla struttura dei dati. Per ulteriori informazioni, consultare Troubleshooting SPSS Modeler.
Importazione di dati da un file SPSS Statistics
Se si importano dati da un file SPSS Statistics (.sav), sono disponibili le seguenti opzioni:
- Leggi nomi ed etichette. Selezionare per leggere sia i nomi che le etichette di variabile in SPSS Modeler. Questa opzione è abilitata per impostazione predefinita e i nomi delle variabili vengono visualizzati nel nodo Tipo. Le etichette vengono visualizzate in grafici, browser di modelli e altri tipi di output. La visualizzazione delle etichette nell'output è disabilitata per impostazione predefinita.
- Leggi etichette come nomi. Selezionare per leggere le etichette di variabile descrittive dal file SPSS Statistics .sav piuttosto che i nomi di campo brevi e utilizzare tali etichette come nomi di variabile in SPSS Modeler.
- Leggi dati ed etichette. Selezionare questa opzione per leggere sia i valori effettivi che le etichette valore in SPSS Modeler. Questa opzione è abilitata per impostazione predefinita e i valori stessi vengono visualizzati nel nodo Tipo. Le etichette valore vengono visualizzate nel Builder di espressioni, nei grafici, nei browser dei modelli e in altri tipi di output.
- Leggi etichette come dati. Selezionare se si desidera utilizzare le etichette valore dal file .sav piuttosto che i codici numerici o simbolici utilizzati per rappresentare i valori. Ad esempio, selezionando questa opzione per i dati con un campo sesso i cui valori di
1
e2
rappresentano maschio e femmina, il campo viene convertito in una stringa e viene importatomale
efemale
come valori effettivi.È importante considerare i valori mancanti nei dati di SPSS Statistics prima di selezionare questa opzione. Ad esempio, se un campo numerico utilizza le etichette solo per i valori mancanti (
0
= Nessuna risposta,–99
= Sconosciuto), selezionando l'opzione Leggi etichette come dati si importano solo le etichette valore Nessuna risposta e Sconosciuto e si converte il campo in una stringa. In questi casi, è consigliabile importare i valori stessi e impostare i valori mancanti in un nodo Tipo.
Utilizza informazioni sul formato di campo per determinare l'archiviazione. Se si deseleziona questa opzione, i valori dei campi formattati nel file .sav come numeri interi (ad esempio, i campi specificati come Fn.0 nella Vista variabile in IBM SPSS Statistics) vengono importati utilizzando l'archiviazione di numeri interi. Tutti i valori degli altri campi tranne le stringhe vengono importati come numeri reali.
Se si seleziona questa opzione (impostazione predefinita), tutti i valori dei campi tranne le stringhe vengono importati come numeri reali, che siano formattati o meno come numeri interi nel file .sav.
Leggi data/ora come data. Per impostazione predefinita, tutti i valori di data/ora sono visualizzati come date. Deselezionare questa opzione per sostituire questo comportamento.
Utilizzo di SQL per inserire dati
SELECT
per estrarre righe o colonne di dati da un database. Il campo Percorso di origine non si applica se si utilizza la modalità SQL Query .
select * from GOSALES.ORDER_DETAILS
where UNIT_COST > 40,000 LIMIT 4
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
select "Age", "Sex" from testuser.canvas_drug
Questa funzione SQL deve essere utilizzata solo per inserire i dati. Fare attenzione a non manipolare i dati nel database.
- Amazon Redshift
- Apache Hive
- Apache Impala
- Compose for PostgreSQL
- Db2 on Cloud
- Db2 Warehouse
- Google BigQuery
- Informix
- Microsoft SQL Server
- MySQL
- Netezza
- Oracle
- Pivotal Greenplum
- Salesforce.com
- Snowflake
- SAP ASE
- SAP IQ
- Teradata