Sie können den Datenassetknoten verwenden, um Daten aus fernen Datenquellen zu extrahieren, die Verbindungen verwenden, oder von Ihrem lokalen Computer. Zuerst müssen Sie die Verbindung erstellen.
Hinweis: Für Verbindungen zu einer Planning Analytics-Datenbank müssen Sie eine Ansicht (und keinen Cube) auswählen.
Sie können auch Daten aus einer lokalen Datendatei extrahieren (.csv, .txt, .json, .xls, .xlsx, .savund .saswerden unterstützt). Aus Arbeitsblättern wird nur das erste Blatt importiert. Wählen Sie in den Eigenschaften des Knotens unter DATEN eine oder mehrere Datendateien für den Upload aus. Sie können die Datendatei auch aus Ihrem lokalen Dateisystem in Ihren Erstellungsbereich ziehen und dort ablegen.
Datenformatoptionen festlegen
Datenstruktur ableiten
SPSS Modeler verarbeitet eine Stichprobe der Datensätze in den Daten, um die Struktur der Daten und die Datentypen abzuleiten. Passen Sie die Anzahl für Infer record count an, wenn die ersten 1000 Datensätze keine gute Stichprobe für die Anzahl der Datensätze sind, die Sie haben. Manchmal kann SPSS Modeler falsche Schlussfolgerungen zur Struktur der Daten ziehen. Weitere Informationen finden Sie unter Fehlerbehebung für SPSS Modeler.
Daten aus einer SPSS Statistics-Datei importieren
Wenn Sie Daten aus einer SPSS Statistics-Datei (.sav) importieren, sind die folgenden Optionen verfügbar:
- Namen und Beschriftungen lesen. Wählen Sie diese Option aus, um sowohl Variablennamen als auch Beschriftungen in SPSS Modelereinzulesen. Diese Option ist standardmäßig aktiviert und Variablennamen werden im Typknoten angezeigt. Bezeichnungen werden in Diagrammen, Modellbrowsern und anderen Ausgabetypen angezeigt. Standardmäßig ist die Anzeige von Beschriftungen in der Ausgabe inaktiviert.
- Beschriftungen als Namen lesen. Wählen Sie diese Option aus, um die beschreibenden Variablenbeschriftungen aus der Datei SPSS Statistics .sav anstelle der kurzen Feldnamen zu lesen, und verwenden Sie diese Beschriftungen als Variablennamen in SPSS Modeler.
- Daten und Beschriftungen lesen. Wählen Sie diese Option aus, um sowohl tatsächliche Werte als auch Wertbeschriftungen in SPSS Modelereinzulesen. Diese Option ist standardmäßig aktiviert und die Werte selbst werden im Typknoten angezeigt. Wertbeschriftungen werden in Expression Builder, Diagrammen, Modellbrowsern und anderen Ausgabetypen angezeigt.
- Beschriftungen als Daten lesen. Wählen Sie diese Option aus, wenn Sie anstelle der numerischen oder symbolischen Codes, die zur Darstellung der Werte verwendet werden, die Wertbeschriftungen aus der Datei .sav verwenden möchten. Wenn Sie diese Option beispielsweise für Daten mit einem Geschlechtsfeld auswählen, dessen Werte
1
und2
männlich und weiblichdarstellen, wird das Feld in eine Zeichenfolge konvertiert undmale
undfemale
werden als tatsächliche Werte importiert.Es ist wichtig, fehlende Werte in Ihren SPSS Statistics -Daten zu berücksichtigen, bevor Sie diese Option auswählen. Wenn ein numerisches Feld beispielsweise Beschriftungen nur für fehlende Werte verwendet (
0
= Keine Antwort,–99
= Unbekannt), werden bei Auswahl der Option Beschriftungen als Daten lesen nur die Wertbeschriftungen Keine Antwort und Unbekannt importiert und in eine Zeichenfolge konvertiert. In diesem Fall sollten Sie die Werte selbst importieren und fehlende Werte in einem Typknoten festlegen.
Speichertyp anhand Feldformatinformationen bestimmen. Wenn Sie diese Option abwählen, werden Feldwerte, die in der Datei .sav als ganze Zahlen formatiert sind (z. B. Felder, die als Fn.0 in der Variablenansicht in IBM SPSS Statisticsangegeben sind), mithilfe eines Ganzzahlspeichers importiert. Alle übrigen Feldwerte mit Ausnahme von Zeichenfolgen werden als reelle Zahlen importiert.
Wenn Sie diese Option auswählen (Standardeinstellung), werden alle Feldwerte außer Zeichenfolgen als reelle Zahlen importiert, unabhängig davon, ob sie in der Datei .savals ganze Zahlen formatiert sind oder nicht.
Zeitmarke als Datum lesen. Standardmäßig werden alle Zeitmarkenwerte als Datumsangaben angezeigt. Nehmen Sie die Auswahl dieser Option zurück, um dieses Verhalten zu überschreiben.
Daten mit SQL aufnehmen
SELECT
, um Zeilen oder Spalten von Daten aus einer Datenbank zu extrahieren. Das Feld Quellenpfad gilt nicht, wenn Sie den Modus SQL Query verwenden.
select * from GOSALES.ORDER_DETAILS
where UNIT_COST > 40,000 LIMIT 4
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
select "Age", "Sex" from testuser.canvas_drug
Diese SQL-Funktion sollte nur zum Aufnehmen von Daten verwendet werden. Gehen Sie umsichtig vor, damit die Daten nicht in Ihrer Datenbank bearbeitet werden.
- Amazon Redshift
- Apache Hive
- Apache Impala
- Compose for PostgreSQL
- Db2 on Cloud
- Db2 Warehouse
- Google BigQuery
- Informix
- Microsoft SQL Server
- MySQL
- Netezza
- Oracle
- Pivotal Greenplum
- Salesforce.com
- Snowflake
- SAP ASE
- SAP IQ
- Teradata