Węzeł Zasób danych (SPSS Modeler)

Translation not up to date

The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.

Go back to the English version of the documentation

Węzeł Zasób danych

Last updated: 07 wrz 2023

Węzeł Zasób danych (SPSS Modeler)

Węzła importu zasobów danych można użyć do pobrania danych ze zdalnych źródeł danych za pomocą połączeń lub z komputera lokalnego. Najpierw należy utworzyć połączenie.

Uwaga: w przypadku połączeń z bazą danych Planning Analytics należy wybrać widok (nie kostka).

Można również pobrać dane z lokalnego pliku danych (obsługiwane są następujące opcje:.csv, .txt, .json, .xls, .xlsx, .savi .sas ). Tylko pierwszy arkusz jest importowany z arkuszy kalkulacyjnych. W obszarze właściwości węzła, w sekcji DATA, wybierz jeden lub więcej plików danych do przesłania. Możesz także po prostu przeciągnąć plik danych z lokalnego systemu plików na kanwę.

Uwaga: Można zaimportować strumień (.str) do programu watsonx.ai , który został utworzony w kliencie SPSS Modeler Subscription lub SPSS Modeler klienta. Jeśli zaimportowany strumień zawiera jeden lub większą liczbę węzłów importu lub eksportu, zostanie wyświetlone zapytanie o przekształcenie węzłów. Więcej informacji na ten temat zawiera sekcja Importowanie strumienia SPSS Modeler.

Ustawianie opcji formatu danych

Różne kraje używają różnych symboli, aby oddzielić część całkowitą od ułamkowej części liczby i oddzielić pola w danych. Na przykład można użyć przecinka zamiast okresu, aby oddzielić część całkowitą od ułamkowej części liczb. Zamiast używać przecinków do oddzielania pól w danych, można użyć dwukropków lub kart. Za pomocą węzła importu lub eksportu zasobu danych można określić te symbole i inne opcje. Kliknij dwukrotnie węzeł, aby otworzyć jego właściwości, a następnie określ formaty danych zgodnie z potrzebami.

Wykres 1. Opcje ogranicznika pola i symbolu dziesiętnego

Importowanie danych z pliku SPSS Statistics

Jeśli importowane są dane z pliku SPSS Statistics (.sav), dostępne są następujące opcje:

Nazwy zmiennych. Wybierz metodę obsługi nazw zmiennych i etykiet po zaimporcie z pliku SPSS Statistics .sav . Metadane, które mają zostać uwzględnione w tym miejscu, utrwalają się w pracy w programieSPSS Modeler i mogą zostać ponownie wyeksportowane do użytku w programie IBM SPSS Statistics.

Odczytaj nazwy i etykiety. Wybierz tę opcję, aby odczytywać nazwy zmiennych i etykiety w programie SPSS Modeler. Jest to opcja domyślna, a nazwy zmiennych są wyświetlane w węźle Typ. Etykiety mogą być wyświetlane na wykresach, w przeglądarkach modeli i w innych typach danych wyjściowych. Domyślnie opcja wyświetlania etykiet w wynikach jest wyłączona.
Odczytaj etykiety jako nazwy. Tę opcję należy wybrać, aby odczytywać opisowe etykiety zmiennych z pliku SPSS Statistics .sav , a nie nazwy krótkich pól, i używać tych etykiet jako nazw zmiennych w programie SPSS Modeler.

Wartości. Wybierz metodę obsługi wartości i etykiet po zaimporcie z pliku SPSS Statistics .sav . Metadane, które mają zostać uwzględnione w tym miejscu, utrwalają się w pracy w programie SPSS Modeler i mogą zostać ponownie wyeksportowane do użycia w programie SPSS Statistics.

Odczytaj dane i etykiety. Wybierz tę opcję, aby odczytywać zarówno wartości rzeczywiste, jak i etykiety wartości w programie SPSS Modeler. Jest to opcja domyślna, a same wartości są wyświetlane w węźle Typ. Etykiety wartości mogą być wyświetlane w konstruktorze wyrażeń, na wykresach, w przeglądarkach modeli i w innych typach danych wyjściowych.
Odczytaj etykiety jako dane. Tę opcję należy wybrać, jeśli etykiety wartości mają być używane z pliku .sav , a nie z kodami numerycznymi lub symbolicznymi, które są używane do reprezentowania wartości. Na przykład wybranie tej opcji dla danych z polem płci, którego wartości 1 i 2 faktycznie reprezentują odpowiednio mężczyzna i kobieta, przekształcą pole w łańcuch i zaimportuje wartości male i female jako wartości rzeczywiste.
Przed wybraniem tej opcji należy wziąć pod uwagę brakujące wartości danych w danych SPSS Statistics . Na przykład, jeśli pole liczbowe używa etykiet tylko dla brakujących wartości (0 = Brak odpowiedzi, –99 = Nieznany), wówczas wybranie opcji Odczytaj etykiety jako dane zaimportuje tylko etykiety wartości Brak odpowiedzi i Nieznane i przekształci pole w łańcuch. W takich przypadkach należy importować same wartości i ustawić braki danych w węźle typu.

Użyj informacji o formacie zmiennej w celu wymuszenia typu składowania. W przypadku anulowania wyboru tej opcji wartości pól sformatowane w pliku .sav jako liczby całkowite (tzn. pola określone jako Fn.0 w widoku Zmienne w programie IBM SPSS Statistics) są importowane przy użyciu pamięci całkowitej. Wszystkie pozostałe wartości zmiennych, z wyjątkiem łańcuchów, są importowane jako liczby rzeczywiste.

Jeśli zostanie wybrana ta opcja (wartość domyślna), wszystkie wartości pól z wyjątkiem łańcuchów są importowane jako liczby rzeczywiste, niezależnie od tego, czy są one sformatowane w pliku .sav jako liczby całkowite, czy nie.

Odczyt datownika jako daty. Domyślnie wszystkie wartości znacznika czasu są wyświetlane jako daty. Anuluj wybór tej opcji, aby przesłonić to zachowanie.

Pobieranie danych za pomocą kodu SQL

W obszarze właściwości węzła importu zasobów danych w obszarze Trybmożna wybrać opcję SQL Query , jeśli do importowania danych z bazy danych ma być używany niestandardowy kod SQL. Użyj instrukcji SQL SELECT w celu pobrania wierszy lub kolumn danych z bazy danych. Należy zauważyć, że pole Ścieżka źródłowa nie ma zastosowania, jeśli używany jest tryb SQL Query .

Poniższy przykład przedstawia dane z tabeli bazy danych w niektórych wierszach danych:

select * from GOSALES.ORDER_DETAILS
where  UNIT_COST > 40,000 LIMIT 4

I ten przykład może być używany w niektórych kolumnach danych z tabeli bazy danych:

select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS

Należy zauważyć, że składnia SQL może być różna w zależności od platformy bazy danych. Na przykład w przypadku pobierania danych z bazy danych Informix produkt Informix wymaga, aby nazwy pól były otaczane znakami podwójnego cudzysłowu. Na przykład:

select "Age", "Sex" from testuser.canvas_drug

Ta funkcja SQL powinna być używana tylko do pobierania danych. Należy zachować ostrożność, aby nie manipulować danymi w bazie danych.

Następujące bazy danych obsługują obecnie tę niestandardową funkcję SQL:

Amazon Redshift
Apache Hive
Cloudera Impala
Compose for PostgreSQL
Db2 on Cloud
Db2 Warehouse
Google BigQuery
Informix
Microsoft SQL Server
MySQL
Netezza
Oracle
Pivotal Greenplum
Salesforce.com
Snowflake
SAP ASE
SAP IQ
Teradata