0 / 0
Go back to the English version of the documentation
Uzel datového aktiva
Last updated: 31. 8. 2023
Uzel datového aktiva (SPSS Modeler)

Uzel importu datového aktiva můžete použít k načtení dat ze vzdálených zdrojů dat pomocí připojení nebo z lokálního počítače. Nejprve je třeba vytvořit připojení.

Poznámka pro připojení k databázi Planning Analytics , je třeba zvolit zobrazení (nikoli krychle).

Také můžete stáhnout data z lokálního datového souboru (.csv, .txt, .json, .xls, .xlsx, .sava .sas jsou podporovány). Z tabulek se importuje pouze první list. Ve vlastnostech uzlu v části DATAvyberte jeden nebo více datových souborů k odeslání. Můžete také jednoduše přetáhnout datový soubor z lokálního systému souborů na plátno.

Poznámka: Proud (.str) můžete importovat do produktu Watson Studio vytvořeného v produktu SPSS Modeler Subscription nebo v klientovi SPSS Modeler . Pokud importovaný proud obsahuje jeden nebo více uzlů importu nebo exportu, zobrazí se výzva k převedení uzlů. Viz Import proudu SPSS Modeler.

Nastavení voleb datového formátu

Různé země používají různé symboly k oddělení celočíselné části od zlomkové části čísla a k oddělení polí v datech. Například můžete použít čárku namísto období k oddělení celé části od zlomkové části čísel. A místo použití čárek k oddělení polí ve vašich datech můžete použít dvojtečky nebo tabulátory. Pomocí uzlu pro import nebo export datového aktiva můžete zadat tyto symboly a další volby. Poklepáním na uzel otevřete jeho vlastnosti a určete datové formáty podle potřeby.
Obrázek 1. Oddělovač polí a volby desetinného symbolu
Oddělovač polí a volby desetinného symbolu

Import dat ze souboru SPSS Statistics

Importujete-li data ze souboru SPSS Statistics (.sav), jsou k dispozici následující volby:

Názvy proměnných. Vyberte metodu obsluhy názvů proměnných a popisků při importu ze souboru SPSS Statistics .sav . Metadata, která se rozhodnete zde zahrnout, zůstávají zachována v rámci vaší práce v produktuSPSS Modeler a lze je znovu exportovat pro použití v produktu IBM SPSS Statistics.
  • Přečíst názvy a popisky. Tuto volbu vyberte, chcete-li číst názvy proměnných a popisky do produktu SPSS Modeler. Jedná se o výchozí volbu a v uzlu Typ se zobrazí názvy proměnných. Popisky mohou být zobrazeny v grafech, v prohlížečích modelů a v jiných typech výstupu. Při výchozím nastavení je zobrazení popisků ve výstupu vypnuto.
  • Přečíst popisky jako názvy. Vyberte si čtení popisných popisků proměnných ze souboru SPSS Statistics .sav místo krátkých názvů polí a použijte tyto popisky jako názvy proměnných v produktu SPSS Modeler.
Hodnoty. Vyberte metodu manipulace s hodnotami a popisky při importu ze souboru SPSS Statistics .sav . Metadata, která se rozhodnete zde zahrnout, zůstávají zachována v rámci vaší práce v produktu SPSS Modeler a lze je znovu exportovat pro použití v produktu SPSS Statistics.
  • Přečtěte si data a štítky. Tuto volbu vyberte, chcete-li číst skutečné hodnoty a popisky hodnot do produktu SPSS Modeler. Jedná se o výchozí volbu a hodnoty samotné se zobrazí v uzlu Typ. Popisky hodnot se mohou zobrazovat v Tvůrci výrazů, v grafech, v prohlížečích modelů a v jiných typech výstupu.
  • Číst popisky jako data. Vyberte, zda chcete použít popisky hodnot ze souboru .sav raději než numerické nebo symbolické kódy použité ke znázornění hodnot. Například výběr této volby pro data s polem pohlaví, jehož hodnoty 1 a 2 ve skutečnosti představují male a female, převedete pole na řetězec a importujte male a female jako skutečné hodnoty.

    Před výběrem této volby je důležité vzít v úvahu chybějící hodnoty ve vašich datech SPSS Statistics . Pokud například číselné pole používá popisky pouze pro chybějící hodnoty (0 = Žádná odpověď, –99 = Neznámé), pak výběr volby Číst popisky jako data importuje pouze popisky hodnot Žádná odpověď a Neznámé a převede pole na řetězec. V takových případech byste měli importovat hodnoty samotné a nastavit chybějící hodnoty v uzlu Typ.

Použijte informace o formátu pole k určení úložiště. Pokud zrušíte výběr této volby, hodnoty polí, které jsou formátovány v souboru .sav jako celá čísla (tj. pole zadaná jako Fn.0 v pohledu Proměnné v produktu IBM SPSS Statistics), jsou importovány pomocí celočíselné paměti. Všechny ostatní hodnoty polí kromě řetězců jsou importovány jako reálná čísla.

Vyberete-li tuto volbu (výchozí nastavení), budou všechny hodnoty polí kromě řetězců importovány jako reálná čísla, ať jsou formátována v souboru .sav jako celá čísla nebo ne.

Časové razítko čtení jako datum. Při výchozím nastavení jsou všechny hodnoty časového razítka zobrazeny jako data. Chcete-li toto chování potlačit, zrušte výběr této volby.

Použití SQL pro stahování dat

Ve vlastnostech uzlu importu datového aktiva, v části Režim, můžete vybrat SQL Query , chcete-li použít vlastní kód SQL k importu dat z databáze. Chcete-li stáhnout řádky nebo sloupce dat z databáze, použijte příkaz SQL SELECT . Všimněte si, že pole Zdrojová cesta se nepoužije, pokud používáte režim SQL Query .
Obrázek 2. Vlastní dotaz SQL
Vlastní dotaz SQL
Následující příklad stáhne určité řádky dat z databázové tabulky:
select * from GOSALES.ORDER_DETAILS
where  UNIT_COST > 40,000 LIMIT 4
A tento příklad se stáhne do určitých sloupců dat z databázové tabulky:
select QUANTITY, UNIT_COST, UNIT_PRICE from GOSALES.ORDER_DETAILS
Všimněte si, že syntaxe SQL, kterou používáte, se může lišit v závislosti na databázové platformě. Pokud například tahání z dat z databáze Informix , Informix vyžaduje, aby názvy polí byly uzavřeny do dvojitých uvozovek. Například:
select "Age", "Sex" from testuser.canvas_drug

Tato funkce SQL by měla být používána pouze pro stahování dat. Buďte opatrní, chcete-li manipulovat s daty ve vaší databázi.

Následující databáze momentálně podporují tuto vlastní funkci SQL:
  • Amazon Redshift
  • Apache Hive
  • Cloudera Impala
  • Compose for PostgreSQL
  • Db2 on Cloud
  • Db2 Warehouse
  • Google BigQuery
  • Informix
  • Microsoft SQL Server
  • MySQL
  • Netezza
  • Oracle
  • Pivotal Greenplum
  • Salesforce.com
  • Snowflake
  • SAP ASE
  • SAP IQ
  • Teradata
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more