Go back to the English version of the documentation

Funkce dostupné pro chybějící hodnoty

Last updated: 12. 1. 2023
Funkce dostupné pro chybějící hodnoty (SPSS Modeler)

Pro práci s chybějícími hodnotami ve vašich datech jsou k dispozici různé metody. Můžete se rozhodnout používat funkce dostupné v Data Refinery nebo v uzlech SPSS Modeler .

Funkce dostupné v produktu SPSS Modeler

V produktu SPSS Modelerje k dispozici několik funkcí ke zpracování chybějících hodnot. Následující funkce se často používají v uzlech Select a Filler k zahození nebo vyplnění chybějících hodnot:

  • count_nulls(LIST
  • @BLANK(FIELD
  • @NULL(FIELD
  • undef

Funkce @ lze použít ve spojení s funkcí @FIELD k identifikaci výskytu prázdných hodnot nebo hodnot null v jednom nebo více polích. Jednoduše označí pole, jsou-li přítomna prázdná nebo nulová hodnota, nebo je zadejte společně s hodnotami náhrady nebo je použijte v různých jiných operacích.

Hodnoty null můžete spočítat na seznamu polí následujícím způsobem:

count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])

Použijete-li některou z funkcí, které akceptují seznam polí jako vstup, můžete použít speciální funkce @FIELDS_BETWEEN a @FIELDS_MATCHING, jak ukazuje následující příklad:

count_nulls(@FIELDS_MATCHING('card*'))

Funkci undef můžete použít k vyplnění polí pomocí systémové chybějící hodnoty, která se zobrazí jako $null$. Chcete-li například nahradit jakoukoli číselnou hodnotu, můžete použít podmíněný příkaz, jako např.:

if not(Age > 17) or not(Age < 66) then undef else Age endif

Nahrazuje vše, co není v rozsahu systémem-chybějící hodnota, která se zobrazí jako $null$. Pomocí funkce not() můžete zachytit všechny ostatní číselné hodnoty včetně negativů.

Poznámka k vyřazení záznamů: Když používáte uzel výběru k vyřazení záznamů, všimněte si, že syntaxe používá tříhodnotovou logiku a automaticky zahrnuje hodnoty null v příkazech SELECT. Chcete-li vyloučit hodnoty null (chybějící systém) ve výrazu select, musíte jej výslovně uvést pomocí and not ve výrazu. Chcete-li například vybrat a zahrnout všechny záznamy, kde je typ léku na lékařský předpis Drug C, použijte následující příkaz select:
Drug = 'drugC' and not(@NULL(Drug))

Funkce dostupné v Data Refinery

Můžete také použít Data Refinery pro zpracování chybějících hodnot. Viz následující informace.