Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Uzel v Binning automaticky vytvoří nová nominální (nastavená) pole založená na hodnotách jednoho nebo více existujících polí souvislého (číselného rozsahu). Můžete například transformovat pole s průběžným příjmem na nové kategorické pole obsahující skupiny výnosů jako odchylky od střední hodnoty. Po vytvoření přihrádek pro nové pole můžete vygenerovat uzel Derive založený na bodech.
Příklad
node = stream.create("binning", "My node")
node.setPropertyValue("fields", ["Na", "K"])
node.setPropertyValue("method", "Rank")
node.setPropertyValue("fixed_width_name_extension", "_binned")
node.setPropertyValue("fixed_width_add_as", "Suffix")
node.setPropertyValue("fixed_bin_method", "Count")
node.setPropertyValue("fixed_bin_count", 10)
node.setPropertyValue("fixed_bin_width", 3.5)
node.setPropertyValue("tile10", True)
binningnode vlastnosti |
Datový typ | Popis vlastnosti |
---|---|---|
fields |
[field1 field2 ... pole_číslo] | Souvislý (číselný rozsah) nevyřízených transformací. Současně můžete vložit více polí do koše. |
method |
FixedWidth EqualCount Rank SDev Optimal |
Metoda použitá pro určení řezaných bodů pro nové popelnice (kategorie). |
recalculate_bins |
Always IfNecessary |
Uvádí, zda jsou kolekce přepočítány a data umístěná v příslušné přihrádce pokaždé, když se uzel provádí, nebo že jsou data přidána pouze do existujících přihrádek a nových přihrádek, které byly přidány. |
fixed_width_name_extension |
řetězec | Výchozí přípona je _BIN. |
fixed_width_add_as |
Suffix Prefix |
Uvádí, zda je rozšíření přidáno na konec (příponu) názvu pole nebo na začátek (prefix). Výchozí přípona je income_BIN. |
fixed_bin_method |
Width Count |
|
fixed_bin_count |
celočíselná hodnota | Uvádí celé číslo použité k určení počtu přihrádek pevné šířky (kategorií) pro nové pole. |
fixed_bin_width |
real | Hodnota (celé číslo nebo reálná) pro výpočet šířky přihrádky. |
equal_count_name_ extension |
řetězec | Výchozí přípona je _TITLE. |
equal_count_add_as |
Suffix Prefix |
Uvádí příponu, buď příponu, nebo předponu, použitou pro název pole generovaného pomocí standardních p-dlaždic. Výchozí přípona je _TITLE plus N, kde N je číslo dílu. |
tile4 |
příznak | Vygeneruje čtyři zásobníky kvantil, z nichž každý obsahuje 25% případů. |
tile5 |
příznak | Vygeneruje pět quintilových zásobníků. |
tile10 |
příznak | Vygeneruje 10 decilových zásobníků. |
tile20 |
příznak | Generuje 20 vingtilových přihrádek. |
tile100 |
příznak | Generuje 100 percentilových přihrádek. |
use_custom_tile |
příznak | |
custom_tile_name_extension |
řetězec | Výchozí přípona je _TILEN. |
custom_tile_add_as |
Suffix Prefix |
|
custom_tile |
celočíselná hodnota | |
equal_count_method |
RecordCount ValueSum |
Metoda RecordCount hledá přiřazení stejného počtu záznamů ke každé přihrádce, zatímco ValueSum přiřazuje záznamy tak, aby součet hodnot v každém zásobníku byl stejný. |
tied_values_method |
Next Current Random |
Určuje, která data s hodnotou vázanou hodnotou mají být vložena. |
rank_order |
Ascending Descending |
Tato vlastnost zahrnuje Ascending (nejnižší hodnota je označena jako 1) nebo Descending (nejvyšší hodnota je označena jako 1). |
rank_add_as |
Suffix Prefix |
Tato volba se používá pro očíslování pořadí, zlomkové pořadí a procentní část hodnocení. |
rank |
příznak | |
rank_name_extension |
řetězec | Výchozí přípona je _RANK. |
rank_fractional |
příznak | Váže na případy, kdy hodnota nového pole se rovná pořadí vydělená součtem vah z nechybějících případů. Zlomenné rozsahy spadají do rozsahu 0-1. |
rank_fractional_name_ extension |
řetězec | Výchozí přípona je _F_RANK. |
rank_pct |
příznak | Každá skupina disků rank je rozdělena podle počtu záznamů s platnými hodnotami a násobeno 100. Procento zlomkových řad očíslování pořadí se pohybuje v rozsahu 1-100. |
rank_pct_name_extension |
řetězec | Výchozí přípona je _P_RANK. |
sdev_name_extension |
řetězec | |
sdev_add_as |
Suffix Prefix |
|
sdev_count |
One Two Three |
|
optimal_name_extension |
řetězec | Výchozí přípona je _OPTIMAL. |
optimal_add_as |
Suffix Prefix |
|
optimal_supervisor_field |
pole | Pole zvolené jako pole pro dohled, do kterého se vztahují pole vybraná pro vytvoření binning. |
optimal_merge_bins |
příznak | Určuje, že všechny přihrádky s malými počty případů budou přidány do větší, sousední přihrádky. |
optimal_small_bin_threshold |
celočíselná hodnota | |
optimal_pre_bin |
příznak | Označuje, že se má provést prebinning datové sady. |
optimal_max_bins |
celočíselná hodnota | Uvádí horní limit, aby se zabránilo vytvoření nekoordinovaného velkého počtu přihrádek. |
optimal_lower_end_point |
Inclusive Exclusive |
|
optimal_first_bin |
Unbounded Bounded |
|
optimal_last_bin |
Unbounded Bounded |