Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Hierarchická hustota založená na hustotě (HDBSCAN) © využívá k vyhledání klastrů nebo hustých oblastí datové sady nekontrolovaný výukový program. Uzel HDBSCAN v produktu SPSS Modeler odkrývá základní funkce a běžně používané parametry knihovny HDBSCAN. Uzel je implementován v Pythona vy jej můžete použít k seskupení vašich datových sad do různých skupin, když nevíte, jaké skupiny jsou na začátku.
hdbscannode vlastnosti |
Datový typ | Popis vlastnosti |
---|---|---|
vlastní_pole | typ boolean | Tato volba říká uzlu, aby místo toho udané v jakémkoliv předchozím uzlu (uzlech) použil informace o poli zadané v tomto poli. Po výběru této volby zadejte podle potřeby následující pole. |
inputs |
pole | Vstupní pole pro klastrování. |
useHPO |
typ boolean | Uveďte true nebo false , abyste povolili nebo zakázali optimalizaci HPO (Hyper-Parameter Optimization) založené na Rbfopt, který automaticky zjišťuje optimální kombinaci parametrů tak, aby model dosáhl očekávané nebo nižší chybovolené rychlosti na vzorcích. Předvolba je false . |
min_cluster_size |
celočíselná hodnota | Minimální velikost klastrů. Zadejte celé číslo. Předvolba je 5 . |
min_samples |
celočíselná hodnota | Počet vzorků ve čtvrti pro bod, který má být považován za klíčový bod. Zadejte celé číslo. Je-li nastavena hodnota 0 , použije se min_cluster_size . Předvolba je 0 . |
algorithm |
řetězec | Uveďte, který algoritmus se má použít: best , generic , prims_kdtree , prims_balltree , boruvka_kdtree nebo boruvka_balltree . Předvolba je best . |
metric |
řetězec | Určete metriku, která má být použita při výpočtu vzdálenosti mezi instancemi v poli funkcí: euclidean , cityblock , L1 , L2 , manhattan , braycurtis , canberra , chebyshev , correlation , minkowski nebo sqeuclidean . Předvolba je euclidean . |
useStringLabel |
typ boolean | Uveďte true , chcete-li použít řetězcový popis klastru, nebo false pro použití nálepky s čísly klastru. Předvolba je false . |
stringLabelPrefix |
řetězec | Je-li parametr useStringLabel nastaven na hodnotu true , zadejte hodnotu pro předponu popisku řetězce. Výchozí předpona je cluster . |
approx_min_span_tree |
typ boolean | Uveďte true , chcete-li přijmout přibližný minimální rozpínač, nebo false , pokud jste ochotni obětovat rychlost pro správnost. Předvolba je true . |
cluster_selection_method |
řetězec | Určete metodu, která má být použita pro výběr klastrů ze zhuštěného stromu: eom nebo leaf . Předvolba je eom (Přebytek hmotnostního algoritmu). |
allow_single_cluster |
typ boolean | Zadejte true , chcete-li povolit jednoduché výsledky klastru. Předvolba je false . |
p_value |
dvojitý | Zadejte p value , které se má použít, pokud používáte minkowski pro metriku. Předvolba je 1.5 . |
leaf_size |
celočíselná hodnota | Používáte-li algoritmus stromu prostoru (boruvka_kdtree nebo boruvka_balltree ), zadejte počet bodů v koncovém uzlu stromu. Předvolba je 40 . |
outputValidity |
typ boolean | Uveďte true nebo false , abyste kontrolčili, zda je graf indexu platnosti zahrnut ve výstupu modelu. |
outputCondensed |
typ boolean | Uveďte true nebo false , chcete-li řídit, zda je ve výstupu modelu zahrnutý graf Zhuštěný strom. |
outputSingleLinkage |
typ boolean | Chcete-li určit, zda má být do výstupu modelu zahrnut jediný stromový diagram sestavení, zadejte hodnotu true nebo false . |
outputMinSpan |
typ boolean | Uveďte true nebo false , chcete-li řídit, zda se do výstupu modelu zahrne strom Min. rozpětí. |
is_split |