0 / 0
Go back to the English version of the documentation
vlastnosti hdbscannode
Last updated: 04. 7. 2023
vlastnosti hdbscannode

Ikona uzlu HDBSCANHierarchická hustota založená na hustotě (HDBSCAN) © využívá k vyhledání klastrů nebo hustých oblastí datové sady nekontrolovaný výukový program. Uzel HDBSCAN v produktu SPSS Modeler odkrývá základní funkce a běžně používané parametry knihovny HDBSCAN. Uzel je implementován v Pythona vy jej můžete použít k seskupení vašich datových sad do různých skupin, když nevíte, jaké skupiny jsou na začátku.

Tabulka 1. vlastnosti hdbscannode
hdbscannode vlastnosti Datový typ Popis vlastnosti
vlastní_pole typ boolean Tato volba říká uzlu, aby místo toho udané v jakémkoliv předchozím uzlu (uzlech) použil informace o poli zadané v tomto poli. Po výběru této volby zadejte podle potřeby následující pole.
inputs pole Vstupní pole pro klastrování.
useHPO typ boolean Uveďte true nebo false , abyste povolili nebo zakázali optimalizaci HPO (Hyper-Parameter Optimization) založené na Rbfopt, který automaticky zjišťuje optimální kombinaci parametrů tak, aby model dosáhl očekávané nebo nižší chybovolené rychlosti na vzorcích. Předvolba je false.
min_cluster_size celočíselná hodnota Minimální velikost klastrů. Zadejte celé číslo. Předvolba je 5.
min_samples celočíselná hodnota Počet vzorků ve čtvrti pro bod, který má být považován za klíčový bod. Zadejte celé číslo. Je-li nastavena hodnota 0, použije se min_cluster_size . Předvolba je 0.
algorithm řetězec Uveďte, který algoritmus se má použít: best, generic, prims_kdtree, prims_balltree, boruvka_kdtreenebo boruvka_balltree. Předvolba je best.
metric řetězec Určete metriku, která má být použita při výpočtu vzdálenosti mezi instancemi v poli funkcí: euclidean, cityblock, L1, L2, manhattan, braycurtis, canberra, chebyshev, correlation, minkowskinebo sqeuclidean. Předvolba je euclidean.
useStringLabel typ boolean Uveďte true , chcete-li použít řetězcový popis klastru, nebo false pro použití nálepky s čísly klastru. Předvolba je false.
stringLabelPrefix řetězec Je-li parametr useStringLabel nastaven na hodnotu true, zadejte hodnotu pro předponu popisku řetězce. Výchozí předpona je cluster.
approx_min_span_tree typ boolean Uveďte true , chcete-li přijmout přibližný minimální rozpínač, nebo false , pokud jste ochotni obětovat rychlost pro správnost. Předvolba je true.
cluster_selection_method řetězec Určete metodu, která má být použita pro výběr klastrů ze zhuštěného stromu: eom nebo leaf. Předvolba je eom (Přebytek hmotnostního algoritmu).
allow_single_cluster typ boolean Zadejte true , chcete-li povolit jednoduché výsledky klastru. Předvolba je false.
p_value dvojitý Zadejte p value , které se má použít, pokud používáte minkowski pro metriku. Předvolba je 1.5.
leaf_size celočíselná hodnota Používáte-li algoritmus stromu prostoru (boruvka_kdtreenebo boruvka_balltree), zadejte počet bodů v koncovém uzlu stromu. Předvolba je 40.
outputValidity typ boolean Uveďte true nebo false , abyste kontrolčili, zda je graf indexu platnosti zahrnut ve výstupu modelu.
outputCondensed typ boolean Uveďte true nebo false , chcete-li řídit, zda je ve výstupu modelu zahrnutý graf Zhuštěný strom.
outputSingleLinkage typ boolean Chcete-li určit, zda má být do výstupu modelu zahrnut jediný stromový diagram sestavení, zadejte hodnotu true nebo false .
outputMinSpan typ boolean Uveďte true nebo false , chcete-li řídit, zda se do výstupu modelu zahrne strom Min. rozpětí.
is_split
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more