Translation not up to date
Uzel vyhodnocení nabízí jednoduchý způsob, jak vyhodnotit a porovnat prediktivní modely a vybrat nejlepší model pro vaši aplikaci. Hodnotící grafy zobrazují, jak modely provádějí předpovídání konkrétních výsledků. Pracují podle třídění záznamů na základě předpokládané hodnoty a důvěry prognózy, rozdělení záznamů do skupin o stejné velikosti (kvantil) a pak zakreslete hodnotu obchodního kritéria pro každý kvantil od nejvyšší po nejnižší. Více modelů je zobrazeno jako samostatné řádky v zákresu.
S výstupem se zachází definováním specifické hodnoty nebo rozsahu hodnot jako výskytu. Přístupy obvykle označují úspěch nějakého řazení (jako např. prodej zákazníkovi) nebo událost úroku (například specifická lékařská diagnóza). Můžete definovat kritéria splnění v sekci OPTIONS vlastností uzlu, nebo můžete použít výchozí kritéria přístupu takto:
- Výstupní pole Flag jsou přímá; přístupy odpovídají hodnotě true .
- Pro výstupní pole Nominální je první hodnota v sadě definována jako hit.
- Pro výstupní pole Souvislá jsou rovny stejné hodnoty větší než střed rozsahu pole.
K dispozici je šest typů hodnotících grafů, z nichž každá klade důraz na odlišné hodnotící kritérium.
Grafy Ginse
Zisky jsou definovány jako podíl celkových přístupů, které se vyskytují v každém kvantilu. Zisky se vypočítávají jako (number of hits in quantile / total number of hits) ×
100%
.
Výklopky
Lift porovnává procentní podíl záznamů v každém kvantilu, které jsou přístupy s celkovým procentem přístupů v datech o školení. Vypočítá se jako (hits in quantile /
records in quantile) / (total hits / total records)
.
Grafy odpovědí
Odezva je jednoduše procentní částí záznamů v kvantile, které jsou přístupy. Odezva se vypočítá jako (hits in quantile / records in quantile) × 100%
.
Výsledkové grafy
Zisk se rovná hodnotě výnos pro každý záznam minus náklady pro záznam. Zisky pro kvantil jsou jednoduše součtem zisků všech záznamů v kvantile. Výnosy se předpokládají, že se použije pouze na přístupy, ale náklady se vztahují na všechny záznamy. Zisky a náklady mohou být fixní nebo mohou být definovány poli v datech. Zisky se vypočtou jako (sum of revenue for records in quantile − sum of costs for records in
quantile)
.
Grafy návratnosti investic
Návratnost investic (návratnost investic) je podobná zisku v tom, že zahrnuje definování výnosů a nákladů. Hodnota ROI porovnává zisky s náklady na kvantil. Hodnota ROI se vypočítá jako (profits for quantile / costs for quantile) × 100%
.
grafy ROC
ROC (charakteristika operátora příjemce) lze použít pouze s binárními klasifikátory. ROC lze použít k vizualizaci, uspořádání a výběru klasifikátorů na základě jejich výkonu. Graf ROC zakresluje skutečnou kladnou rychlost (nebo citlivost) proti falešně pozitivní rychlosti klasifikátoru. Graf typu ROC znázorňuje relativní kompromisy mezi přínosy (skutečnými pozitivními výsledky) a náklady (falešná pozitiva). Kladný pozitivní je instance, která je hit a je klasifikovaná jako hit. Proto se skutečná kladná rychlost vypočítá jako počet pravdivých pozitivních/počet instancí, které skutečně zasáhne. Falešný pozitivní je instance, která je netrefná a je klasifikovaná jako hit. Proto je falešná kladná rychlost vypočtena jako počet falešných pozitiv/počet instancí, které ve skutečnosti chybí.
Hodnotící grafy mohou být také kumulativní, aby se každý bod rovnal hodnotě pro odpovídající kvantil plus všechny vyšší kvantily. Kumulativní grafy obvykle přenášejí celkový výkon modelů lépe, zatímco nekumulativní grafy často vynikají při označování konkrétních problémových oblastí pro modely.