Watson OpenScale vypočítá posun výstupu změřením změny v distribuci důvěry modelu.
Způsob činnosti
Watson OpenScale měří, jak se váš model změní od okamžiku, kdy jste model vycvičoval. V případě regresních modelů vypočítá Watson OpenScale výstupní úlet tím, že měří změnu v distribuci předpovědí na datech školení a zatížení. Pro modely klasifikace produkt Watson OpenScale vypočítá odchylku výstupu pro každou pravděpodobnost třídy změřením změn v distribuci pro pravděpodobnosti třídy na datech školení a užitečnosti dat. U modelů s více klasifikačními třídami produkt Watson OpenScale také agreguje výstupní odchylku pro každou pravděpodobnost třídy tím, že měří vážený průměr.
Spočítej to
Watson OpenScale používá k výpočtu výstupního posunu následující vzorce:
Celková vzdálenost varianty
Celková rozptylová vzdálenost měří maximální rozdíl mezi pravděpodobností dvou pravděpodobnostních distribucí, úrovní baseline (B) a produkcí (P), přiřazenými ke stejné transakci, jak je uvedeno v následujícím vzorci:
Pokud jsou obě distribuce rovna, stane se celková variabilita vzdálenosti mezi nimi 0.
Watson OpenScale používá k výpočtu celkové vzdálenosti variace tento vzorec:
x je řada vzájemně vzdálených ukázek, které pokrývají doménu , které se pohybují od kombinovaného miniummy úrovně baseline a provozní data až do kombinovaného maxima základních a produkčních dat.
je rozdíl mezi dvěma po sobě jdoucími x vzorky.
je hodnota funkce hustoty pro provozní data ve vzorku x.
je hodnota funkce hustoty základní dat pro data ve vzorku x.
Jmenovatel představuje celkovou plochu pod vykreslenou funkcí hustoty pro produkci a základní data. Tyto součty jsou aproximací integrací přes doménový prostor a obě tyto podmínky by měly být 1 a součet by měl být 2.
Koeficient překrytí
Watson OpenScale vypočítá součinitel překryvu tím, že měří celkovou plochu průniku mezi dvěma distribucemi pravděpodobnosti. Chcete-li měřit nepodobnost mezi distribucemi, průnikem nebo překryvnou oblastí se odečte od 1, aby se vypočítala částka úletu. Produkt Watson OpenScale používá k výpočtu koeficientu překryvu následující vzorec:
x je řada vzájemně vzdálených ukázek, které pokrývají doménu , které se pohybují od kombinovaného miniummy úrovně baseline a provozní data až do kombinovaného maxima základních a produkčních dat.
je rozdíl mezi dvěma po sobě jdoucími x vzorky.
je hodnota funkce hustoty pro provozní data ve vzorku x.
je hodnota funkce hustoty základní dat pro data ve vzorku x.
Další informace
Přezkoumání výsledků posunu v2
Nadřízené téma: Metriky v2 Drift