Watson OpenScale vypočítá úlet funkcí tím, že měří změnu v distribuci hodnot pro důležité funkce.
Způsob činnosti
Watson OpenScale počítá driftu pro kategoriální a číselné funkce tím, že měří pravděpodobnost rozdělení spojitých a diskrétních hodnot. Chcete-li identifikovat nespojité hodnoty pro číselné funkce, produkt Watson OpenScale používá binární logaritmus pro porovnání počtu různých hodnot jednotlivých funkcí s celkovým počtem hodnot jednotlivých funkcí.
Produkt Watson OpenScale používá k identifikaci nespojitých číselných funkcí následující binární logaritmický vzorec:
Je-li distinct_values_count
menší než binární logaritmus total_count
, je funkce identifikována jako diskrétní.
Spočítej to
Produkt Watson OpenScale používá k výpočtu posunu funkcí následující vzorce:
Jensen Shannon
Jensen Shannon Distance je normalizovaný tvar Kulback Liebler (KL) Divergence, že měří, jak moc rozdělení pravděpodobnosti se liší od druhé pravděpodobnostní rozdělení. Jensen Shannon Vzdálenost je symetrické skóre a vždy má konečnou hodnotu.
Watson OpenScale používá následující vzorec k výpočtu vzdálenosti Jensen Shannon pro dvě rozdělení pravděpodobnosti, úroveň baseline (B) a produkci (P):
je KL Divergence.
Celková vzdálenost varianty
Celková rozptylová vzdálenost měří maximální rozdíl mezi pravděpodobností dvou pravděpodobnostních distribucí, úrovní baseline (B) a produkcí (P), přiřazenými ke stejné transakci, jak je uvedeno v následujícím vzorci:
Pokud jsou obě distribuce rovna, stane se celková variabilita vzdálenosti mezi nimi 0.
Watson OpenScale používá k výpočtu celkové vzdálenosti variace tento vzorec:
x je řada rovnoměrně rozložených vzorků, které pokrývají doménu , které se pohybují od kombinovaného miniumem základní a výrobní data až po celkovou maximální úroveň baseline a provozní data.
je rozdíl mezi dvěma po sobě jdoucími x vzorky.
je hodnota funkce hustoty pro provozní data ve vzorku x.
je hodnota funkce hustoty základní dat pro data ve vzorku x.
Jmenovatel představuje celkovou plochu pod vykreslenou funkcí hustoty pro produkci a základní data. Tyto součty jsou aproximací integrací přes doménový prostor a obě tyto podmínky by měly být 1 a součet by měl být 2.
Koeficient překrytí
Watson OpenScale vypočítá součinitel překryvu tím, že měří celkovou plochu průniku mezi dvěma distribucemi pravděpodobnosti. Chcete-li měřit nepodobnost mezi distribucemi, průnikem nebo překryvnou oblastí se odečte od 1, aby se vypočítala částka úletu. Produkt Watson OpenScale používá k výpočtu koeficientu překryvu následující vzorec:
x je řada vzájemně vzdálených ukázek, které pokrývají doménu , které se pohybují od kombinovaného miniummy úrovně baseline a provozní data až do kombinovaného maxima základních a produkčních dat.
je rozdíl mezi dvěma po sobě jdoucími x vzorky.
je hodnota funkce hustoty pro provozní data ve vzorku x.
je hodnota funkce hustoty základní dat pro data ve vzorku x.
Další informace
Přezkoumání výsledků posunu v2
Nadřízené téma: Metriky v2 Drift