0 / 0
Go back to the English version of the documentation
Posun funkcí v metrikách v2 unášení Watson OpenScale
Last updated: 27. 7. 2023
Posun funkcí v metrikách v2 unášení Watson OpenScale

Watson OpenScale vypočítá úlet funkcí tím, že měří změnu v distribuci hodnot pro důležité funkce.

Způsob činnosti

Watson OpenScale počítá driftu pro kategoriální a číselné funkce tím, že měří pravděpodobnost rozdělení spojitých a diskrétních hodnot. Chcete-li identifikovat nespojité hodnoty pro číselné funkce, produkt Watson OpenScale používá binární logaritmus pro porovnání počtu různých hodnot jednotlivých funkcí s celkovým počtem hodnot jednotlivých funkcí.

Produkt Watson OpenScale používá k identifikaci nespojitých číselných funkcí následující binární logaritmický vzorec:

Je zobrazen binární logaritmus vzorce

Je-li distinct_values_count menší než binární logaritmus total_count, je funkce identifikována jako diskrétní.

Spočítej to

Produkt Watson OpenScale používá k výpočtu posunu funkcí následující vzorce:

Jensen Shannon

Jensen Shannon Distance je normalizovaný tvar Kulback Liebler (KL) Divergence, že měří, jak moc rozdělení pravděpodobnosti se liší od druhé pravděpodobnostní rozdělení. Jensen Shannon Vzdálenost je symetrické skóre a vždy má konečnou hodnotu.

Watson OpenScale používá následující vzorec k výpočtu vzdálenosti Jensen Shannon pro dvě rozdělení pravděpodobnosti, úroveň baseline (B) a produkci (P):

Jensen Shannon vzorec vzdálenosti se zobrazí

KL Divergence se zobrazí je KL Divergence.

Celková vzdálenost varianty

Celková rozptylová vzdálenost měří maximální rozdíl mezi pravděpodobností dvou pravděpodobnostních distribucí, úrovní baseline (B) a produkcí (P), přiřazenými ke stejné transakci, jak je uvedeno v následujícím vzorci:

Je zobrazen vzorec pro distribuci pravděpodobnosti

Pokud jsou obě distribuce rovna, stane se celková variabilita vzdálenosti mezi nimi 0.

Watson OpenScale používá k výpočtu celkové vzdálenosti variace tento vzorec:

Vzorec celkové odchylky variace je zobrazen

  • x je řada rovnoměrně rozložených vzorků, které pokrývají doménu circumflex f se zobrazí , které se pohybují od kombinovaného miniumem základní a výrobní data až po celkovou maximální úroveň baseline a provozní data.

  • symbol d (x) se zobrazí je rozdíl mezi dvěma po sobě jdoucími x vzorky.

  • vysvětlení vzorce je hodnota funkce hustoty pro provozní data ve vzorku x.

  • vysvětlení vzorce je hodnota funkce hustoty základní dat pro data ve vzorku x.

  • Jmenovatel vysvětlení vzorce představuje celkovou plochu pod vykreslenou funkcí hustoty pro produkci a základní data. Tyto součty jsou aproximací integrací přes doménový prostor a obě tyto podmínky by měly být 1 a součet by měl být 2.

Koeficient překrytí

Watson OpenScale vypočítá součinitel překryvu tím, že měří celkovou plochu průniku mezi dvěma distribucemi pravděpodobnosti. Chcete-li měřit nepodobnost mezi distribucemi, průnikem nebo překryvnou oblastí se odečte od 1, aby se vypočítala částka úletu. Produkt Watson OpenScale používá k výpočtu koeficientu překryvu následující vzorec:

Vzorec pro koeficient překrytí se zobrazí

  • x je řada vzájemně vzdálených ukázek, které pokrývají doménu circumflex f se zobrazí , které se pohybují od kombinovaného miniummy úrovně baseline a provozní data až do kombinovaného maxima základních a produkčních dat.

  • symbol d (x) se zobrazí je rozdíl mezi dvěma po sobě jdoucími x vzorky.

  • vysvětlení vzorce je hodnota funkce hustoty pro provozní data ve vzorku x.

  • vysvětlení vzorce je hodnota funkce hustoty základní dat pro data ve vzorku x.

Další informace

Přezkoumání výsledků posunu v2

Nadřízené téma: Metriky v2 Drift

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more