Funkcja Watson OpenScale oblicza dryf funkcji, mierząc zmianę rozkładu wartości dla ważnych funkcji.
Jak to działa?
Funkcja Watson OpenScale oblicza dryf dla cech jakościowych i liczbowych, mierząc rozkład prawdopodobieństwa dla wartości ciągłych i dyskretnych. Aby zidentyfikować wartości dyskretne dla funkcji liczbowych, funkcja Watson OpenScale używa logarytmu binarnego w celu porównania liczby odrębnych wartości poszczególnych składników z całkowitą liczbą wartości każdej opcji.
W systemie Watson OpenScale używana jest następująca formuła logarytmu binarnego w celu określenia dyskretnych funkcji numerycznych:
Jeśli wartość distinct_values_count
jest mniejsza niż binarny logarytm total_count
, to składnik jest identyfikowany jako dyskretny.
Wykonaj matematykę
Funkcja Watson OpenScale używa następujących formuł do obliczania dryftu funkcji:
Jensen Shannon dystans
Jensen Shannon Distance jest znormalizowaną formą Kullback-Liebler (KL) Divergence, który mierzy, jak bardzo jeden rozkład prawdopodobieństwa różni się od drugiego prawdopodobieństwa rozkładu prawdopodobieństwa. Jensen Shannon Odległość jest symetryczna ocena i zawsze ma skończoną wartość.
Watson OpenScale wykorzystuje następującą formułę do obliczenia odległości Jensen Shannon dla dwóch rozkładów prawdopodobieństwa, linii bazowej (B) i produkcji (P):
to wartość KL Divergence.
Całkowita odległość zmienności
Całkowita odległość zmienności mierzy maksymalną różnicę między prawdopodobieństwem, że dwa rozkłady prawdopodobieństwa, linia bazowa (B) i produkcja (P), przypisują do tej samej transakcji, co pokazano w następującym wzorze:
Jeśli obie dystrybucje są równe, łączny zmienny dystans między nimi staje się równy 0.
Watson OpenScale wykorzystuje następującą formułę do obliczania całkowitej odległości zmienności:
x jest serią urządzeń równoważnych, które obejmują domenę produktu , która mieści się w zakresie łączonego minimum danych bazowych i produkcyjnych, do łącznego maksymalnego poziomu danych bazowych i produkcyjnych.
jest różnicą między dwoma kolejnymi próbkami x.
to wartość funkcji gęstości dla danych produkcyjnych w próbce x.
to wartość funkcji gęstości dla danych bazowych dla próbki x.
Mianownik reprezentuje łączną powierzchnię obszaru pod wykresami funkcji gęstości dla danych produkcyjnych i wyjściowych. Te podsumowania są przybliżeniem integracji w obszarze domeny, a oba te terminy powinny mieć wartość 1, a suma powinna wynosić 2.
Współczynnik pokrywania
Watson OpenScale oblicza współczynnik pokrywania, mierząc całkowitą powierzchnię przecięcia między dwoma rozkładami prawdopodobieństwa. Aby zmierzyć niepodobieństwa między rozkładami, przecięcie lub obszar nakładania jest odejmowany od 1, aby obliczyć ilość dryftu. Funkcja Watson OpenScale oblicza współczynnik pokrywania przy użyciu następującej formuły:
x jest serią najbardziej odległych próbek, które obejmują domenę produktu , która mieści się w łącznym miniumum danych bazowych i produkcyjnych, do łącznego maksymalnego poziomu danych bazowych i produkcyjnych.
jest różnicą między dwoma kolejnymi próbkami x.
to wartość funkcji gęstości dla danych produkcyjnych w próbce x.
to wartość funkcji gęstości dla danych bazowych dla próbki x.
Więcej inform.
Przeglądanie wyników analizy dryftu v2
Temat nadrzędny: Wielkości mierzone Drift v2