Funkcja Watson OpenScale oblicza dryf wyjściowy, mierząc zmianę w rozkładzie ufności modelu.
Jak to działa?
Watson OpenScale mierzy, jak bardzo modelowe dane wyjściowe zmieniają się od czasu, kiedy trenujesz model. W przypadku modeli regresji Watson OpenScale oblicza dryf wyjściowy, mierząc zmianę rozkładu predykcji na danych dotyczących szkolenia i ładunku. W przypadku modeli klasyfikacji Watson OpenScale oblicza dryfty wyjściowe dla każdego prawdopodobieństwa klasy poprzez pomiar zmiany rozkładu dla prawdopodobieństw klas na danych uczących i ładunku. W przypadku modeli z wieloma klasyfikacjami Watson OpenScale agreguje również dryfty wyjściowe dla każdego prawdopodobieństwa klasy poprzez pomiar średniej ważonej.
Wykonaj matematykę
Watson OpenScale używa następujących formuł do obliczania dryftu wyjściowego:
Całkowita odległość zmienności
Całkowita odległość zmienności mierzy maksymalną różnicę między prawdopodobieństwem, że dwa rozkłady prawdopodobieństwa, linia bazowa (B) i produkcja (P), przypisują do tej samej transakcji, co pokazano w następującym wzorze:
Jeśli obie dystrybucje są równe, łączny zmienny dystans między nimi staje się równy 0.
Watson OpenScale wykorzystuje następującą formułę do obliczania całkowitej odległości zmienności:
x jest serią najbardziej odległych próbek, które obejmują domenę produktu , która mieści się w łącznym miniumum danych bazowych i produkcyjnych, do łącznego maksymalnego poziomu danych bazowych i produkcyjnych.
jest różnicą między dwoma kolejnymi próbkami x.
to wartość funkcji gęstości dla danych produkcyjnych w próbce x.
to wartość funkcji gęstości dla danych bazowych dla próbki x.
Mianownik reprezentuje łączną powierzchnię obszaru pod wykresami funkcji gęstości dla danych produkcyjnych i wyjściowych. Te podsumowania są przybliżeniem integracji w obszarze domeny, a oba te terminy powinny mieć wartość 1, a suma powinna wynosić 2.
Współczynnik pokrywania
Watson OpenScale oblicza współczynnik pokrywania, mierząc całkowitą powierzchnię przecięcia między dwoma rozkładami prawdopodobieństwa. Aby zmierzyć niepodobieństwa między rozkładami, przecięcie lub obszar nakładania jest odejmowany od 1, aby obliczyć ilość dryftu. Funkcja Watson OpenScale oblicza współczynnik pokrywania przy użyciu następującej formuły:
x jest serią najbardziej odległych próbek, które obejmują domenę produktu , która mieści się w łącznym miniumum danych bazowych i produkcyjnych, do łącznego maksymalnego poziomu danych bazowych i produkcyjnych.
jest różnicą między dwoma kolejnymi próbkami x.
to wartość funkcji gęstości dla danych produkcyjnych w próbce x.
to wartość funkcji gęstości dla danych bazowych dla próbki x.
Więcej inform.
Przeglądanie wyników analizy dryftu v2
Temat nadrzędny: Wielkości mierzone Drift v2