Watson OpenScale , önemli özellikler için değer dağılımındaki değişikliği ölçerek özellik sapmasını hesaplar.
Nasıl çalışır
Watson OpenScale , sürekli ve ayrık değerlerin olasılık dağılımını ölçerek kategorik ve sayısal özellikler için kaymayı hesaplar. Sayısal özelliklere ilişkin ayrık değerleri tanımlamak için Watson OpenScale , her bir özelliğin ayrı değerlerinin sayısını her bir özelliğin toplam değer sayısıyla karşılaştırmak için ikili bir logaritma kullanır.
Watson OpenScale , ayrık sayısal özellikleri tanımlamak için aşağıdaki ikili logaritma formülünü kullanır:
distinct_values_count
, total_count
ikili logaritmasından küçükse, özellik ayrık olarak tanımlanır.
Matematiği yap.
Watson OpenScale , özellik sapmasını hesaplamak için aşağıdaki formülleri kullanır:
Jensen Shannon mesafesi
Jensen Shannon Uzaklığı, bir olasılık dağılımının ikinci olasılık dağılımından ne kadar farklı olduğunu ölçen Kullback-Liebler (KL) Diverjans 'ın normalleştirilmiş formudur. Jensen Shannon Mesafe simetrik bir puandır ve her zaman sonlu bir değere sahiptir.
Watson OpenScale , iki olasılık dağılımına ilişkin Jensen Shannon uzaklığını hesaplamak için aşağıdaki formülü kullanır: taban çizgisi (B) ve üretim (P):
, KL Sapma 'dır.
Toplam varyasyon uzaklığı
Toplam varyasyon uzaklığı, iki olasılık dağılımının (taban çizgisi (B) ve üretim (P)), aşağıdaki formülde gösterildiği gibi aynı işleme atadığı olasılıklar arasındaki maksimum farkı ölçer:
İki dağılım eşitse, aralarındaki toplam varyasyon mesafesi 0 olur.
Watson OpenScale , toplam varyasyon uzaklığını hesaplamak için aşağıdaki formülü kullanır:
x, temel çizgi ve üretim verilerinin birleşik minyumundan temel çizgi ve üretim verilerinin birleşik üst sınırına kadar uzanan etki alanını kapsayan bir dizi eşdeğerde örnektir.
, ardışık iki x örneği arasındaki farktır.
, bir x örneğindeki üretim verileri için yoğunluk işlevinin değeridir.
, bir x örneğine ilişkin temel çizgi verilerine ilişkin yoğunluk işlevinin değeridir.
paydası, üretim ve temel verilere ilişkin yoğunluk işlevi çizimleri altındaki toplam alanı temsil eder. Bu toplamlar, etki alanı uzayı üzerindeki tümleştirmelerin bir yaklaşımdır ve her iki terim de 1 ve toplam 2 olmalıdır.
Çakışma katsayısı
Watson OpenScale , iki olasılık dağılımı arasındaki kesişme alanının toplam alanını ölçerek çakışma katsayısını hesaplar. Dağılımlar arasındaki benzersizliği ölçmek için, kesişme ya da örtüşme alanı, sürüklenme miktarını hesaplamak için 1 'den çıkarılır. Watson OpenScale çakışma katsayısını hesaplamak için aşağıdaki formülü kullanır:
x, etki alanını kapsayan ve temel çizgi ve üretim verilerinin birleşik alt sınırından temel çizgi ve üretim verilerinin birleşik üst sınırına kadar uzanan bir dizi eşit mesafeli örnektir.
, ardışık iki x örneği arasındaki farktır.
, bir x örneğindeki üretim verileri için yoğunluk işlevinin değeridir.
, bir x örneğine ilişkin temel çizgi verilerine ilişkin yoğunluk işlevinin değeridir.
Daha fazla bilgi
drift v2 sonuçlarını gözden geçirme
Üst konu: Kayma v2 metrikler