Translation not up to date
Her profil birkaç bilgi düzeyi içerir.
İstatistikler
İstatistikler sekmesi, bir sütundaki analiz edilen verilerin yapısının ve bu yapısal bilgilere ilişkin farklı görselleştirme tiplerinin bir özetini sağlar. Tam olarak hangi bilgilerin gösterileceği, sütunun sürekli (nicel) ya da nominal (nitel) veriler içermesine bağlıdır.
Grafikler
Bir sütundaki veri tipine bağlı olarak, farklı görselleştirme tipleri arasında seçim yapabilirsiniz:
Nominal veriler:
- Çubuk grafik
- Orantı ya da pasta grafik
- Pareto grafiği
Sürekli veriler:
- Histogram grafiği
- Kutu çizimi grafiği
- Nicelik (Q-Q) çizim grafiği
Her veri tipi için bir dağıtım grafiği kullanılabilir. Dağıtım çizelgesi genellikle kolondaki ve sayılarındaki en sık değerleri (ya da aralıkları) listeler. Çizelge, biçimler, tipler ya da veri sınıfları gibi diğer bilgileri de gösterebilir. Belirli bir değeri içeren tek tek satırları görüntülemek için Satırları göster' i tıklatın.
Çubuk ya da histogram grafiklerinde, değerlerinin şu anda bakmakta olduğunuz sütunun her bir değeri içinde nasıl dağıtıldığını görmek için bir şablon sütunu seçme seçeneğiniz vardır. Örneğin, satılan fırınlanmış ürünlere sahip sütununuz varsa ve bir üst katman sütun sezonu seçerseniz, belirli bir fırın ürünü satışlarının sezon başına nasıl değiştiğini görebilirsiniz. Şablon sütunu için, veri varlığında nominal veriler içeren tüm sütunlardan seçim yapabilirsiniz.
Özet
Özet döşemesi, seçilen sütundaki verilerle ilgili genel bilgi sağlar:
- Veri kaynağında tanımlandığı şekilde sütunun veri tipi
- Çözümleme yoluyla çıkarılan veri tipi
- Bu sütundaki farklı veri biçimlerinin sayısı
- Bu kolon için en sık çıkarsanan biçim
- Atanan veri sınıfı
- Veri ölçümü tipi (
nominal
ya dacontinuous
) - Denetlenen satır sayısı (yani değer sayısı)
Temel istatistikler
Temel istatistikler, seçilen kolondaki değerlerin dağılımı ve dağılımı hakkında genel bilgi sağlar. Bir sütunun veri biçimine bağlı olarak istatistikler biraz değişir. Örneğin, tamsayı veri tipindeki bir kolona ilişkin istatistiklerin alt sınır, üst sınır ve ortalama değerleri varken, veri tipi dizgisinin bir kolonuna ilişkin istatistiklerin uzunluk alt sınırı, uzunluk üst sınırı ve ortalama uzunluk değerleri vardır.
Ölçün | Açıklama | Bu tip veriler için gösterilir |
---|---|---|
Nicelik | Boşluklar ve boş değerler de içinde olmak üzere, kolondaki benzersiz ayrı değerlerin yüzdesi. Bir sütundaki toplam ayrı değer sayısı, o sütundaki toplam değer sayısına bölünerek hesaplanır. | Sürekli |
DISTINCT | Kolona ilişkin örneklenmiş verilerde var olan farklı değerlerin sayısı. | Sürekli |
Entropi | Bu değer, sütunun ne kadar bilgi tuttuğunu ölçer. Daha genel olarak, entropi bir olaydaki ve rasgele değişkendeki bilgileri ölçmek için kullanılabilir. Bu miktar, yalnızca değişkende var olan farklı değerlerin sayısına değil, aynı zamanda beklenmeyen değerlerin miktarına göre de tahmin edilir. | Nominal |
Gini | Belirli bir elementin rastgele seçildiğinde yanlış sınıflandırılması ve Gini katsayısının varyasyonu olasılığı derecesi. Gini dizini 0 ile 1 arasında değişebilir; burada 0, tüm öğelerin belirli bir sınıfa ait olduğunu ya da yalnızca bir sınıfın var olduğunu gösterir. Gini dizini 1, tüm öğelerin çeşitli sınıflara rasgele dağıtıldığını gösterir. 0.5 değeri, öğelerin bazı sınıflara eşit olarak dağıtıldığını gösterir. | Nominal |
Maksimum | Sayısal bir değişkenin en büyük değeri | Sürekli |
Ortalama | Aritmetik ortalama, toplamın değer sayısına bölünmesi | Sürekli |
Ortalama | Değerlerin yarısının düştüğü değerin üstündeki ve altındaki değer. Çift sayıda değer varsa, medyan, sıralandıklarında iki orta değerin ortalamasıdır. Medyan aykırı değerler tarafından etkilenmez | Sürekli |
En Az | Sayısal bir değişkenin en küçük değeri | Sürekli |
Eksik | Örnekteki değer olmayan satırların sayısı. | Sürekli Nominal |
Kip | Sütundaki en sık görülen değer. Eşit sıklıkta birden çok değer oluşursa, bunların her biri bir kiptir. | Sürekli Nominal |
Aykırı Değerler | Sütun verilerindeki, sütundaki diğer değerlerin çoğundan uzak olan değerlerin sayısı. | Sürekli |
Aralık | Sütundaki maksimum ve minimum değerler arasındaki fark. | Sürekli |
Toplam | Değerleri olan tüm sütunlarda değerlerin toplamı ya da toplamı. | Sürekli |
Benzersiz | Yürürlükteki kolonda yalnızca bir kez görüntülenen ayrı değerlerin sayısı. | Sürekli Nominal |
Geçerli | Geçerli olarak kabul edilen değerlerin sayısı; bu, boş ya da eksik sütun değerlerinin dışlandığı anlamına gelir. | Sürekli Nominal |
Gelişmiş öngörüler
Seçilen sütundaki değerlerin dağılımı ve dağılımı hakkında ayrıntılı bilgi. Bu bilgiler yalnızca sürekli veriler için gösterilir:
Ölçün | Açıklama |
---|---|
25th yüzdelik | Saptanan değerlerin %75 'inin düştüğü %25 ve üzeri değerin altında yer alan değer. |
75th yüzdelik | Algılanan değerlerin %25 'inin ve %75 'inin düştüğü değerin üzerinde. |
Kurtoz | Aykırı değerlerin bulunduğu kapsamın ölçüsüdür (bir dağılımınuyarlılığı ). Aşırı kurtoz, normal dağılıma göre bir dağılımın kuyruklanmasıdır. Normal bir dağılım için, kurtoz istatistiğinin değeri sıfırdır. Pozitif kurtoz, verilerin normal bir dağılımdan daha fazla aykırı değer gösterdiğini gösterir. Negatif kurtoz, verilerin normal dağılıma göre daha az aykırı değerler gösterdiğini gösterir. Orta kurutmalı (orta kuyruklu) dağılımlar mezokurtiktir. Düşük kurtoza sahip dağılımlar (ince kuyruklar) platykurtiktir. |
Cimri. hata | Verilerin örnek ortalamasının (ortalama) gerçek popülasyon ortalamasından ne kadar uzak olduğuna ilişkin bir ölçü. |
Std. sapma | Ortalama etrafında bir dağılım ölçüsü. Düşük standart sapmayla, değerler genellikle ortalamaya yakındır. Yüksek standart sapma ile değer aralığı daha geniştir. |
Çarpıklık | Bir dağılımın asimetrisinin ölçüsü. Bir dağılım, sol ve sağ kenarları ayna görüntüsü olmadığında asimetriktir. Bir dağılımın sağ (ya da pozitif), sol (ya da negatif) ya da sıfır çarpıklık (simetrik dağılım) olabilir. |
Fark | Ortalama etrafında bir dağılım ölçüsü. Bu, popülasyon ortalamasından veya örnek ortalamasından rastgele bir değişkenin kare sapmasının beklentisi. |
Veri sınıfları
Veri sınıfı atamaları için aşağıdaki bilgiler gösterilir:
Kolona atanan veri sınıfı olan seçilen veri sınıfı. El ile değiştirmediğiniz sürece, saptanan veri sınıfıyla aynıdır.
Çözümlemede saptandığı şekilde sütun için en iyi eşleşen veri sınıfı olan saptanan veri sınıfı.
Atanan veri sınıfının güven puanı . Bir veri sınıfının güveni, veri sınıfıyla eşleşen boş olmayan değerlerin yüzdesidir. Birkaç veri sınıfı, bir kolon düzeyinde saptanan ve atanan daha soysal tanıtıcılardır. Daha belirli bir veri sınıfı bir değer düzeyinde tanımlanamadığında bu veri sınıfları atanır. Soysal tanıtıcılar her zaman %100 güvene sahip olur ve şu veri sınıflarını içerir: Kod, Tarih, Tanıtıcı, Gösterge, Miktar ve Metin.
Çözümleme sırasında saptanan tüm veri sınıflarının, en iyi eşleşme (en yüksek güven) en üstte olacak şekilde alçalan düzende listesidir. Her veri sınıfı için güven puanı ve veri sınıfı önceliği gösterilir.
Saptanan her veri sınıfı için, veri sınıfının kapsamına bağlı olarak ek bilgiler gösterilebilir.
Eşleştirmeyi kolon verilerine dayalı olarak yapılan veri sınıflarında, bu belirli veri sınıfına ilişkin ölçütlerle eşleşen kolon değerleri listelenir. Sayı (%) sütunu, örnekteki kaç satırın belirli bir değer içerdiğini ve bu değere sahip satırların yüzdesini gösterir. Buna ek olarak, eşleşen her değerin biçimi gösterilir.
Eşleştirmeyi kolon adına dayalı olarak yapılan veri sınıfları için ve genel veri sınıfları için Kod, Tarih, Tanıtıcı, Gösterge, Miktar ve Metin için ek bilgi gösterilmez. Bu veri sınıfları, veri değerleri belirli bir veri sınıfının tanımlanmasına izin vermediğinde kullanılır. Soysal veri sınıfları her zaman %100 güvene sahip olur.
Daha fazla bilgi için bkz. Veri sınıfları.
Biçimler
Kolon için çıkarılan biçim, saptanan biçim sayısı ve saptanan tüm biçimlerin listesi gösterilir.
Biçim, bir veri değerinin karakter kalıbını temsil eder. Karakterin büyüklüğüne bağlı olarak, her alfabetik karakter büyük ya da küçük harf A ile gösterilir. Her sayısal karakter 9 sayısıyla gösterilir. Boşluklar ve özel karakterler göründükleri gibi gösterilir.
Algılanan biçimler listesi, belirli bir biçime sahip kaç değer bulunduğunu ve bu biçime sahip değerlerin genel yüzdesini gösterir. Kalıpla eşleşen değerleri görmek için bir girdiyi tıklatın. Değer listesinin tüm değerleri içermemesi ya da boş olması için yalnızca 100 değerin görüntülenmek üzere alındığını unutmayın.
Tipler
Aşağıdaki bilgiler gösterilir:
- Veri kaynağında tanımlandığı şekilde sütunun veri tipi
- Çözümleme yoluyla çıkarılan veri tipi
- O kolondaki bir değerin uzunluk alt sınırı
- O kolondaki bir değerin uzunluk üst sınırı
- Kolon değerlerinin ortalama uzunluğu
- Sütundaki tüm veri tiplerinin bir listesi
Veri tipi, kolonun tamsayı, dizgi ya da tarih tipi gibi belirli tipteki verileri içerip içermediğini açıklar.
Genellikle, kolon değerlerinin çoğu ya da tümü aynı veri tipinde olduğundan, bir kolonun en uygun veri tipi açıktır. Ancak, liste birden çok farklı veri tipi içerdiğinde, çıkarılan veri tipine ilişkin sıklık sayısını denetleyin. Bu sıklık sayısı çizelgenin satır sayısıyla göreli olarak düşükse, geçersiz veri değerleri yanlış veri tipinin çıkarılmasına neden olabilir.
Daha fazla bilgi
Üst konu: Meta veri zenginleştirme sonuçlarını gözden geçirme