0 / 0
Go back to the English version of the documentation
Kolon düzeyi tanıtım bilgileri
Last updated: 03 Ağu 2023
Kolon düzeyi tanıtım bilgileri

Her profil birkaç bilgi düzeyi içerir.

İstatistikler

İstatistikler sekmesi, bir sütundaki analiz edilen verilerin yapısının ve bu yapısal bilgilere ilişkin farklı görselleştirme tiplerinin bir özetini sağlar. Tam olarak hangi bilgilerin gösterileceği, sütunun sürekli (nicel) ya da nominal (nitel) veriler içermesine bağlıdır.

Grafikler

Bir sütundaki veri tipine bağlı olarak, farklı görselleştirme tipleri arasında seçim yapabilirsiniz:

  • Nominal veriler:

    • Çubuk grafik
    • Orantı ya da pasta grafik
    • Pareto grafiği
  • Sürekli veriler:

    • Histogram grafiği
    • Kutu çizimi grafiği
    • Nicelik (Q-Q) çizim grafiği

Her veri tipi için bir dağıtım grafiği kullanılabilir. Dağıtım çizelgesi genellikle kolondaki ve sayılarındaki en sık değerleri (ya da aralıkları) listeler. Çizelge, biçimler, tipler ya da veri sınıfları gibi diğer bilgileri de gösterebilir. Belirli bir değeri içeren tek tek satırları görüntülemek için Satırları göster' i tıklatın.

Çubuk ya da histogram grafiklerinde, değerlerinin şu anda bakmakta olduğunuz sütunun her bir değeri içinde nasıl dağıtıldığını görmek için bir şablon sütunu seçme seçeneğiniz vardır. Örneğin, satılan fırınlanmış ürünlere sahip sütununuz varsa ve bir üst katman sütun sezonu seçerseniz, belirli bir fırın ürünü satışlarının sezon başına nasıl değiştiğini görebilirsiniz. Şablon sütunu için, veri varlığında nominal veriler içeren tüm sütunlardan seçim yapabilirsiniz.

Özet

Özet döşemesi, seçilen sütundaki verilerle ilgili genel bilgi sağlar:

  • Veri kaynağında tanımlandığı şekilde sütunun veri tipi
  • Çözümleme yoluyla çıkarılan veri tipi
  • Bu sütundaki farklı veri biçimlerinin sayısı
  • Bu kolon için en sık çıkarsanan biçim
  • Atanan veri sınıfı
  • Veri ölçümü tipi (nominal ya da continuous)
  • Denetlenen satır sayısı (yani değer sayısı)

Temel istatistikler

Temel istatistikler, seçilen kolondaki değerlerin dağılımı ve dağılımı hakkında genel bilgi sağlar. Bir sütunun veri biçimine bağlı olarak istatistikler biraz değişir. Örneğin, tamsayı veri tipindeki bir kolona ilişkin istatistiklerin alt sınır, üst sınır ve ortalama değerleri varken, veri tipi dizgisinin bir kolonuna ilişkin istatistiklerin uzunluk alt sınırı, uzunluk üst sınırı ve ortalama uzunluk değerleri vardır.

Ölçün Açıklama Bu tip veriler için gösterilir
Nicelik Boşluklar ve boş değerler de içinde olmak üzere, kolondaki benzersiz ayrı değerlerin yüzdesi. Bir sütundaki toplam ayrı değer sayısı, o sütundaki toplam değer sayısına bölünerek hesaplanır. Sürekli
DISTINCT Kolona ilişkin örneklenmiş verilerde var olan farklı değerlerin sayısı. Sürekli
Entropi Bu değer, sütunun ne kadar bilgi tuttuğunu ölçer. Daha genel olarak, entropi bir olaydaki ve rasgele değişkendeki bilgileri ölçmek için kullanılabilir. Bu miktar, yalnızca değişkende var olan farklı değerlerin sayısına değil, aynı zamanda beklenmeyen değerlerin miktarına göre de tahmin edilir. Nominal
Gini Belirli bir elementin rastgele seçildiğinde yanlış sınıflandırılması ve Gini katsayısının varyasyonu olasılığı derecesi. Gini dizini 0 ile 1 arasında değişebilir; burada 0, tüm öğelerin belirli bir sınıfa ait olduğunu ya da yalnızca bir sınıfın var olduğunu gösterir. Gini dizini 1, tüm öğelerin çeşitli sınıflara rasgele dağıtıldığını gösterir. 0.5 değeri, öğelerin bazı sınıflara eşit olarak dağıtıldığını gösterir. Nominal
Maksimum Sayısal bir değişkenin en büyük değeri Sürekli
Ortalama Aritmetik ortalama, toplamın değer sayısına bölünmesi Sürekli
Ortalama Değerlerin yarısının düştüğü değerin üstündeki ve altındaki değer. Çift sayıda değer varsa, medyan, sıralandıklarında iki orta değerin ortalamasıdır. Medyan aykırı değerler tarafından etkilenmez Sürekli
En Az Sayısal bir değişkenin en küçük değeri Sürekli
Eksik Örnekteki değer olmayan satırların sayısı. Sürekli
Nominal
Kip Sütundaki en sık görülen değer. Eşit sıklıkta birden çok değer oluşursa, bunların her biri bir kiptir. Sürekli
Nominal
Aykırı Değerler Sütun verilerindeki, sütundaki diğer değerlerin çoğundan uzak olan değerlerin sayısı. Sürekli
Aralık Sütundaki maksimum ve minimum değerler arasındaki fark. Sürekli
Toplam Değerleri olan tüm sütunlarda değerlerin toplamı ya da toplamı. Sürekli
Benzersiz Yürürlükteki kolonda yalnızca bir kez görüntülenen ayrı değerlerin sayısı. Sürekli
Nominal
Geçerli Geçerli olarak kabul edilen değerlerin sayısı; bu, boş ya da eksik sütun değerlerinin dışlandığı anlamına gelir. Sürekli
Nominal

Gelişmiş öngörüler

Seçilen sütundaki değerlerin dağılımı ve dağılımı hakkında ayrıntılı bilgi. Bu bilgiler yalnızca sürekli veriler için gösterilir:

Ölçün Açıklama
25th yüzdelik Saptanan değerlerin %75 'inin düştüğü %25 ve üzeri değerin altında yer alan değer.
75th yüzdelik Algılanan değerlerin %25 'inin ve %75 'inin düştüğü değerin üzerinde.
Kurtoz Aykırı değerlerin bulunduğu kapsamın ölçüsüdür (bir dağılımınuyarlılığı ). Aşırı kurtoz, normal dağılıma göre bir dağılımın kuyruklanmasıdır. Normal bir dağılım için, kurtoz istatistiğinin değeri sıfırdır. Pozitif kurtoz, verilerin normal bir dağılımdan daha fazla aykırı değer gösterdiğini gösterir. Negatif kurtoz, verilerin normal dağılıma göre daha az aykırı değerler gösterdiğini gösterir.

Orta kurutmalı (orta kuyruklu) dağılımlar mezokurtiktir. Düşük kurtoza sahip dağılımlar (ince kuyruklar) platykurtiktir.
Cimri. hata Verilerin örnek ortalamasının (ortalama) gerçek popülasyon ortalamasından ne kadar uzak olduğuna ilişkin bir ölçü.
Std. sapma Ortalama etrafında bir dağılım ölçüsü. Düşük standart sapmayla, değerler genellikle ortalamaya yakındır. Yüksek standart sapma ile değer aralığı daha geniştir.
Çarpıklık Bir dağılımın asimetrisinin ölçüsü. Bir dağılım, sol ve sağ kenarları ayna görüntüsü olmadığında asimetriktir. Bir dağılımın sağ (ya da pozitif), sol (ya da negatif) ya da sıfır çarpıklık (simetrik dağılım) olabilir.
Fark Ortalama etrafında bir dağılım ölçüsü. Bu, popülasyon ortalamasından veya örnek ortalamasından rastgele bir değişkenin kare sapmasının beklentisi.

Veri sınıfları

Veri sınıfı atamaları için aşağıdaki bilgiler gösterilir:

  • Kolona atanan veri sınıfı olan seçilen veri sınıfı. El ile değiştirmediğiniz sürece, saptanan veri sınıfıyla aynıdır.

  • Çözümlemede saptandığı şekilde sütun için en iyi eşleşen veri sınıfı olan saptanan veri sınıfı.

  • Atanan veri sınıfının güven puanı . Bir veri sınıfının güveni, veri sınıfıyla eşleşen boş olmayan değerlerin yüzdesidir. Birkaç veri sınıfı, bir kolon düzeyinde saptanan ve atanan daha soysal tanıtıcılardır. Daha belirli bir veri sınıfı bir değer düzeyinde tanımlanamadığında bu veri sınıfları atanır. Soysal tanıtıcılar her zaman %100 güvene sahip olur ve şu veri sınıflarını içerir: Kod, Tarih, Tanıtıcı, Gösterge, Miktar ve Metin.

  • Çözümleme sırasında saptanan tüm veri sınıflarının, en iyi eşleşme (en yüksek güven) en üstte olacak şekilde alçalan düzende listesidir. Her veri sınıfı için güven puanı ve veri sınıfı önceliği gösterilir.

  • Saptanan her veri sınıfı için, veri sınıfının kapsamına bağlı olarak ek bilgiler gösterilebilir.

    Eşleştirmeyi kolon verilerine dayalı olarak yapılan veri sınıflarında, bu belirli veri sınıfına ilişkin ölçütlerle eşleşen kolon değerleri listelenir. Sayı (%) sütunu, örnekteki kaç satırın belirli bir değer içerdiğini ve bu değere sahip satırların yüzdesini gösterir. Buna ek olarak, eşleşen her değerin biçimi gösterilir.

    Eşleştirmeyi kolon adına dayalı olarak yapılan veri sınıfları için ve genel veri sınıfları için Kod, Tarih, Tanıtıcı, Gösterge, Miktar ve Metin için ek bilgi gösterilmez. Bu veri sınıfları, veri değerleri belirli bir veri sınıfının tanımlanmasına izin vermediğinde kullanılır. Soysal veri sınıfları her zaman %100 güvene sahip olur.

Daha fazla bilgi için bkz. Veri sınıfları.

Biçimler

Kolon için çıkarılan biçim, saptanan biçim sayısı ve saptanan tüm biçimlerin listesi gösterilir.

Biçim, bir veri değerinin karakter kalıbını temsil eder. Karakterin büyüklüğüne bağlı olarak, her alfabetik karakter büyük ya da küçük harf A ile gösterilir. Her sayısal karakter 9 sayısıyla gösterilir. Boşluklar ve özel karakterler göründükleri gibi gösterilir.

Algılanan biçimler listesi, belirli bir biçime sahip kaç değer bulunduğunu ve bu biçime sahip değerlerin genel yüzdesini gösterir. Kalıpla eşleşen değerleri görmek için bir girdiyi tıklatın. Değer listesinin tüm değerleri içermemesi ya da boş olması için yalnızca 100 değerin görüntülenmek üzere alındığını unutmayın.

Tipler

Aşağıdaki bilgiler gösterilir:

  • Veri kaynağında tanımlandığı şekilde sütunun veri tipi
  • Çözümleme yoluyla çıkarılan veri tipi
  • O kolondaki bir değerin uzunluk alt sınırı
  • O kolondaki bir değerin uzunluk üst sınırı
  • Kolon değerlerinin ortalama uzunluğu
  • Sütundaki tüm veri tiplerinin bir listesi

Veri tipi, kolonun tamsayı, dizgi ya da tarih tipi gibi belirli tipteki verileri içerip içermediğini açıklar.

Genellikle, kolon değerlerinin çoğu ya da tümü aynı veri tipinde olduğundan, bir kolonun en uygun veri tipi açıktır. Ancak, liste birden çok farklı veri tipi içerdiğinde, çıkarılan veri tipine ilişkin sıklık sayısını denetleyin. Bu sıklık sayısı çizelgenin satır sayısıyla göreli olarak düşükse, geçersiz veri değerleri yanlış veri tipinin çıkarılmasına neden olabilir.

Daha fazla bilgi

Üst konu: Meta veri zenginleştirme sonuçlarını gözden geçirme

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more