0 / 0
Go back to the English version of the documentation
Veri varlıklarının profilleri

Veri varlıklarının profilleri

Bir varlık profili, varlık içeriğiyle ilgili oluşturulan meta verileri ve istatistikleri içerir ve veri kalitesini artırmak için hangi işlemlerin yapılması gerektiğini anlamanıza yardımcı olur. Profili bir varlığın Profil sayfasında görebilirsiniz.

İlişkisel ya da yapısal veriler içeren veri varlıkları için profiller oluşturulabilir.

Gereksinimler ve kısıtlamalar

Aşağıdaki koşullar altında varlıkların profilini görüntüleyebilirsiniz.

Gerekli hizmet
Watson Knowledge Catalog hizmeti.
Gerekli izinler
Bu sayfayı görüntülemek için bir proje ya da katalogda herhangi bir rolünüz olabilir.
Bir profil oluşturmak ya da güncellemek ya da bir projede meta veri zenginleştirmesini çalıştırmak için projede Yönetici ya da Düzenleyici rolünüz olmalıdır.
Bir katalogda profil oluşturmak ya da güncellemek için, katalogda Yönetici rolüne sahip olmanız ya da Düzenleyici rolüne sahip olmanız ve bir varlık sahibi ya da varlık üyesi olmanız gerekir.
Çalışma Alanları
Bu çalışma alanlarında varlık profilini görüntüleyebilirsiniz:
  • Projeler
  • Kataloglar
Varlık tipleri
Bu varlık tiplerinin bir profili vardır:
  • Cloudant hariç olmak üzere, veri kaynaklarına bağlantıdan ilişkisel veya ilişkisel olmayan veritabanlarından veri varlıkları

  • Bölümlenmiş bir veri kümesinin birden çok dosyadan oluştuğu ve yerel dosya sisteminden ya da dosya tabanlı bağlantılardan veri kaynaklarına yüklenen tek bir klasörle temsil edildiği bölümlenmiş veri kümelerindeki veri varlıkları

  • Yerel dosya sisteminden karşıya yüklenen dosyalardan ya da dosya tabanlı bağlantılardan veri kaynaklarına şu biçimlerde veri varlıkları:

    • CSV
    • XLS, XLSM, XLSX (Yalnızca çalışma defterindeki ilk sayfa profillenir.)
    • TSV
    • Avro
    • Parke

    Ancak, veri varlıkları bunlara belirtik olarak başvurmadığında, yapısal veri dosyalarının profili oluşturulmaz; örneğin, aşağıdaki durumlarda:

    • Dosyalar bağlı bir klasör varlığı içinde. Bağlı bir klasör varlığından erişilebilen dosyalar varlık olarak kabul edilmez ve profillenmez.
    • Dosyalar bir arşiv dosyası içinde. Arşiv dosyasına veri varlığı tarafından başvurulduğundan sıkıştırılmış dosyaların profili oluşturulmaz.

Profil oluşturma yolları

Varlık profilleri farklı şekillerde oluşturulabilir:

  • Yönetilen kataloglarda, veri varlıkları aşağıdaki kural dışı durumlar dışında kataloğa eklendiğinde tek tek veri varlıklarına ilişkin profiller otomatik olarak oluşturulur:

    • Katalog için otomatik profil oluşturmayı devre dışı bırakdınız.
    • Varlık, kişisel kimlik bilgilerini kullanacak şekilde yapılandırılmış bir bağlantıdan geliyor.
    • Varlık, yayınlanmadan önce meta veri zenginleştirmesi aracılığıyla profillendi. Bu tür varlıkların zaten varlıkla birlikte kataloğa eklenen bir profili var.
  • Veri koruma kuralı uygulaması olmayan projelerde ve kataloglarda, tek tek veri varlıkları için el ile profil oluşturabilirsiniz . Varlık daha önce profillenmediyse, yönetilen bir katalogda el ile bir profil de oluşturabilirsiniz.

  • Projelerde, bir kerede büyük veri varlıkları kümelerinin profilini oluşturmak için bir meta veri zenginleştirme varlığı oluşturabilir ve çalıştırabilirsiniz. Bu varlık profilleri projede kullanılabilir. Zenginleştirilmiş varlıkları profilleriyle birlikte herhangi bir katalog tipinde yayınlayabilirsiniz. Bkz. Meta veri zenginleştirmeyi yönetme.

Bir hesap içinde, bir varlığı bir projeden bir kataloğa yayınladığınızda ya da bir katalogdan bir projeye eklediğinizde, profil oluşturma sonuçları veri varlığıyla birlikte kopyalanır. Ancak, katalog ve proje farklı hesaplara aitse, kullanılabilir veri sınıfları kümesi farklı olabileceği için profiller kopyalanmaz.

Bir projedeki ya da katalogdaki varlığın Profil sayfasından tek bir varlık profilini güncelleyebilirsiniz. Meta veri zenginleştirmesinde yer alan bir veri varlığının profilini el ile güncellerseniz, profil ve analiz bilgileri de ilgili zenginleştirme sonuçlarına yansıtılır. Yeni zenginleştirme sonuçları yayınlandığında profiller de güncellenir.

Var olan bir tanıtımı güncellediğinizde, tanıtımın içereceği veri sınıflarını değiştirebilirsiniz. Daha önce bir sütuna atanmış bir veri sınıfını dışladıysanız, güncellenen profil, farklı bir veri sınıfı atanmamışsa, ilgili sütun için Sınıf hariç tutuldu (profilden) seçeneğini gösterir. Atanmış veri sınıfına erişiminiz olmadığı sütunlar için Sınıf dışlandı (profilden) seçeneğini de görürsünüz.

Profil oluşturma sırasında neler analiz edilir?

Bir projedeki ya da katalogdaki Profil sayfasından bir varlık profili yaratır ya da güncellerse, sütunlar analiz edilir.

Bir projede ya da katalogda tek bir varlık profili oluşturulduğunda, profil varsayılan olarak ilk 5.000 veri satırına dayalı olarak oluşturulur. Veri varlığının 250 'den fazla sütunu varsa, profil ilk 1000 veri satırına dayalı olarak oluşturulur. Profil, meta veri zenginleştirme yoluyla oluşturulursa, örnekleme meta veri zenginleştirme ayarları tarafından belirlenir.

Verilerinizin yapısını ve içeriğini tanımlamak ve sınıflandırmak için, çözümleme aşağıdaki görevleri içerir:

  • Analiz edilen her sütunun verilerine ilişkin istatistikleri hesaplayın.
  • Kolonlar ve veri tipleri dağılımı için veri tiplerini hesaplayın.
  • Sütun ve biçim dağılımı için veri biçimlerini hesaplar.
  • Verileri sınıflandırın ve sütunlar için veri sınıfı adaylarını hesaplayın.
  • Frekans dağılımlarını yakalayın.

Profil bilgileri

Bir veri varlığının profili, veri varlığında her bir sütuna ilişkin bilgileri gösterir.

Profil sekmesi, bazı genel bilgiler ve çözümleme sonuçlarına genel bakış sağlar:

  • Profil ne zaman oluşturuldu ya da en son güncelleştirildi.

  • Çözümlenen sütun ve satır sayısı.

  • Her kolon için çıkarsanan veri sınıfı ve o veri sınıfı için güven. Veri sınıfları , sütundaki verilerin içeriğini açıklar: örneğin, şehir, hesap numarası ya da kredi kartı numarası. Veri sınıfları, veri koruma kurallarıyla verileri maskelemek ya da veri varlıklarına erişimi kısıtlamak için kullanılabilir. Veri sınıfları, varlığın Genel Bakış sayfasında ve Profil sayfasında her sütun için görüntülenir.

    Bir veri sınıfının güveni, veri sınıfıyla eşleşen boş olmayan değerlerin yüzdesidir.

    Birkaç veri sınıfı, bir kolon düzeyinde saptanan ve atanan daha soysal tanıtıcılardır. Daha belirli bir veri sınıfı bir değer düzeyinde tanımlanamadığında bu veri sınıfları atanır. Soysal tanıtıcılar her zaman %100 güvenlidir ve şu veri sınıflarını içerir: kod, tarih, tanıtıcı, gösterge, miktar ve metin.

  • Her bir sütun için eşleşen, eşleşmeyen ya da eksik verilerin yüzdesi.

  • Bir sütunda tanımlanan tüm değerler için sıklık dağılımı.

  • Ayrı değerlerin sayısı, benzersiz değerlerin yüzdesi, alt sınır, üst sınır ya da ortalama ve bazen de o sütundaki standart sapma gibi her bir sütuna ilişkin verilerle ilgili istatistikler. Ayrı değer sayısı, kolona ilişkin örneklenmiş verilerde kaç farklı değerin bulunduğunu gösterir. Benzersiz değerlerin yüzdesi, sütunda yalnızca bir kez görüntülenen ayrı değerlerin yüzdesini gösterir.

    Bir sütunun veri biçimine bağlı olarak istatistikler biraz değişir. Örneğin, tamsayı veri tipindeki bir kolona ilişkin istatistikler minimum, maksimum ve ortalama değerlere ve standart bir sapma değerine sahipken, veri tipindeki bir kolona ilişkin istatistikler minimum uzunluk, maksimum uzunluk ve ortalama uzunluk değerlerine sahiptir.

Kolon adını tıklattığınızda, kolon verileriyle ilgili daha ayrıntılı bilgi edinilebilir. Bkz. Ayrıntılı profil oluşturma sonuçları.

Daha fazla bilgi

Üst konu: Varlık tipleri ve özellikleri

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more