Translation not up to date
Veri varlıklarının profilleri
Bir varlık profili, varlık içeriğiyle ilgili oluşturulan meta verileri ve istatistikleri içerir ve veri kalitesini artırmak için hangi işlemlerin yapılması gerektiğini anlamanıza yardımcı olur. Profili bir varlığın Profil sayfasında görebilirsiniz.
İlişkisel ya da yapısal veriler içeren veri varlıkları için profiller oluşturulabilir.
- Gereksinimler ve kısıtlamalar
- Tanıtım yaratmanın yolları
- Profil oluşturma sırasında neler çözümlenir?
- Profil bilgileri
Gereksinimler ve kısıtlamalar
Aşağıdaki koşullar altında varlıkların profilini görüntüleyebilirsiniz.
- Gerekli hizmet
- Watson Knowledge Catalog hizmeti.
- Gerekli izinler
- Bu sayfayı görüntülemek için bir proje ya da katalogda herhangi bir rolünüz olabilir.
- Bir profil oluşturmak ya da güncellemek ya da bir projede meta veri zenginleştirmesini çalıştırmak için projede Yönetici ya da Düzenleyici rolünüz olmalıdır.
- Bir katalogda profil oluşturmak ya da güncellemek için, katalogda Yönetici rolüne sahip olmanız ya da Düzenleyici rolüne sahip olmanız ve bir varlık sahibi ya da varlık üyesi olmanız gerekir.
- Çalışma Alanları
- Bu çalışma alanlarında varlık profilini görüntüleyebilirsiniz:
- Projeler
- Kataloglar
- Varlık tipleri
- Bu varlık tiplerinin bir profili vardır:
Cloudant hariç olmak üzere, veri kaynaklarına bağlantıdan ilişkisel veya ilişkisel olmayan veritabanlarından veri varlıkları
Bölümlenmiş bir veri kümesinin birden çok dosyadan oluştuğu ve yerel dosya sisteminden ya da dosya tabanlı bağlantılardan veri kaynaklarına yüklenen tek bir klasörle temsil edildiği bölümlenmiş veri kümelerindeki veri varlıkları
Yerel dosya sisteminden karşıya yüklenen dosyalardan ya da dosya tabanlı bağlantılardan veri kaynaklarına şu biçimlerde veri varlıkları:
- CSV
- XLS, XLSM, XLSX (Yalnızca çalışma defterindeki ilk sayfa profillenir.)
- TSV
- Avro
- Parke
Ancak, veri varlıkları bunlara belirtik olarak başvurmadığında, yapısal veri dosyalarının profili oluşturulmaz; örneğin, aşağıdaki durumlarda:
- Dosyalar bağlı bir klasör varlığı içinde. Bağlı bir klasör varlığından erişilebilen dosyalar varlık olarak kabul edilmez ve profillenmez.
- Dosyalar bir arşiv dosyası içinde. Arşiv dosyasına veri varlığı tarafından başvurulduğundan sıkıştırılmış dosyaların profili oluşturulmaz.
Profil oluşturma yolları
Varlık profilleri farklı şekillerde oluşturulabilir:
Yönetilen kataloglarda, veri varlıkları aşağıdaki kural dışı durumlar dışında kataloğa eklendiğinde tek tek veri varlıklarına ilişkin profiller otomatik olarak oluşturulur:
- Katalog için otomatik profil oluşturmayı devre dışı bırakdınız.
- Varlık, kişisel kimlik bilgilerini kullanacak şekilde yapılandırılmış bir bağlantıdan geliyor.
- Varlık, yayınlanmadan önce meta veri zenginleştirmesi aracılığıyla profillendi. Bu tür varlıkların zaten varlıkla birlikte kataloğa eklenen bir profili var.
Veri koruma kuralı uygulaması olmayan projelerde ve kataloglarda, tek tek veri varlıkları için el ile profil oluşturabilirsiniz . Varlık daha önce profillenmediyse, yönetilen bir katalogda el ile bir profil de oluşturabilirsiniz.
Projelerde, bir kerede büyük veri varlıkları kümelerinin profilini oluşturmak için bir meta veri zenginleştirme varlığı oluşturabilir ve çalıştırabilirsiniz. Bu varlık profilleri projede kullanılabilir. Zenginleştirilmiş varlıkları profilleriyle birlikte herhangi bir katalog tipinde yayınlayabilirsiniz. Bkz. Meta veri zenginleştirmeyi yönetme.
Bir hesap içinde, bir varlığı bir projeden bir kataloğa yayınladığınızda ya da bir katalogdan bir projeye eklediğinizde, profil oluşturma sonuçları veri varlığıyla birlikte kopyalanır. Ancak, katalog ve proje farklı hesaplara aitse, kullanılabilir veri sınıfları kümesi farklı olabileceği için profiller kopyalanmaz.
Bir projedeki ya da katalogdaki varlığın Profil sayfasından tek bir varlık profilini güncelleyebilirsiniz. Meta veri zenginleştirmesinde yer alan bir veri varlığının profilini el ile güncellerseniz, profil ve analiz bilgileri de ilgili zenginleştirme sonuçlarına yansıtılır. Yeni zenginleştirme sonuçları yayınlandığında profiller de güncellenir.
Var olan bir tanıtımı güncellediğinizde, tanıtımın içereceği veri sınıflarını değiştirebilirsiniz. Daha önce bir sütuna atanmış bir veri sınıfını dışladıysanız, güncellenen profil, farklı bir veri sınıfı atanmamışsa, ilgili sütun için Sınıf hariç tutuldu (profilden) seçeneğini gösterir. Atanmış veri sınıfına erişiminiz olmadığı sütunlar için Sınıf dışlandı (profilden) seçeneğini de görürsünüz.
Profil oluşturma sırasında neler analiz edilir?
Bir projedeki ya da katalogdaki Profil sayfasından bir varlık profili yaratır ya da güncellerse, sütunlar analiz edilir.
Bir projede ya da katalogda tek bir varlık profili oluşturulduğunda, profil varsayılan olarak ilk 5.000 veri satırına dayalı olarak oluşturulur. Veri varlığının 250 'den fazla sütunu varsa, profil ilk 1000 veri satırına dayalı olarak oluşturulur. Profil, meta veri zenginleştirme yoluyla oluşturulursa, örnekleme meta veri zenginleştirme ayarları tarafından belirlenir.
Verilerinizin yapısını ve içeriğini tanımlamak ve sınıflandırmak için, çözümleme aşağıdaki görevleri içerir:
- Analiz edilen her sütunun verilerine ilişkin istatistikleri hesaplayın.
- Kolonlar ve veri tipleri dağılımı için veri tiplerini hesaplayın.
- Sütun ve biçim dağılımı için veri biçimlerini hesaplar.
- Verileri sınıflandırın ve sütunlar için veri sınıfı adaylarını hesaplayın.
- Frekans dağılımlarını yakalayın.
Profil bilgileri
Bir veri varlığının profili, veri varlığında her bir sütuna ilişkin bilgileri gösterir.
Profil sekmesi, bazı genel bilgiler ve çözümleme sonuçlarına genel bakış sağlar:
Profil ne zaman oluşturuldu ya da en son güncelleştirildi.
Çözümlenen sütun ve satır sayısı.
Her kolon için çıkarsanan veri sınıfı ve o veri sınıfı için güven. Veri sınıfları , sütundaki verilerin içeriğini açıklar: örneğin, şehir, hesap numarası ya da kredi kartı numarası. Veri sınıfları, veri koruma kurallarıyla verileri maskelemek ya da veri varlıklarına erişimi kısıtlamak için kullanılabilir. Veri sınıfları, varlığın Genel Bakış sayfasında ve Profil sayfasında her sütun için görüntülenir.
Bir veri sınıfının güveni, veri sınıfıyla eşleşen boş olmayan değerlerin yüzdesidir.
Birkaç veri sınıfı, bir kolon düzeyinde saptanan ve atanan daha soysal tanıtıcılardır. Daha belirli bir veri sınıfı bir değer düzeyinde tanımlanamadığında bu veri sınıfları atanır. Soysal tanıtıcılar her zaman %100 güvenlidir ve şu veri sınıflarını içerir: kod, tarih, tanıtıcı, gösterge, miktar ve metin.
Her bir sütun için eşleşen, eşleşmeyen ya da eksik verilerin yüzdesi.
Bir sütunda tanımlanan tüm değerler için sıklık dağılımı.
Ayrı değerlerin sayısı, benzersiz değerlerin yüzdesi, alt sınır, üst sınır ya da ortalama ve bazen de o sütundaki standart sapma gibi her bir sütuna ilişkin verilerle ilgili istatistikler. Ayrı değer sayısı, kolona ilişkin örneklenmiş verilerde kaç farklı değerin bulunduğunu gösterir. Benzersiz değerlerin yüzdesi, sütunda yalnızca bir kez görüntülenen ayrı değerlerin yüzdesini gösterir.
Bir sütunun veri biçimine bağlı olarak istatistikler biraz değişir. Örneğin, tamsayı veri tipindeki bir kolona ilişkin istatistikler minimum, maksimum ve ortalama değerlere ve standart bir sapma değerine sahipken, veri tipindeki bir kolona ilişkin istatistikler minimum uzunluk, maksimum uzunluk ve ortalama uzunluk değerlerine sahiptir.
Kolon adını tıklattığınızda, kolon verileriyle ilgili daha ayrıntılı bilgi edinilebilir. Bkz. Ayrıntılı profil oluşturma sonuçları.
Daha fazla bilgi
- Bir varlığın profilinin oluşturulması
- Meta veri zenginleştirmesinin yönetilmesi
- Önceden tanımlı veri sınıfları
- Ayrıntılı profil oluşturma sonuçları
- Maskeleme verileri
Üst konu: Varlık tipleri ve özellikleri