Translation not up to date
Otomatik terim atama, iş terimlerinin veri varlıklarıyla ve varlık sütunlarıyla otomatik olarak eşlenmesi sürecidir. Terimler, meta veri zenginleştirmesinin bir parçası olarak otomatik olarak veri varlıklarına ve varlık sütunlarına atanabilir.
Bir projedeki ya da katalogdaki veri varlığı özelliklerini düzenleyerek ya da zenginleştirme sonuçlarıyla çalışırken iş terimlerini el ile de atayabilirsiniz.
Otomatik terim ataması meta veri zenginleştirmesinin bir parçası olarak yapılandırılırsa, bu tür atamalar birkaç yöntem tarafından oluşturulur. Bu yöntemler, atanacak terimler için de öneriler oluşturur.
Terimler, güven düzeyine göre atanır. Başlangıçta bu ilişkilendirmeler, etki alanı uzmanlarının ve temsilcilerin manuel olarak inceleyip atayabileceği adaylar olarak temsil edilir. Atanan ya da önerilen bir terimin güvenilirliği yüzde değeri olarak gösterilir. Bu değer, genel güvenitemsil eder. Bkz. Genel güvenin nasıl hesaplandığını. Bir terim önerildiğinde ya da otomatik olarak atandığında için güven düzeyi, projenin zenginleştirme ayarlarına göre belirlenir. Aşılacak varsayılan güven düzeyi, dönem önerileri için %75 ve aday koşullarının otomatik olarak atanması için %90 'dır. Bkz. Varsayılan zenginleştirme ayarları. Bir proje yöneticisi bu ayarları özelleştirebilir.
Yalnızca yayınlanan iş koşulları atanabilir. Atanan terimler veri sınıfı atamasını etkilemez.
Terim atama yöntemleri
Kullanılabilir terim atama yöntemlerinin tümünü ya da bir alt kümesini kullanabilirsiniz.
Dilbilimsel ad eşleştirme
Dilbilimsel ad eşleştirme yöntemi, terimin adı ya da kısaltmaları ile veri varlığının ya da sütununun adı arasındaki benzerliğe dayanmaktadır. Örneğin, bir sütun CREDNUM, iki ad arasındaki benzerlik nedeniyle bir terim Kredi Kartı Numarası ile ilişkilendirilebilir. Dilbilimsel ad eşleştirme, yalnızca terim adları ve kısaltmaları olan veri varlığı ve sütun adlarıyla eşleşir. Açıklamalar dikkate alınmaz. ML tabanlı terim ataması, adları ve açıklamaları işler.
Veri sınıfı atamasına dayalı
Sınıfa dayalı atama yöntemi, veri sınıflandırmasına dayalı atamalar oluşturur. Sütun çözümlemesi sonucu ya da el ile bir varlık sütunu için bir veri sınıfı seçildiyse ve bu veri sınıfı bir ya da daha fazla iş terimine bağlıysa, bu terimler ilgili eşikleri aşarsa önerilir ya da atanır. Terim güven düzeyi, terimin bağlantılı olduğu veri sınıfının güvencesiyle aynıdır. Örneğin, veri sınıfı ve terimi bağlıysa, %90 güvenilen bir e-posta adresi olarak sınıflandırılan COL1 sütunu, E-posta Adresi terimine atanabilir. Sütun adı ile terim arasında dilsel benzerlik olmadığından, dilsel ad eşleştirme yöntemi bu ilişkilendirmeyi gerçekleştiremez.
Sınıf tabanlı atama yöntemini etkinleştirmek için, uygun bağlantı yüksek kaliteli sonuçlar için önemli bir önkoşul olduğundan, terim atamasını çalıştırmadan önce veri sınıfından terim bağlantısına gözden geçirilmesi önemlidir.
Önceden tanımlanmış veri sınıfları Kod, Tanıtıcı, Tarih, Metin, Gösterge, Miktar ve Boole ile bağlantılı iş terimleri, terim ataması için dikkate alınmaz.
Makine öğrenimi
Terim atamaları oluşturmak için makine öğrenimi (ML) yöntemi, yerleşik denetimli makine öğrenimi modellerini kullanır. Bu modeller, terim atamaları için bir model ve terim kaldırmaları için bir model oluşturur.
ML modelleri, yayınlanan terimlere ve bir projedeki ya da bir katalogdaki eğitim verilerinde bulunan dönem atamalarına dayalı olarak eğitilir. Bkz. Makine öğrenimi modelleri için eğitim verileri. Herhangi bir terim ataması yoksa, terim atama modeli eğitimi, terimlerin ve veri varlıklarının veya sütunlarının adlarındaki ve açıklamalarındaki sözcüklerin dilsel benzerliğine odaklanır. Bu benzerliğe dayalı olarak terimler atanabilir. Artan sayıda gözden geçirilmiş atama ile, benzer özelliklere sahip sütunlarda terim atamaları kullanılabilir olduğundan terimler dilsel benzerlikten bağımsız olarak atanabilir.
Reddedilen koşullar
Meta veri zenginleştirme sonuçlarında terim atamalarını gözden geçirdiğinizde, bir veri varlığı için doğru olmadığını düşündüğünüzde terimleri bulabilirsiniz. Bu tür terimleri kaldırarak olumsuz geribildirim sunabilirsiniz. Bu tür koşullar reddedilmiş olarak kabul edilir. Eğitim kapsamı proje ise, otomatik dönem atamasını yeniden çalıştırdığınızda, dönem atamalarının güven puanları bu reddedilen koşullara göre ayarlanabilir. Seçilen her bir terim atama yönteminin döndürdüğü bireysel güven değerleri, bir terimin genel güven puanının hesaplanması için bu negatif güven değeriyle ayarlanır. Bkz. Genel güven puanının nasıl hesaplandığını.
Makine öğrenimi modelleri için eğitim verileri
Her proje için, otomatik terim ataması için kullanılan yerleşik ML modelinin projedeki varlıklarla mı, yoksa seçtiğiniz bir katalogdaki varlıklarla mı eğitilip eğitilmediğini varsayılan zenginleştirme ayarlarında tanımlayabilirsiniz. Reddetme temelinde güven puanlarının ayarlanması yalnızca eğitim kapsamı proje olduğunda kullanılabilir.
Varsayılan ayar, proje içindeki modellerin eğitilmesidir. Bu durumda modeller, projede incelendi olarak işaretlenen sütunlara ilişkin olarak yayınlanan iş terimleri ve kullanılabilir terim atamaları veya reddedilmeleri ile eğitilir.
Eğitim kapsamı olarak bir katalog seçtiğinizde, dönem atamalarına ilişkin model, yayınlanan iş koşullarıyla ve seçilen katalogda bulunan tüm terim atamalarıyla eğitilir. Terim reddetme modeli, bir katalogdaki varlıklarla eğitilemez.
Modeller ne zaman eğitilir?
Bir meta veri zenginleştirme işi başlatıldığında yerleşik ML modelleri için model eğitimi tetiklenir ve aşağıdaki koşullardan biri geçerlidir:
Henüz kullanılabilir bir model yok.
Modelin en son eğitilmesinden bu yana yeni bir iş terimi yaratıldı ya da var olan bir terim güncellendi. Sürenin herhangi bir varlığa ya da sütuna atanması gerekmez.
Eğitim kapsamı projesi: Modelin son eğitilmesinden bu yana en az 21 sütun incelendi olarak işaretlendi.
Eğitim kapsamı kataloğu: Modelin son eğitilmesinden bu yana terimler atandığı ya da kaldırıldığı için, seçilen katalogdaki en az 21 sütuna ilişkin atamalar değişti.
Son eğitim başarılı bir şekilde ya da makul bir süre içinde tamamlanmadı.
Güven puanı ayarlamaları için modelin ilk kullanımıyla ilgili herhangi bir terim reddi bilgisi yoksa, bu modele ilişkin ilk eğitim daha sonra gerçekleşir; bu da, reddedilen terimler hakkında daha sonraki bir model eğitim döngüsünde bilgi sağlandığında eğitildiği anlamına gelir.
Genel güvenin nasıl hesaplandığı
Bir terimi bir veri varlığıyla ilişkilendiren bir yöntem, yapılandırılabilir bir minimum ve 1 arasında sayısal bir değer olan güvendeğerini hesaplar. Değer alt sınırı, varsayılan zenginleştirme ayarlarındayapılandırılabilen terim ataması için öneri eşiği ile tanımlanır.
Atanan ya da önerilen bir terimin güvenilirliği yüzde değeri olarak gösterilir. Bu değer, genel güvenitemsil eder. Genel güven, seçilen terim atama yöntemleri tarafından döndürülen güven değerleri üst sınırıdır ve terim kaldırma için ML modelinin döndürdüğü herhangi bir negatif güven değerine göre ayarlanabilir.
Seçilen terim atama yöntemlerinin döndürdüğü güven değerlerinin önceden reddedilen iş koşullarına göre ayarlanıp ayarlanmayacağını seçebilirsiniz.
Örneğin:
Tüm yöntemlerin etkinleştirildiği varsayılarak, bir sütun ADDRESS ve terim Ana Adresi için güven değerleri:
Linguistic name matching: 0.5
Class-based assignment: 0.4
ML-based assignment: 0.3
ML model for rejections: -0.4
Her yöntem için gerçek güven değeri, reddedilen terimler için döndürülen güven değeri çıkarılarak hesaplanır:
Linguistic name matching: 0.5 - 0.4 = 0.1
Class-based assignment: 0.4 - 0.4 = 0
ML-based assignment: 0.3 - 0.4 = -0.1
Bir yöntem için hesaplanan en yüksek değer olduğundan, genel güven 0.1 ' dir.
Bir terim için aynı güven değeri birkaç yöntem için hesaplandıysa, otomatik olarak yalnızca bir tane atanır. Bu tür bir terimin seçildiği sıra aşağıdaki gibidir:
- Veri sınıfı tabanlı atama yöntemi tarafından bulunan terim
- ML yöntemiyle bulunan terim
- Ad eşleştirme yöntemiyle bulunan terim
Yeni analiz sonuçları var olan terim atamalarını nasıl günceller?
Bir zenginleştirmeyi yeniden çalıştırdığınızda, yeni bir çözümleme sonucu terim atamalarını aşağıdaki gibi günceller:
Terim atamasının tipi | Veri varlığı ya da sütunu gözden geçirildi | Veri varlığı ya da sütunu incelenmedi |
---|---|---|
El ile atanan terimler | Koşullar değişmeden kalır. | Koşullar değişmeden kalır. |
Reddedilen koşullar | Koşullar değişmeden kalır. | Koşullar değişmeden kalır. |
Önerilen terimler | Koşullar silinir ve yeni önerilen terimlerle değiştirilir. | Koşullar silinir ve yeni önerilen terimlerle değiştirilir. |
Otomatik olarak atanan terimler | Var olan koşullar değişmeden kalır. Yeni saptanan terimler önerilen terimler olarak eklenir. | Var olan terim atamaları güncellenir. |
Daha fazla bilgi
Üst konu: Meta veri zenginleştirme sonuçları