Translation not up to date
Gelişmiş bir özelleştirme düzeyi elde etmek için, eşleştirme algoritmanızı yapılandırmak ve ayarlamak üzere IBM Match 360 REST API 'sini kullanabilirsiniz.
API ile çalışırken, eşleşen işlerinizi çalıştırmadan önce algoritmayı belirtik olarak konuşlandırmanız gerekir. api-model
mikro hizmet API 'si içinde POST /mdm/v1/algorithms/{record_type}
yöntemi, sağlanan öznitelikler ve alanlara dayalı olarak eşleşen bir algoritma oluşturur.
Yöntemin bilgi yükünde tam tanımlı bir eşleştirme algoritması sağlamanıza olanak sağlayan PUT /mdm/v1/algorithms/{record_type}
yöntemini kullanarak eşleşen algoritmayı daha da özelleştirebilirsiniz.
POST /mdm/v1/algorithms/{record_type}
için otomatik bağlantı eşiğini ve eşleşen öznitelikler ve alanlar kümesini tanımlayan örnek bir bilgi yükü:
{"person_entity":{"auto_link_threshold":0.4,"matching_attributes":[{"attributes":["legal_name"]},{"attributes":["primary_residence"]}, {"attributes":["mobile_telephone"]},
{"attributes":["birth_date"]}, {"attributes":["gender"]}, {"attributes":["personal_email"]}]}}
IBM Match 360 REST API 'si ve kimlik doğrulama yönergeleri ve her yöntemin tam belgeleri de içinde olmak üzere ilgili SDK ' ler hakkında daha fazla bilgi için bkz. IBM Match 360 API reference.
Bu konuda:
Çok boyutlu karşılaştırma süzgeçlerini yapılandırma
Çok boyutlu karşılaştırma süzgeçleri tanımlayarak eşleştirme algoritmanızı daha da iyi ayarlayın. Çok boyutlu süzgeçler, kayıtlar arasındaki öznitelikleri karşılaştırabilir ve tanımladığınız ölçütlere göre eşleşen puanları ve ağırlıkları yukarı ya da aşağı ayarlayabilir. Çok boyutlu karşılaştırma süzgeçleri, eşleşen sonuçlarınızda yanlış pozitif ya da yanlış negatif eşleşme miktarını azaltabilir.
Makine öğrenimine dayalı eşleştirme sonuçlarını geçersiz kılan kendi belirleyici eşleştirme kurallarınızı eklemek için çok boyutlu karşılaştırma süzgeçlerini de kullanabilirsiniz.
Çok boyutlu karşılaştırma süzgeci oluşturulması
Eşleşen algoritmanızda çok boyutlu bir karşılaştırma süzgeci oluşturmak için REST API komutlarını kullanarak eşleşen altyapı yapılandırmasını güncelleyin:
IBM Match 360 API arabirimine erişin ve kimliğini doğrulayın.
Aşağıdaki örnekte olduğu gibi, bir süzgeci tanımlayan bir
POST /mdm/v1/algorithms/{record_type}
bilgi yükü belirtin:{"person_entity":{"auto_link_threshold":0.4,"matching_attributes":[{"attributes":["legal_name"], "post_filter_methods": ["false_positive_filter"]},{"attributes":["primary_residence"], "post_filter_methods": ["false_positive_filter"]}, {"attributes":["mobile_telephone"]}, {"attributes":["birth_date"], "post_filter_methods": ["false_positive_filter"]}, {"attributes":["gender"]}, {"attributes":["personal_email"]}]}}
Örnek bilgi yükünde,
false_positive_filter
özel süzgecin adıdır. Bu, bilgi yükünde süzgeç adını içeren her öznitelik için geçerlidir.
Örnek API bilgi yükü, ağırlıkların ve cezaların varsayılan değer olduğu (0) bir false_positive_filter
içeren bir algoritma oluşturur.
İsteğe bağlı olarak, ağırlıkları ve cezaları kuruluşunuzun gereksinimlerini karşılayacak şekilde özelleştirebilir ve PUT /mdm/v1/algorithms/{record_type}
API 'sini kullanarak güncellenen algoritmanızı devreye alabilirsiniz.
Süzgeçleri tanımlayan parametrelerin anlaşılması
Çok boyutlu karşılaştırma süzgeçlerini tanımlayan yapılandırma parametrelerini anlamak için, önceki bölümde oluşturulan false_positive_filter
örneğini göz önünde bulundurun.
GET /mdm/v1/algorithms/{record_type}
API komutunu kullanarak geçerli algoritmayı alın.
Önceki bölümde, ilgili örnek bilgi yüküyle birlikte POST isteğini gönderdikten sonra, algoritma yapılandırmasında aşağıdaki bölüm oluşturuldu:
{
"false_positive_filter": {
"filter_recipe": [
{
"method": "FilterMethod.MultiDimFilter",
"inputs": [1,2,3],
"label": "Multi-Dim filter",
"weights": [
{
"distances": [0,0],
"values": [0,0,0,0,0,0]
}
]
}
],
"inputs": [
{"compare_method": "address_compare"},
{"compare_method": "date_compare"},
{"compare_method": "pername_compare"}
],
"label": "false_positive_filter"
}
}
Örnek false_positive_filter
bölümü, çok boyutlu karşılaştırma süzgeçlerini tanımlayan standart parametreleri içerir:
filter_recipe
-Bu kısım, her giriş için eşleşen ağırlıkları tanımlamak için gerekli tarifi sağlayan bir dizi parametre içerir.inputs
.filter_recipe.inputs
kısmı, bu süzgeç tarifinin uygulandığı girişlerin dizinini içerir. Bunlar,inputs
bölümünde listelenen karşılaştırma yöntemlerinin sırasına karşılık gelen sayı değerleridir. Örneğin, örnekte1
,address_compare
yöntemine,2
date_compare
yöntemine ve3
,pername_compare
yöntemine karşılık gelir.weights
-weights
kısmı, her girişin üç boyutlu karşılaştırma için nasıl ağırlıklandırılacağını tanımlayan bir öğe dizisidir.weights
kısmı, girişlere ilişkindistances
vevalues
tanımlamalarını içerir. Varsayılan ağırlık, tanımlı olmayan herhangi bir giriş için0
değeridir.
inputs
-Bu bölüm, eşleşen özniteliklere ilişkin karşılaştırma yöntemlerini içerir. Bu yöntemler,filter_recipe
bölümünde tanımladığınız uzaklıkları ve ağırlıkları kullanır.max_distance
-İsteğe bağlıdır (gösterilmez). Bu parametre maksimum uzaklığı tanımlar. Varsayılan uzaklık üst sınırı 5 'tir; bu,filter_recipe.weights.values
parametresinin 6 öğe içerebileceği anlamına gelir ("values":[0,1,2,3,4,5]
).
Özel süzgeçleri yapılandırma
Çok boyutlu bir karşılaştırma süzgeciyle kullanmak üzere var olan karşılaştırma yöntemlerini uyarlamak için:
Yürürlükteki algoritmayı al:
GET /mdm/v1/algorithms/{record_type}
Algoritmayı gerektiği gibi güncelleyin. Örneğin, şunları yapabilirsiniz:
- Listelenen girişlere ilişkin ağırlıkları özelleştirmek için
weights
bölümüne öğe ekleyin ya da var olan öğeleri güncelleyin. - Bir
max_distance
parametresi ekleyerek maksimum uzaklığı tanımlayın. - Karşılaştırma yöntemlerini, varsayılan eşleşen ağırlıklar yerine bu süzgeci kullanacak girişler olarak ekleyin.
- Listelenen girişlere ilişkin ağırlıkları özelleştirmek için
Güncellenen sürümünüzle eşleşen algoritmanın üzerine yaz:
PUT /mdm/v1/algorithms/{record_type}
Örnek 1: Uzaklık üst sınırını 9 olarak ayarlamak ve farklı giriş ve mesafe birleşimleri için özel ağırlıklar ve cezalar belirtmek istiyorsanız aşağıdaki örnek bilgi yükünü kullanın: -input1 distance=0, input2 distance=0, input3 uzaklık = [ 0,1,2,3,4,6,7,8, 9]. Bu durumda, mesafe kombinasyonu [ 0,0, 3] 15 puan verir.
- input1 distance=1, input2 distance=0, input3 uzaklık = [ 0,1,2,3,4,5,6,7,8, 9]. Bu durumda, mesafe kombinasyonu [ 1,0, 9] -30 ceza puanı verir.
{
"false_positive_filter": {
"filter_recipe": [
{
"method": "FilterMethod.MultiDimFilter",
"max_distance": 9,
"inputs": [1,2,3],
"label": "Multi-Dim filter",
"weights": [
{
"distances": [0,0],
"values": [0,-5,-10,-15,-20,-25,-30,-30,-30,-30]
},
{
"distances": [1,0],
"values": [0,-5,-10,-15,-20,-25,-30,-30,-30,-30]
}
]
}
],
"inputs": [
{"compare_method": "address_compare"},
{"compare_method": "date_compare"},
{"compare_method": "pername_compare"}
],
"label": "false_positive_filter"
}
}
Örnek 2: Aşağıdaki örnek bilgi yükünde olduğu gibi, kendi özelleştirilmiş karşılaştırma yöntemlerinizi ekleyebilir ve bunları genel eşleşme puanına katkıda bulunmaktan dışlanacak şekilde yapılandırabilirsiniz. Bu durumda, özel yöntemler yalnızca çok boyutlu karşılaştırma süzgeci tarafından kullanılır.
Aşağıdaki örnekte, given_name_only_compare
süzgeci overall_score_contribution
öğesini false
olarak ayarlar.
{
"given_name_only_compare": {
"methods": [
{
"inputs": [
{
"attributes": [
"legal_name"
],
"fields": [
"given_name"
]
}
],
"compare_recipe": [
{
"comparison_resource": "person_person_entity_person_compare_spec_name",
"method": "CompareMethod.NameCompare",
"inputs": [
1
],
"label": "Given Name Only Match",
"fields": [
"given_name"
]
}
]
}
],
"overall_score_contribution" : false,
"label": "Given Name Only Compare",
"weights": [1,0,0,0,0,0,0,0,0,0,0]
}
}
Uzaklığı düzenleme işlevini değiştirme
IBM Match 360 eşleşen motoru, çeşitli özniteliklerin karşılaştırılması ve eşleştirilmesi sırasında iç işlevlerden biri olarak düzenleme mesafesini hesaplar. Düzenleme uzaklığı, iki dizenin birbirinden ne kadar farklı olduğunu ölçen bir ölçüdür. Bir dizgiyi diğerine dönüştürmek için gereken değişiklik sayısı sayılarak hesaplanır.
Standart uzaklık düzenleme işlevi ya da özelleştirilmiş bir işlev arasından seçim yapabilirsiniz. Standart düzenleme uzaklığı, eşleştirme sırasında daha hızlı performans sağlamak için varsayılan yapılandırmadır. Düzenleme uzaklığı hakkında daha fazla bilgi için bkz. IBM Match 360 eşleştirme algoritmaları.
Etkin uzaklık düzenleme işlevini değiştirmek için, REST API komutlarını kullanarak eşleşen altyapı yapılandırmasını güncelleyin:
IBM Match 360 API arabirimine erişin ve kimliğini doğrulayın.
Karşılaştırma işlevi için var olan yapılandırma JSON dosyasını (
compare_spec_resource
) alın:GET /mdm/v1/compare_spec_resources/{resource_name}
Yerel makinenizde,
"similar_characters_enabled": true
satırını eklemek için JSON ' u düzenleyin (ya da varsayılan düzenleme uzaklığı ayarına geri dönmek istiyorsanız bunu kaldırın).Düzenlenmiş JSON ' unuzu karşıya yükleyerek IBM Match 360 yapılandırmasını güncelleyin:
PUT /mdm/v1/compare_spec_resources/{resource_name}
Yapıştırma kaydı eşiğinin yapılandırılması
IBM Match 360 eşleştirme algoritmasını güncellemek için API komutlarını kullanarak bir yapıştırma kaydı eşiği tanımlayabilirsiniz.
IBM Match 360 , eşleştirme yoluyla varlıkları oluşturduğunda, bazı düşük kaliteli kayıtlar yapıştırma kaydı olarak işlev görür. Yapıştırıcı kayıtları isimlerini alır çünkü yapıştırıcı gibi diğer birçok plağa yapışır. Yapıştırma kayıtları az sayıda ya da hiç ayrıntılı öznitelik değeri içermediğinden, bunlar birçok farklı kayıtla eşleşiyor gibi görünebilir. Bir yapıştırıcı kaydının eşleştirme davranışı, yalnızca bir düşük kaliteli yapıştırıcı kaydı ortak olan çok büyük varlıkları yanlışlıkla ve yanlış bir şekilde oluşturabilir.
Basitleştirilmiş bir örnek olarak, "Can Sunar" gibi bir addan başka öznitelikleri olmayan düşük kaliteli bir kayıt düşünün. Bu gibi bir kayıt, veri kümesindeki diğer herhangi bir "Can Sunar" ile kolayca eşleşebilir ve aksi takdirde eşleştirilmeyecek diğer kayıtların tek bir "Can Sunar" varlığına dahil olmasına neden olur.
Veri mühendisleri, her varlık tipi için eşleşen algoritmada bir yapıştırıcı kaydı eşiği ayarlayarak, yapıştırıcı kayıtlarının büyük, zayıf eşleştirilmiş varlıkların oluşumuna neden olmasını önleyebilir.
Bir yapıştırma kaydı eşiği yapılandırıldığında, IBM Match 360 , kendi kendine eşleşme puanı artı yapıştırma kaydı eşiğinin değerinin, varlıktaki merkez kaydın kendi kendine eşleşme puanından daha düşük olup olmadığını denetleyerek yapıştırma kayıtlarını tanımlar. Daha azsa, kayıt bir yapıştırıcı kaydı olarak kabul edilir ve varlığa dahil edilmez.
Yapıştırma kaydı eşikleri isteğe bağlıdır ve varsayılan olarak ayarlanmaz. Her varlık tipinin yapıştırma kaydı eşiği ayrı olarak tanımlanmalıdır.
Bir yapıştırma kaydı eşiği ayarlamak için:
IBM Match 360 API arabirimine erişin ve kimliğini doğrulayın.
Verili kayıt tipi için var olan yapılandırma eşleştirme algoritması JSON dosyasını al:
GET /mdm/v1/algorithms/{record_type}
Yerel makinenizde,
glue_threshold
parametresini bir varlık tipi altına eklemek için JSON ' u düzenleyin. Sayısal bir eşik değeri sağlayın. (Varolan bir yapıştırma kaydı eşiğini kaldırmak istiyorsanız parametreyi silin.) Örneğin:locale: {...} encryption: {...} standardizers: {...} entity_types: person_entity: bucket_generators: {...} auto_link_threshold: 65 clerical_review_threshold: 55 glue_threshold: 20 compare_methods: {...}
IBM Match 360 eşleşme algoritmasını güncelleyin:
PUT /mdm/v1/algorithms/{record_type}
Sonraki adımlar
Daha fazla bilgi
- IBM Match 360 with Watson eşleştirme algoritmaları
- API hizmetleri IBM Match 360
- Ana verilerin keşfedilmesi
- Ana verileri yapılandırma
- Ana verilerin yönetilmesi
Üst konu: Eşleştirme algoritmanızı özelleştirme ve güçlendirme