0 / 0
Go back to the English version of the documentation
IBM Match 360 REST API kullanılarak gelişmiş eşleştirme algoritması ayarlaması
Last updated: 27 Tem 2023
IBM Match 360 REST API kullanılarak gelişmiş eşleştirme algoritması ayarlaması

Gelişmiş bir özelleştirme düzeyi elde etmek için, eşleştirme algoritmanızı yapılandırmak ve ayarlamak üzere IBM Match 360 REST API 'sini kullanabilirsiniz.

API ile çalışırken, eşleşen işlerinizi çalıştırmadan önce algoritmayı belirtik olarak konuşlandırmanız gerekir. api-model mikro hizmet API 'si içinde POST /mdm/v1/algorithms/{record_type} yöntemi, sağlanan öznitelikler ve alanlara dayalı olarak eşleşen bir algoritma oluşturur.

Yöntemin bilgi yükünde tam tanımlı bir eşleştirme algoritması sağlamanıza olanak sağlayan PUT /mdm/v1/algorithms/{record_type} yöntemini kullanarak eşleşen algoritmayı daha da özelleştirebilirsiniz.

POST /mdm/v1/algorithms/{record_type} için otomatik bağlantı eşiğini ve eşleşen öznitelikler ve alanlar kümesini tanımlayan örnek bir bilgi yükü:

{"person_entity":{"auto_link_threshold":0.4,"matching_attributes":[{"attributes":["legal_name"]},{"attributes":["primary_residence"]}, {"attributes":["mobile_telephone"]},
{"attributes":["birth_date"]}, {"attributes":["gender"]}, {"attributes":["personal_email"]}]}}

IBM Match 360 REST API 'si ve kimlik doğrulama yönergeleri ve her yöntemin tam belgeleri de içinde olmak üzere ilgili SDK ' ler hakkında daha fazla bilgi için bkz. IBM Match 360 API reference.

Unutmayın: API aracılığıyla bile eşleşen algoritmayı her güncellediğinde, eşleşme sonuçlarınızda yansıyan değişiklikleri görmek için daha sonra eşleşen algoritmayı çalıştırmanız gerekir.

Bu konuda:

Çok boyutlu karşılaştırma süzgeçlerini yapılandırma

Çok boyutlu karşılaştırma süzgeçleri tanımlayarak eşleştirme algoritmanızı daha da iyi ayarlayın. Çok boyutlu süzgeçler, kayıtlar arasındaki öznitelikleri karşılaştırabilir ve tanımladığınız ölçütlere göre eşleşen puanları ve ağırlıkları yukarı ya da aşağı ayarlayabilir. Çok boyutlu karşılaştırma süzgeçleri, eşleşen sonuçlarınızda yanlış pozitif ya da yanlış negatif eşleşme miktarını azaltabilir.

Makine öğrenimine dayalı eşleştirme sonuçlarını geçersiz kılan kendi belirleyici eşleştirme kurallarınızı eklemek için çok boyutlu karşılaştırma süzgeçlerini de kullanabilirsiniz.

Çok boyutlu karşılaştırma süzgeci oluşturulması

Eşleşen algoritmanızda çok boyutlu bir karşılaştırma süzgeci oluşturmak için REST API komutlarını kullanarak eşleşen altyapı yapılandırmasını güncelleyin:

  1. IBM Match 360 API arabirimine erişin ve kimliğini doğrulayın.

  2. Aşağıdaki örnekte olduğu gibi, bir süzgeci tanımlayan bir POST /mdm/v1/algorithms/{record_type} bilgi yükü belirtin:

    {"person_entity":{"auto_link_threshold":0.4,"matching_attributes":[{"attributes":["legal_name"], "post_filter_methods": ["false_positive_filter"]},{"attributes":["primary_residence"], "post_filter_methods": ["false_positive_filter"]}, {"attributes":["mobile_telephone"]},
    {"attributes":["birth_date"], "post_filter_methods": ["false_positive_filter"]}, {"attributes":["gender"]}, {"attributes":["personal_email"]}]}}
    

    Örnek bilgi yükünde, false_positive_filter özel süzgecin adıdır. Bu, bilgi yükünde süzgeç adını içeren her öznitelik için geçerlidir.

Örnek API bilgi yükü, ağırlıkların ve cezaların varsayılan değer olduğu (0) bir false_positive_filter içeren bir algoritma oluşturur.

İsteğe bağlı olarak, ağırlıkları ve cezaları kuruluşunuzun gereksinimlerini karşılayacak şekilde özelleştirebilir ve PUT /mdm/v1/algorithms/{record_type} API 'sini kullanarak güncellenen algoritmanızı devreye alabilirsiniz.

Süzgeçleri tanımlayan parametrelerin anlaşılması

Çok boyutlu karşılaştırma süzgeçlerini tanımlayan yapılandırma parametrelerini anlamak için, önceki bölümde oluşturulan false_positive_filter örneğini göz önünde bulundurun.

GET /mdm/v1/algorithms/{record_type}API komutunu kullanarak geçerli algoritmayı alın.

Önceki bölümde, ilgili örnek bilgi yüküyle birlikte POST isteğini gönderdikten sonra, algoritma yapılandırmasında aşağıdaki bölüm oluşturuldu:

{
  "false_positive_filter": {
    "filter_recipe": [
      {
        "method": "FilterMethod.MultiDimFilter",
        "inputs": [1,2,3],
        "label": "Multi-Dim filter",
        "weights": [
          {
            "distances": [0,0],
            "values": [0,0,0,0,0,0]
          }
        ]
      }
    ],
    "inputs": [
      {"compare_method": "address_compare"},
      {"compare_method": "date_compare"},
      {"compare_method": "pername_compare"}
    ],
    "label": "false_positive_filter"
  }
}

Örnek false_positive_filter bölümü, çok boyutlu karşılaştırma süzgeçlerini tanımlayan standart parametreleri içerir:

  • filter_recipe -Bu kısım, her giriş için eşleşen ağırlıkları tanımlamak için gerekli tarifi sağlayan bir dizi parametre içerir.

    • inputs. filter_recipe.inputs kısmı, bu süzgeç tarifinin uygulandığı girişlerin dizinini içerir. Bunlar, inputs bölümünde listelenen karşılaştırma yöntemlerinin sırasına karşılık gelen sayı değerleridir. Örneğin, örnekte 1 , address_compare yöntemine, 2 date_compare yöntemine ve 3 , pername_compare yöntemine karşılık gelir.
    • weights - weights kısmı, her girişin üç boyutlu karşılaştırma için nasıl ağırlıklandırılacağını tanımlayan bir öğe dizisidir. weights kısmı, girişlere ilişkin distances ve values tanımlamalarını içerir. Varsayılan ağırlık, tanımlı olmayan herhangi bir giriş için 0 değeridir.
  • inputs -Bu bölüm, eşleşen özniteliklere ilişkin karşılaştırma yöntemlerini içerir. Bu yöntemler, filter_recipe bölümünde tanımladığınız uzaklıkları ve ağırlıkları kullanır.

  • max_distance -İsteğe bağlıdır (gösterilmez). Bu parametre maksimum uzaklığı tanımlar. Varsayılan uzaklık üst sınırı 5 'tir; bu, filter_recipe.weights.values parametresinin 6 öğe içerebileceği anlamına gelir ("values":[0,1,2,3,4,5]).

Özel süzgeçleri yapılandırma

Çok boyutlu bir karşılaştırma süzgeciyle kullanmak üzere var olan karşılaştırma yöntemlerini uyarlamak için:

  1. Yürürlükteki algoritmayı al:

    GET /mdm/v1/algorithms/{record_type}
    
  2. Algoritmayı gerektiği gibi güncelleyin. Örneğin, şunları yapabilirsiniz:

    • Listelenen girişlere ilişkin ağırlıkları özelleştirmek için weights bölümüne öğe ekleyin ya da var olan öğeleri güncelleyin.
    • Bir max_distance parametresi ekleyerek maksimum uzaklığı tanımlayın.
    • Karşılaştırma yöntemlerini, varsayılan eşleşen ağırlıklar yerine bu süzgeci kullanacak girişler olarak ekleyin.
  3. Güncellenen sürümünüzle eşleşen algoritmanın üzerine yaz:

    PUT /mdm/v1/algorithms/{record_type}
    

Örnek 1: Uzaklık üst sınırını 9 olarak ayarlamak ve farklı giriş ve mesafe birleşimleri için özel ağırlıklar ve cezalar belirtmek istiyorsanız aşağıdaki örnek bilgi yükünü kullanın: -input1 distance=0, input2 distance=0, input3 uzaklık = [ 0,1,2,3,4,6,7,8, 9]. Bu durumda, mesafe kombinasyonu [ 0,0, 3] 15 puan verir.

  • input1 distance=1, input2 distance=0, input3 uzaklık = [ 0,1,2,3,4,5,6,7,8, 9]. Bu durumda, mesafe kombinasyonu [ 1,0, 9] -30 ceza puanı verir.
{
  "false_positive_filter": {
    "filter_recipe": [
      {
        "method": "FilterMethod.MultiDimFilter",
        "max_distance": 9,
        "inputs": [1,2,3],
        "label": "Multi-Dim filter",
        "weights": [
          {
            "distances": [0,0],
            "values": [0,-5,-10,-15,-20,-25,-30,-30,-30,-30]
          },
          {
            "distances": [1,0],
            "values": [0,-5,-10,-15,-20,-25,-30,-30,-30,-30]
          }
        ]
      }
    ],
    "inputs": [
      {"compare_method": "address_compare"},
      {"compare_method": "date_compare"},
      {"compare_method": "pername_compare"}
    ],
    "label": "false_positive_filter"
  }
}

Örnek 2: Aşağıdaki örnek bilgi yükünde olduğu gibi, kendi özelleştirilmiş karşılaştırma yöntemlerinizi ekleyebilir ve bunları genel eşleşme puanına katkıda bulunmaktan dışlanacak şekilde yapılandırabilirsiniz. Bu durumda, özel yöntemler yalnızca çok boyutlu karşılaştırma süzgeci tarafından kullanılır.

Aşağıdaki örnekte, given_name_only_compare süzgeci overall_score_contribution öğesini falseolarak ayarlar.

{
  "given_name_only_compare": {
    "methods": [
      {
        "inputs": [
          {
            "attributes": [
              "legal_name"
            ],
            "fields": [
              "given_name"
            ]
          }
        ],
        "compare_recipe": [
          {
            "comparison_resource": "person_person_entity_person_compare_spec_name",
            "method": "CompareMethod.NameCompare",
            "inputs": [
              1
            ],
            "label": "Given Name Only Match",
            "fields": [
              "given_name"
            ]
          } 
        ]
      }
    ],
    "overall_score_contribution" : false,
    "label": "Given Name Only Compare",
    "weights": [1,0,0,0,0,0,0,0,0,0,0]
  }
}

Uzaklığı düzenleme işlevini değiştirme

IBM Match 360 eşleşen motoru, çeşitli özniteliklerin karşılaştırılması ve eşleştirilmesi sırasında iç işlevlerden biri olarak düzenleme mesafesini hesaplar. Düzenleme uzaklığı, iki dizenin birbirinden ne kadar farklı olduğunu ölçen bir ölçüdür. Bir dizgiyi diğerine dönüştürmek için gereken değişiklik sayısı sayılarak hesaplanır.

Standart uzaklık düzenleme işlevi ya da özelleştirilmiş bir işlev arasından seçim yapabilirsiniz. Standart düzenleme uzaklığı, eşleştirme sırasında daha hızlı performans sağlamak için varsayılan yapılandırmadır. Düzenleme uzaklığı hakkında daha fazla bilgi için bkz. IBM Match 360 eşleştirme algoritmaları.

Etkin uzaklık düzenleme işlevini değiştirmek için, REST API komutlarını kullanarak eşleşen altyapı yapılandırmasını güncelleyin:

  1. IBM Match 360 API arabirimine erişin ve kimliğini doğrulayın.

  2. Karşılaştırma işlevi için var olan yapılandırma JSON dosyasını ( compare_spec_resource) alın:

    GET /mdm/v1/compare_spec_resources/{resource_name}
    
  3. Yerel makinenizde, "similar_characters_enabled": true satırını eklemek için JSON ' u düzenleyin (ya da varsayılan düzenleme uzaklığı ayarına geri dönmek istiyorsanız bunu kaldırın).

  4. Düzenlenmiş JSON ' unuzu karşıya yükleyerek IBM Match 360 yapılandırmasını güncelleyin:

    PUT /mdm/v1/compare_spec_resources/{resource_name}
    

Yapıştırma kaydı eşiğinin yapılandırılması

IBM Match 360 eşleştirme algoritmasını güncellemek için API komutlarını kullanarak bir yapıştırma kaydı eşiği tanımlayabilirsiniz.

IBM Match 360 , eşleştirme yoluyla varlıkları oluşturduğunda, bazı düşük kaliteli kayıtlar yapıştırma kaydı olarak işlev görür. Yapıştırıcı kayıtları isimlerini alır çünkü yapıştırıcı gibi diğer birçok plağa yapışır. Yapıştırma kayıtları az sayıda ya da hiç ayrıntılı öznitelik değeri içermediğinden, bunlar birçok farklı kayıtla eşleşiyor gibi görünebilir. Bir yapıştırıcı kaydının eşleştirme davranışı, yalnızca bir düşük kaliteli yapıştırıcı kaydı ortak olan çok büyük varlıkları yanlışlıkla ve yanlış bir şekilde oluşturabilir.

Basitleştirilmiş bir örnek olarak, "Can Sunar" gibi bir addan başka öznitelikleri olmayan düşük kaliteli bir kayıt düşünün. Bu gibi bir kayıt, veri kümesindeki diğer herhangi bir "Can Sunar" ile kolayca eşleşebilir ve aksi takdirde eşleştirilmeyecek diğer kayıtların tek bir "Can Sunar" varlığına dahil olmasına neden olur.

Veri mühendisleri, her varlık tipi için eşleşen algoritmada bir yapıştırıcı kaydı eşiği ayarlayarak, yapıştırıcı kayıtlarının büyük, zayıf eşleştirilmiş varlıkların oluşumuna neden olmasını önleyebilir.

Bir yapıştırma kaydı eşiği yapılandırıldığında, IBM Match 360 , kendi kendine eşleşme puanı artı yapıştırma kaydı eşiğinin değerinin, varlıktaki merkez kaydın kendi kendine eşleşme puanından daha düşük olup olmadığını denetleyerek yapıştırma kayıtlarını tanımlar. Daha azsa, kayıt bir yapıştırıcı kaydı olarak kabul edilir ve varlığa dahil edilmez.

Yapıştırma kaydı eşikleri isteğe bağlıdır ve varsayılan olarak ayarlanmaz. Her varlık tipinin yapıştırma kaydı eşiği ayrı olarak tanımlanmalıdır.

Bir yapıştırma kaydı eşiği ayarlamak için:

  1. IBM Match 360 API arabirimine erişin ve kimliğini doğrulayın.

  2. Verili kayıt tipi için var olan yapılandırma eşleştirme algoritması JSON dosyasını al:

    GET /mdm/v1/algorithms/{record_type}
    
  3. Yerel makinenizde, glue_threshold parametresini bir varlık tipi altına eklemek için JSON ' u düzenleyin. Sayısal bir eşik değeri sağlayın. (Varolan bir yapıştırma kaydı eşiğini kaldırmak istiyorsanız parametreyi silin.) Örneğin:

    locale: {...}
    encryption: {...}
    standardizers: {...}
    entity_types:
      person_entity:
        bucket_generators: {...}
        auto_link_threshold: 65
        clerical_review_threshold: 55
        glue_threshold: 20
        compare_methods: {...}  
    
  4. IBM Match 360 eşleşme algoritmasını güncelleyin:

    PUT /mdm/v1/algorithms/{record_type}
    

Sonraki adımlar

Daha fazla bilgi

Üst konu: Eşleştirme algoritmanızı özelleştirme ve güçlendirme

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more