0 / 0
Go back to the English version of the documentation
Dopasowywanie danych w celu utworzenia nadrzędnych jednostek danych (IBM Match 360)
Last updated: 18 lip 2023
Dopasowywanie danych w celu utworzenia nadrzędnych jednostek danych (IBM Match 360)

Aby określić, czy rekordy mogą być gromadzone w jednostkach danych głównych, należy uruchomić dopasowywanie danych, aby pozwolić firmie IBM Match 360 określić, czy rekordy te mogą być gromadzone. Każdy główny obiekt danych zawiera jeden lub większą liczbę rekordów, które zostały znalezione jako zgodne.

wymagane uprawnienia
Aby skonfigurować i uruchomić dopasowanie w głównej instancji danych, należy być członkiem grupy użytkowników DataEngineer dla usługi IBM Match 360 .

Istnieją dwa wspólne powody, aby można było uruchomić dopasowanie do danych:

  • W przypadku operacji deduplikacji i rozwiązywania problemówproces dopasowywania analizuje dane w celu określenia, czy w danych istnieją zduplikowane rekordy. Rekordy podejrzewanych duplikatów są scalane z jednostkami danych wzorcowych w celu ustanowienia jednego, zaufanego, 360-stopniowego widoku danych.
  • Aby utworzyć inne typy powiązań jednostek, proces dopasowywania analizuje dane w celu gromadzenia rekordów do jednostek reprezentujących różne rodzaje grup, takich jak gospodarstwo domowe lub rodzina.

Więcej informacji na temat dopasowywania algorytmów i sposobu ich pracy w celu dopasowania danych i tworzenia obiektów zawiera sekcja IBM Match 360 zgodnych algorytmów.

Przygotowanie do uruchomienia uzgadniania

Przed uruchomieniem zgodnego algorytmu należy się upewnić, że model danych i zasoby są publikowane w usłudze IBM Match 360 with Watson . Więcej informacji na ten temat zawiera sekcja Dodawanie danych i odwzorowywanie ich na model danych.

Każdy typ jednostki zdefiniowany w modelu danych ma własny, osobny algorytm dopasowywania, który umożliwia tworzenie obiektów tego typu. Na przykład typ rekordu Osoba może mieć więcej niż jeden typ jednostki, taki jak Osoba i Gospodarstwo domowe.

  • Typ jednostki Osoba może być używany do deduplikacji i rozstrzygania obiektów danych rekordu osoby.
  • Typ jednostki gospodarstwa domowego może być używany do tworzenia powiązań rekordów osób, które należą do tego samego gospodarstwa domowego.

Konfigurowanie algorytmu uzgadniania

Aby skonfigurować zgodny algorytm:

  1. Kliknij menu nawigacji i wybierz opcję Dopasowywanie konfiguracji , aby otworzyć pasującą stronę konfiguracji.

  2. Z menu typu jednostki wybierz typ jednostki, której algorytm dopasowywania ma zostać skonfigurowany. Lista typów jednostek jest pobierana z modelu danych i jest zgodna z formatem Typ rekordu-Typ jednostki.

    Lista ta może zawierać typy jednostek, które nie zostały jeszcze opublikowane w systemie. W tym przypadku dopasowanie nie będzie możliwe do uruchomienia. Po wprowadzeniu jakichkolwiek zmian należy zawsze upewnić się, że model danych został opublikowany, na przykład w celu dodania nowego typu jednostki.

  3. Przejdź do karty Ustawienia zgodności , aby wybrać atrybuty, które mają być używane w pasujących danych. Po pierwszym otwarciu tej karty usługa IBM Match 360 automatycznie generuje pewne sugerowane atrybuty z modelu danych, które mają być używane w dopasowaniu.

  4. Przejrzyj listę zgodnych atrybutów. Atrybuty te zostaną użyte jako podstawa porównania w celu dopasowania rekordów i utworzenia nadrzędnych jednostek danych. Aby dodać lub usunąć atrybuty z listy, kliknij opcję Edytuj atrybuty , a następnie wybierz lub usuń zaznaczenie atrybutów i ich pól komponentów odpowiednio do potrzeb.

    Po wybraniu zgodnych atrybutów należy użyć indykatora Moc dopasowania , aby wyświetlić oszacowanie wpływu zmian na algorytm dopasowywania.

    Jeśli do modelu danych dodano atrybuty niestandardowe, nie są one uwzględniane w dopasowaniu domyślnie. Aby użyć niestandardowego typu atrybutu w dopasowaniu, należy go wybrać, a następnie określić, które z jego pól mają być rozważane. Jeśli nie zostaną podane żadne pola, wówczas zgodne algorytmy nie będą mogły korzystać z atrybutu.

    W przypadku predefiniowanych typów atrybutów (nieniestandardowych), jeśli nie określono pól do rozważenia, algorytm dopasowania używa domyślnego zestawu pól.

  5. Jeśli pasujące atrybuty są zadowalające, kliknij przycisk Zapisz.

Wybieranie rekordów, które są brane pod uwagę przy dopasowywaniu

Opcjonalnie można skonfigurować warunki definiujące, które rekordy IBM Match 360 będą wybierane do dopasowania.

Domyślnie wszystkie rekordy powiązane z wybranym typem jednostki mogą brać udział w dopasowaniu. Aby zawęzić zakres rekordów dostępnych do dopasowania, można określić warunki filtru, które zawierają lub wykluczają rekordy, które mają określone wartości atrybutów.

Aby zdefiniować rekordy, które zostaną wybrane do dopasowania:

  1. Kliknij menu nawigacji i wybierz opcję Dopasowywanie konfiguracji , aby otworzyć pasującą stronę konfiguracji.

  2. Wybierz opcję Wybór rekordów na pasku bocznym, aby uzyskać dostęp do ustawień wyboru rekordów.

  3. Upewnij się, że wybrany jest poprawny algorytm uzgadniania. Domyślne zgodne nazwy algorytmów to: Osoba-Jednostka osoby i Organizacja-Organizacja-Jednostka organizacyjna.

  4. Jeśli chcesz włączyć filtry wyboru rekordów dla tego typu jednostki, kliknij opcję Włącz wybór rekordów.

    Aby później wyłączyć filtry wyboru rekordów, wybierz opcję Wyłącz wybór rekordów.

  5. Zdefiniuj warunki wyboru rekordów:

    a. Kliknij opcję +, a następnie wybierz atrybut, który ma zostać rozważony.

    b. Kliknij opcję +, a następnie wybierz odpowiednią wartość atrybutu, dla której chcesz wybrać wartość.

    c. Powtórz te kroki, aby dodać warunki.

    Po zdefiniowaniu warunku ustawienie Działanie staje się dostępne.

  6. Zdefiniuj działanie powiązane z warunkiem. Kliknij opcję +, a następnie wybierz opcję Użyj w dopasowaniu lub Nie używaj w dopasowaniu.

    • Jeśli zostanie wybrana opcja Użyj w dopasowaniu, wówczas tylko rekordy spełniające warunki będą mogły uczestniczyć w dopasowaniu dla tego typu jednostki.
    • Jeśli zostanie wybrana opcja Nie używaj w dopasowaniu, to wszystkie rekordy spełniające warunki nie będą mogły uczestniczyć w dopasowaniu dla tego typu jednostki.
Uwaga: Jeśli dane główne zawierają ręczne reguły łączenia, niektóre ręczne odsyłacze do rekordów mogą zostać unieważnione przez określone warunki wyboru rekordów. Na przykład, jeśli warunek wyboru rekordów zezwala tylko na rekordy z określonego źródła rekordu, to spowoduje to wykluczenie rekordów ze wszystkich innych źródeł. W takiej sytuacji wszelkie reguły ręcznego łączenia, które uwzględniły rekordy z innych źródeł, są unieważniane. Niepoprawne reguły są automatycznie usuwane.

Dopasowywanie danych i przeglądanie wyników

Aby uruchomić dopasowanie do danych rekordu w celu utworzenia nadrzędnych jednostek danych:

  1. Kliknij menu nawigacji i wybierz opcję Dopasowywanie konfiguracji , aby otworzyć pasującą stronę konfiguracji.

  2. Z menu typu jednostki wybierz typ jednostki, której algorytm dopasowywania ma zostać uruchomiony. Lista typów jednostek jest pobierana z modelu danych i jest zgodna z formatem Typ rekordu-Typ jednostki.

  3. Kliknij ikonę uruchamiania dopasowywania uruchom zgodną ikonę na pasku działań.

    Proces dopasowywania trwa od czasu do zakończenia. Jest on uruchamiany w tle, dzięki czemu można kontynuować pracę. Będziesz powiadamiany o tym, kiedy będzie kompletny.

  4. Po zakończeniu dopasowywania przejdź do karty Dopasuj wyniki , aby wyświetlić panel kontrolny statystyk i wizualizacje, aby uzyskać informacje o danych głównych.

    Algorytm dopasowywania można dostosować w dowolnym momencie, wybierając inne atrybuty pasujące lub zmieniając próg automatycznego łącza .

Zarządzanie wynikami dopasowania
Na ekranie wyników dopasowania wyświetlane są statystyki i wykresy dotyczące danych głównych.

Po dodaniu większej liczby źródeł danych i zasobów do instancji IBM Match 360 with Watson i ponownym uruchomieniu dopasowywania nowe dane są dopasowywane zarówno do siebie, jak i do istniejących danych w systemie. W ten sposób można zbudować jednolity, pojedynczy, 360-stopniowy widok Twoich klientów w całym przedsiębiorstwie.

Następne kroki

Więcej inform.

Temat nadrzędny: Konfigurowanie danych głównych

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more