Translation not up to date
IBM Match 360 with Watson zawiera narzędzia, z których mogą korzystać użytkownicy mechanika danych w celu dostrojenia i dostosowania algorytmu dopasowywania. Poprzez strojenie algorytmu można kontrolować sposób, w jaki IBM Match 360 jest zgodny z danymi użytkownika w celu utworzenia nadrzędnych jednostek danych.
- wymagane uprawnienia
- Aby skonfigurować nadrzędną instancję danych, należy być członkiem grupy użytkowników DataEngineer dla usługi IBM Match 360 .
Istnieją cztery kluczowe części konfigurowania i strojenia algorytmu:
Wybieranie zgodnych atrybutów. Wybierając atrybuty modelu danych, które są porównywane podczas dopasowywania, można powiedzieć IBM Match 360 with Watson , jakie punkty danych są najważniejszymi zagadnieniami dla danego algorytmu. Ważne jest, aby wybrać atrybuty, które są silnymi różnicami. Unikalne identyfikatory, takie jak numery licencji maszynistów, to doskonałe dopasowanie atrybutów. Przed pierwszym dopasowaniem należy wybrać zgodne atrybuty.
Żądanie i zakończenie przeglądów par. Zażądaj przeglądu par, aby wygenerować inteligentne rekomendacje strojenia, które optymalizują pasujące do siebie wagi algorytmu i zgodne z nim progi. Podczas przeglądu pary zestaw danych porównuje pary rekordów w celu określenia, czy są one zgodne, być może są zgodne, czy nie są zgodne. Odpowiedzi zarządcy danych informują o zaleceniach dotyczących dostrajania.
Stosowanie zaleceń dotyczących strojenia. Po zakończeniu zadania przeglądu pary inżynier danych może zdecydować, czy zastosować rekomendacje strojenia.
Definiowanie wartości progowych automatycznego przeglądu i przeglądu. Jeśli rekomendacje dotyczące strojenia zostaną zaakceptowane z przeglądów par, automatycznie zostaną określone progi automatyczne i automatyczne, ale zawsze można w razie potrzeby nadpisać progi ręcznie. Każda operacja IBM Match 360 jest zgodna z każdym rekordem, który jest zgodny z rekordem, który generuje dopasowany wynik. Ten wynik może być przyjmowany jako wartość procentowa z zakresu od 0 do 100, przy czym 0 oznacza, że niezgodność nie jest zgodna, a 100-oznacza zgodność. W ramach konfigurowania algorytmu uzgadniania, inżynier danych może zdefiniować dwie wartości progowe:
Próg automatycznego śledzenia definiuje minimalny wynik dopasowania dla algorytmu w celu dokonania automatycznej decyzji o zgodności między dowolnymi dwoma rekordami.
- Jeśli próg automatycznego łącza jest niski, będzie można uzyskać bardziej ogólne dopasowania, co spowoduje, że będą bardziej zgodne z fałszywymi dodatnimi.
- Jeśli próg łącza automatycznego jest wysoki, będzie mniej zgodnych elementów i więcej pojedynczych obiektów (składa się tylko z jednego rekordu składowego), z prawdopodobnymi bardziej fałszywymi ujemnymi niezgodnymi elementami.
Próg przeglądu (clerical review threshold) określa minimalny wynik dopasowania dla potencjalnego dopasowania. Wyniki poniżej progu przeglądu ręcznego są uważane za niezgodne. Wyniki, które mieszczą się w zakresie między progiem przeglądu ręcznego a progiem autolink, mogą zostać wysłane za pośrednictwem potencjalnego dopasowania przepływu pracy, który ma zostać remediowany przez użytkownika kierowanego do danych.
Ważne: Jeśli zakres prac biurowych nie jest włączony w ustawieniach pasujących, wówczas potencjalny przepływ pracy nie może wygenerować żadnych zadań. Informacje na temat potencjalnego dopasowania przepływu pracy znajdują się w sekcji [ Konfigurowanie przepływów pracy danych głównych] (m360-config-workflow.html).
Więcej informacji na temat zaawansowanych procedur strojenia algorytmów, które korzystają z interfejsu API usług REST IBM Match 360 , zawiera sekcja Zaawansowane dopasowanie algorytmów uzgadniania.
W tym temacie:
- Przygotowanie do dostrajania zgodnego algorytmu
- Wybieranie zgodnych atrybutów
- Żądanie weryfikacji par i stosowanie rekomendacji dotyczących strojenia
- Ręczne zmienianie wartości progowych przeglądu automatycznego i biurowych
Przygotowanie do dostrajania zgodnego algorytmu
Jeśli nie uruchomiono jeszcze dopasowania do danych, należy najpierw wybrać zgodne atrybuty przed uruchomieniem uzgadniania. W razie potrzeby można później zmienić wybrane opcje.
Nie można zmienić czułości progu automatycznego lub sprawdzania par żądań, dopóki nie zostanie uruchomione zgodne co najmniej jeden raz. To ograniczenie zapewnia, że użytkownik ma pewną podstawę porównania w celu zmiany progu z domyślnej czułości. Na przykład, jeśli w danych zostanie zauważone zbyt wiele pozytywnych wyników, można zwiększyć jego czułość. Jeśli istnieje zbyt wiele rekordów singletonów, można zmniejszyć jego czułość.
Przed zmodyfikowaniem ustawień algorytmu uzgadniania należy rozważyć utworzenie nowego obrazu stanu konfiguracji w celu zapisania bieżących ustawień. Utworzenie obrazu stanu ułatwi powrót do poprzedniej konfiguracji w późniejszym czasie, jeśli wyniki zmian są niezadowolone. Więcej informacji na temat tworzenia obrazów stanu zawiera sekcja Zapisywanie i ładowanie ustawień konfiguracji danych głównych przy użyciu obrazów stanu.
Wybieranie zgodnych atrybutów
Aby wybrać atrybuty używane przez IBM Match 360 w pasującym algorytmie:
Kliknij menu nawigacji i wybierz opcję Dopasowywanie konfiguracji , aby otworzyć pasującą stronę konfiguracji.
Przejdź do karty Ustawienia zgodności i wybierz opcję Wybór atrybutu na pasku bocznym, aby wybrać atrybuty, które mają być używane w dopasowanych danych. Po pierwszym przejscie do tej karty IBM Match 360 automatycznie generuje pewne sugerowane atrybuty z modelu danych, które mają być używane w dopasowaniu.
Przejrzyj listę zgodnych atrybutów i ich pól komponentów. Te atrybuty i pola zostaną użyte jako podstawa porównania w celu dopasowania rekordów i utworzenia nadrzędnych jednostek danych. Aby dodać lub usunąć atrybuty z listy, kliknij opcję Edytuj atrybuty , a następnie wybierz lub usuń zaznaczenie atrybutów i ich pól komponentów odpowiednio do potrzeb.
Po wybraniu zgodnych atrybutów należy użyć indykatora Moc dopasowania , aby wyświetlić oszacowanie wpływu zmian na zgodny algorytm.
Jeśli do modelu danych dodano atrybuty niestandardowe, nie są one uwzględniane w dopasowaniu domyślnie. Aby użyć niestandardowego typu atrybutu w dopasowaniu, należy go wybrać, a następnie określić, które z jego pól mają być rozważane. Jeśli nie zostaną podane żadne pola, wówczas zgodne algorytmy nie będą mogły korzystać z atrybutu.
W przypadku typów atrybutów innych niż niestandardowe (predefiniowane), jeśli nie określono pól do rozważenia, algorytm dopasowywania użyje domyślnego zestawu pól.
Jeśli zmiany atrybutów są zgodne, kliknij przycisk Zapisz.
Wygeneruj ponownie dopasowane obiekty w oparciu o zaktualizowane ustawienia. Kliknij ikonę uruchamiania dopasowywania na pasku działań.
Proces dopasowywania trwa od czasu do zakończenia. Jest on uruchamiany w tle, dzięki czemu można kontynuować pracę. Użytkownik zostanie powiadomiony, gdy zostanie zakończony, a następnie będzie można przejrzeć szczegóły wyników na karcie Wyniki dopasowania .
Wysyłanie żądań przeglądu par i stosowanie rekomendacji strojenia
Użyj przeglądów par, aby dostroić odpowiedni algorytm. Każda organizacja ma różne poziomy tolerancji ryzyka w przypadku fałszywych dopasowań, a przeglądy par mogą pomóc w określeniu odpowiednich ustawień dopasowania.
Inżynierowie danych mogą zażądać przeglądu par, które mają być wykonane przez zarządca danych, a następnie zdecydować, czy zaakceptować otrzymane rekomendacje dotyczące strojenia.
Aby zażądać przeglądu pary:
Kliknij menu nawigacji i wybierz opcję Dopasowywanie konfiguracji , aby otworzyć pasującą stronę konfiguracji.
Wybierz na pasku bocznym opcję Strojenie algorytmów , aby uzyskać dostęp do narzędzi strojenia algorytmów.
Upewnij się, że wybrany jest poprawny algorytm uzgadniania. Domyślne zgodne nazwy algorytmów to: Osoba-Jednostka osoby i Organizacja-Organizacja-Jednostka organizacyjna.
W sekcji Przegląd pary kliknij opcję Przegląd par żądań.
Wybierz liczbę par rekordów, które powinny zostać przejrzane w ramach tego zadania. Przeglądanie większej liczby par spowoduje lepsze strojenie rekomendacji. Jeśli zostanie przejrzane zbyt mała liczba par, wówczas IBM Match 360 nie będzie w stanie wygenerować rekomendacji.
Uwaga: Rzeczywistwa liczba wygenerowanych par może nie być zgodna z liczbą zdefiniowaną w tym kroku. Liczba wygenerowanych par rekordów zależy od dostępnej ilości danych w systemie i innych czynników.Kliknij opcję Wyślij żądanie.
Program IBM Match 360 uruchamia generowanie par rekordów i tworzenie czynności przeglądu. Sekcja Strojenie algorytmów umożliwia powiadomienie użytkownika o statusie przeglądu (Generowanie par lub Przegląd w toku), a także śledzi postęp bieżącego zadania przeglądu.
Więcej informacji na temat wykonywania czynności przeglądu pary jako użytkownika kierowanego do danych zawiera sekcja Kończenie przeglądów par.
Aby przejrzeć i zastosować rekomendacje strojenia wygenerowane przez przegląd pary:
Kliknij menu nawigacji i wybierz opcję Dopasowywanie konfiguracji , aby otworzyć pasującą stronę konfiguracji.
Wybierz na pasku bocznym opcję Strojenie algorytmów , aby uzyskać dostęp do narzędzi strojenia algorytmów.
Upewnij się, że wybrany jest poprawny algorytm uzgadniania. Domyślne zgodne nazwy algorytmów to: Osoba-Jednostka osoby i Organizacja-Organizacja-Jednostka organizacyjna.
W sekcji Przegląd pary przejrzyj postęp ostatniego zadania przeglądu par. Można wyświetlić łączną liczbę sprawdzanych par oraz liczbę par, które zostały określone jako zgodne, a nie zgodne lub nieokreślone.
W sekcji Progi przejrzyj bieżące ustawienia algorytmu uzgadniania, a także oszacuj bieżące wartości fałszywie dodatnich i fałszywie ujemnych.
Jeśli wykonano zbyt małą liczbę przeglądów lub jeśli dopasowanie nie zostało jeszcze uruchomione, nie można wyświetlić fałszywych wyników dodatnich i fałszywie ujemnych.
Rozwiń sekcję Zalecenie dotyczące progów .
Zapoznaj się z zalecanymi aktualizacjami dopasowanych ustawień algorytmu. Rekomendacja reprezentuje próg z najniższymi fałszywymi dodatnimi i fałszywymi ujemnymi stawkami w oparciu o przejrzane pary.
Jeśli chcesz użyć zalecanych ustawień, kliknij opcję Zastosuj rekomendację. Zastosowanie rekomendacji spowoduje zmianę czułości automatycznego atramowania i powiązanych wag zgodnych z każdym atrybutem.
Wygeneruj ponownie dopasowane obiekty w oparciu o zaktualizowane ustawienia. Przejdź do karty Wyniki dopasowania , a następnie kliknij ikonę uruchamiania dopasowywania na pasku działań.
Proces dopasowywania trwa od czasu do zakończenia. Jest on uruchamiany w tle, dzięki czemu można kontynuować pracę. Użytkownik zostanie powiadomiony, gdy zostanie zakończony, a następnie będzie można przejrzeć szczegóły wyników na karcie Wyniki dopasowania .
Ręczne zmienianie progów przeglądu automatycznego i biurowych
Jeśli nie są używane przeglądy par w celu wygenerowania rekomendacji, znalezienie odpowiedniej czułości automatycznego przeglądu i przeglądu biurowych dla potrzeb użytkownika może spowodować wystąpienie błędu i procesu. W zależności od konkretnych wymagań danej organizacji może być konieczne powtórzenie procesu dostosowania czułości i ponowne dopasowanie danych więcej niż jeden raz.
Łączny próg łącza automatycznego jest obliczany przez pomnożenie czułości automatycznego atramowania (0-100) przez maksymalny możliwy wynik dopasowania, który jest określany na podstawie wybranych atrybutów dopasowania i ich maksymalnej wagi w algorytmie.
Aby ręcznie zmienić czułość dopasowanych wartości progowych automatycznych i klerykarowych progów dla danego pliku:
- Kliknij menu nawigacji i wybierz opcję Dopasowywanie konfiguracji , aby otworzyć pasującą stronę konfiguracji.
- Wybierz na pasku bocznym opcję Strojenie algorytmów , aby uzyskać dostęp do narzędzi strojenia algorytmów.
- Upewnij się, że wybrany jest poprawny algorytm uzgadniania. Domyślne zgodne nazwy algorytmów to: Osoba-Jednostka osoby i Organizacja-Organizacja-Jednostka organizacyjna.
- Zapoznaj się z bieżącymi ustawieniami w sekcji Progi .
- Użyj suwaka lub wartości numerów typów, aby zaktualizować progi przeglądu automatycznego i biurowych, a następnie kliknij przycisk Zastosuj próg. Użytkownik zostanie poproszony o uruchomienie dopasowania w celu zastosowania zmian w algorytmie.
- Opcjonalnie można wyłączyć zakres przeglądu pisarskiego za pomocą przełącznika Zakres Clerical range . Jeśli zakres urzędowania jest wyłączony, algorytm może wprowadzać tylko decyzje o zgodności lub bez zgodności i nie może umieścić w kolejce żadnych potencjalnych zadań zgodnych z zarządem danych w celu przeprowadzenia natychmiastowej mediacji.
- Wygeneruj ponownie dopasowane obiekty w oparciu o zaktualizowane ustawienia. Przejdź do karty Wyniki dopasowania , a następnie kliknij ikonę uruchamiania dopasowywania na pasku działań.
Proces dopasowywania trwa od czasu do zakończenia. Jest on uruchamiany w tle, dzięki czemu można kontynuować pracę. Użytkownik zostanie powiadomiony, gdy zostanie zakończony, a następnie będzie można przejrzeć szczegóły wyników na karcie Wyniki dopasowania .
Następne kroki
Więcej inform.
- IBM Match 360 with Watson zgodne z algorytmami
- Eksploracja danych głównych
- Zarządzanie danymi głównymi
Temat nadrzędny: Konfigurowanie danych głównych