IBM Match 360 with Watson enthält Tools, mit denen Datenentwickler Ihren Abgleichalgorithmus optimieren und anpassen können. Durch Optimieren Ihres Algorithmus können Sie steuern, wie IBM Match 360 Ihre Daten abgleicht, um Stammdatenentitäten zu erstellen.
- Erforderliche Berechtigungen
- Um eine Masterdateninstanz zu konfigurieren, müssen Sie Mitglied der Benutzergruppe DataEngineer für den IBM Match 360 -Service sein.
Es gibt vier Schlüsselkomponenten für die Konfiguration und Optimierung Ihres Algorithmus:
Übereinstimmende Attribute auswählen Durch Auswahl der Datenmodellattribute, die während des Abgleichprozesses verglichen werden, können Sie für IBM Match 360 with Watson angeben, welche Datenpunkte die wichtigsten Aspekte für Ihren Algorithmus darstellen. Sie sollten Attribute auswählen, die starke Unterscheidungsmerkmale sind. Eindeutige IDs wie zum Beispiel Führerscheinnummern sind hervorragende Abgleichsattribute. Sie müssen übereinstimmende Attribute auswählen, bevor Sie den ersten Abgleich ausführen.
Paarprüfungen anfordern und abschließen. Fordern Sie eine Paarprüfung an, um intelligente Optimierungsempfehlungen zu generieren, die die Gewichtungen und Schwellenwerte Ihres Abgleichalgorithmus optimieren. Während einer Paarprüfung vergleicht ein Data-Steward Paare von Datensätzen, um festzustellen, ob es sich um eine Übereinstimmung, möglicherweise um eine Übereinstimmung oder um keine Übereinstimmung handelt. Die Antworten des Data-Stewards informieren über die daraus resultierenden Optimierungsempfehlungen.
Optimierungsempfehlungen anwenden. Nach Abschluss einer Paarprüfaufgabe kann ein Datenentwickler entscheiden, ob die Optimierungsempfehlungen angewendet werden.
Schwellenwerte für automatische und manuelle Überprüfung definieren. Wenn Sie Optimierungsempfehlungen von Paarprüfungen akzeptieren, werden die Schwellenwerte für autolink und clerical automatisch ermittelt, aber Sie können die Schwellenwerte bei Bedarf jederzeit manuell überschreiben. Jeder Abgleich von Datensatz zu Datensatz, der von IBM Match 360 ausgeführt wird, generiert eine übereinstimmende Bewertung. Dieser Score kann als Prozentwert von 0 bis 100 verwendet werden, wobei 0 eine bestimmte Nichtübereinstimmung und 100 eine bestimmte Übereinstimmung ist. Im Rahmen der Konfiguration des Abgleichalgorithmus kann ein Datenentwickler zwei Schwellenwerte definieren:
Der autolink-Schwellenwert definiert die minimale Übereinstimmungsquote für den Algorithmus, um eine automatische Übereinstimmungsentscheidung zwischen zwei beliebigen Datensätzen zu treffen.
- Wenn der Autolink-Schwellenwert niedrig ist, haben Sie mehr Übereinstimmungen insgesamt, mit wahrscheinlich mehr falsch-positiven Übereinstimmungen.
- Wenn der Schwellenwert für autolink hoch ist, haben Sie insgesamt weniger Übereinstimmungen und mehr Singleton-Entitäten (die nur aus einem einzigen Mitgliedsdatensatz bestehen) mit wahrscheinlich mehr falsch negativen Nichtübereinstimmungen.
Der Schwellenwert für manuelle Überprüfung definiert die minimale Übereinstimmungsquote für eine potenzielle Übereinstimmung. Scores unterhalb des Grenzwerts für die manuelle Überprüfung werden als Nichtübereinstimmungen betrachtet. Scores, die zwischen dem Schwellenwert für die manuelle Überprüfung und dem Schwellenwert für die automatische Verknüpfung liegen, können über den Workflow für potenzielle Übereinstimmungen gesendet werden, damit sie von einem Data-Steward-Benutzer korrigiert werden können.
Wichtig: Wenn der Bürobereich in den entsprechenden Einstellungen nicht aktiviert ist, kann der Workflow für potenzielle Übereinstimmungen keine Aufgaben generieren. Informationen zum Workflow für potenzielle Übereinstimmungen finden Sie unter [Workflows für Stammdaten konfigurieren] (m360-config-workflow.html).
Informationen zu Prozeduren zur erweiterten Algorithmusoptimierung, die die REST-API IBM Match 360 verwenden, finden Sie unter Erweiterte Algorithmusoptimierung.
Inhalt dieses Themas:
- Vorbereiten des Abgleichungsalgorithmus
- Übereinstimmende Attribute auswählen
- Paarprüfungen anfordern und Optimierungsempfehlungen anwenden
- Schwellenwerte für automatische Prüfung und manuelle Prüfung durch Sachbearbeiter ändern
Vorbereiten des Abgleichungsalgorithmus
Wenn Sie noch keinen Abgleich für Ihre Daten ausgeführt haben, müssen Sie zuerst Ihre übereinstimmenden Attribute auswählen, bevor Sie den Abgleich ausführen. Sie können die ausgewählten Attribute bei Bedarf später ändern.
Sie können die Sensitivität Ihres Autolink-Schwellenwerts oder die Paarprüfungen erst ändern, nachdem Sie mindestens einmal einen Abgleich durchgeführt haben. Diese Einschränkung stellt sicher, dass Sie eine gewisse Vergleichsbasis haben, um Ihren Schwellenwert von der Standardsensitivität zu ändern. Wenn Sie zum Beispiel zu viele falsche positive Übereinstimmungen in Ihren Daten bemerken, können Sie die Empfindlichkeit erhöhen. Wenn zu viele Singleton-Datensätze vorhanden sind, können Sie die Sensitivität verringern.
Bevor Sie die Einstellungen für Ihren Abgleichalgorithmus ändern, sollten Sie eine neue Konfigurationsmomentaufnahme erstellen, um die aktuellen Einstellungen zu speichern. Wenn Sie einen Snapshot erstellen, können Sie später leichter zur vorherigen Konfiguration zurückkehren, wenn Sie mit den Ergebnissen Ihrer Änderungen nicht zufrieden sind. Informationen zum Erstellen von Momentaufnahmen finden Sie unter Konfigurationseinstellungen für Masterdaten mithilfe von Momentaufnahmen speichern und laden.
Übereinstimmende Attribute auswählen
Gehen Sie wie folgt vor, um die Attribute auszuwählen, die IBM Match 360 im Abgleichalgorithmus verwendet:
Klicken Sie im Navigationsmenü " Stammdaten" auf " Match setup ' ".
Wählen Sie die Art der Entität, deren Abgleichalgorithmus Sie einstellen möchten.
Wechseln Sie zur Registerkarte Übereinstimmungseinstellungen und wählen Sie in der Seitenleiste Attributauswahl aus, um die Attribute auszuwählen, die in übereinstimmenden Daten verwendet werden sollen. Wenn Sie zum ersten Mal auf diese Registerkarte gehen, generiert IBM Match 360 automatisch einige vorgeschlagene Attribute aus Ihrem Datenmodell, um sie in Übereinstimmung zu verwenden.
Prüfen Sie die Liste der Abgleichattribute und die zugehörigen Komponentenfelder. Diese Attribute und Felder werden als Vergleichsgrundlage verwendet, um Datensätze abzugleichen und Stammdatenentitäten zu erstellen. Klicken Sie zum Hinzufügen oder Entfernen von Attributen in der Liste auf Attribute bearbeiten und wählen Sie anschließend nach Bedarf Attribute und zugehörige Komponentenfelder aus bzw. ab.
Wenn Sie Ihre übereinstimmenden Attribute auswählen, verwenden Sie den Anzeiger Übereinstimmungsstärke , um eine Schätzung zu sehen, wie sich Ihre Änderungen auf den Abgleichalgorithmus auswirken.
Wenn angepasste Attribute zum Datenmodell hinzugefügt haben, werden sie standardmäßig nicht zur Berücksichtigung beim Abgleich ausgewählt. Wenn Sie für den Abgleich einen angepassten Attributtyp verwenden möchten, wählen Sie den betreffenden Typ aus und geben Sie an, welche Felder berücksichtigt werden sollen. Wenn Sie keine Felder angeben, kann das betreffende Attribut nicht vom Abgleichalgorithmus verwendet werden.
Wenn Sie für nicht angepasste (vordefinierte) Attributtypen keine Felder angeben, die berücksichtigt werden sollen, verwendet der Abgleichalgorithmus eine Standardgruppe von Feldern.
Wenn die geänderten Abgleichattribute Ihren Wünschen entsprechen, klicken Sie auf Speichern.
Generieren Sie die Abgleichentitäten erneut auf der Basis der geänderten Einstellungen. Klicken Sie in der Aktionsleiste auf das Symbol ' für die entsprechende Ausführung.
Der Abgleichprozess dauert eine Weile, bis der Vorgang abgeschlossen ist. Es wird im Hintergrund ausgeführt, damit Sie die Arbeit fortsetzen können. Sie werden benachrichtigt, wenn der Vorgang abgeschlossen ist. Anschließend können Sie die Ergebnisdetails auf der Registerkarte Abgleichergebnisse überprüfen.
Paarprüfungen anfordern und Optimierungsempfehlungen anwenden
Verwenden Sie Paarprüfungen, um Ihren Abgleichalgorithmus zu optimieren. Jede Organisation verfügt über unterschiedliche Risikotoleranzstufen für falsche Übereinstimmungen und Paarprüfungen können dabei helfen, die richtigen Übereinstimmungseinstellungen für Sie zu finden.
Datenentwickler können zwei Prüfungen anfordern, die von einem Data-Steward durchgeführt werden sollen, und dann entscheiden, ob die resultierenden Optimierungsempfehlungen akzeptiert werden sollen.
Gehen Sie wie folgt vor, um eine Paarprüfung anzufordern:
Klicken Sie im Navigationsmenü " Stammdaten" auf " Match setup ' ".
Wählen Sie die Art der Entität, deren Abgleichalgorithmus Sie einstellen möchten.
Wählen Sie Algorithmusoptimierung in der Seitenleiste aus, um auf die Algorithmusoptimierungstools zuzugreifen.
Klicken Sie im Abschnitt Pair review auf Request pair review.
Wählen Sie die Anzahl der Datensatzpaare aus, die im Rahmen dieser Aufgabe geprüft werden sollen. Die Überprüfung weiterer Paare führt zu besseren Optimierungsempfehlungen. Wenn zu wenige Paare geprüft werden, kann IBM Match 360 keine Empfehlungen generieren.
Hinweis: Die tatsächliche Anzahl generierter Paare entspricht möglicherweise nicht der in diesem Schritt definierten Anzahl. Die Anzahl der generierten Datensatzpaare hängt von der verfügbaren Datenmenge im System und anderen Faktoren ab.Klicken Sie auf Anforderung senden.
IBM Match 360 beginnt mit der Generierung der Datensatzpaare und der Erstellung der Paarprüfaufgabe. Im Abschnitt Algorithmusoptimierung werden Sie über den Status der Prüfung (Paare generieren oder Prüfung in Bearbeitung) benachrichtigt und der Fortschritt der aktuellen Prüfaufgabe wird verfolgt.
Informationen zum Ausführen einer Paarprüftask als Data-Steward-Benutzer finden Sie unter Paarprüfungen abschließen.
Gehen Sie wie folgt vor, um die von einer Paarprüfung generierten Optimierungsempfehlungen zu prüfen und anzuwenden:
Klicken Sie im Navigationsmenü " Stammdaten" auf " Match setup ' ".
Wählen Sie die Art der Entität, deren Abgleichalgorithmus Sie einstellen möchten.
Wählen Sie Algorithmusoptimierung in der Seitenleiste aus, um auf die Algorithmusoptimierungstools zuzugreifen.
Überprüfen Sie im Abschnitt Paarprüfung den Fortschritt der letzten Paarprüfungsaufgabe. Sie können die Gesamtzahl der geprüften Paare und die Anzahl der Paare anzeigen, die als Übereinstimmungen, nicht Übereinstimmungen oder unsichere Übereinstimmungen ermittelt wurden.
Überprüfen Sie im Abschnitt Schwellenwerte die Einstellungen des aktuellen Abgleichsalgorithmus sowie Schätzungen der aktuellen falsch-positiven und falsch-negativen Raten.
Wenn zu wenige Bewertungen für Paare abgeschlossen wurden oder wenn der Abgleich noch nicht ausgeführt wurde, können die falsch-positiven und falsch-negativen Raten nicht angezeigt werden.
Erweitern Sie den Abschnitt Schwellenwertempfehlung .
Überprüfen Sie die empfohlenen Aktualisierungen für die entsprechenden Algorithmuseinstellungen. Die Empfehlung stellt den Schwellenwert mit den niedrigsten falsch-positiven und falsch-negativen Raten auf der Basis Ihrer geprüften Paare dar.
Wenn Sie die empfohlenen Einstellungen verwenden wollen, klicken Sie auf Empfehlung anwenden. Durch das Anwenden der Empfehlung werden die Autolink-Sensitivität und die zugehörigen übereinstimmenden Gewichtungen jedes Attributs geändert.
Generieren Sie die Abgleichentitäten erneut auf der Basis der geänderten Einstellungen. Wechseln Sie zur Registerkarte Abgleichsergebnisse und klicken Sie dann in der Aktionsleiste auf das Symbol für den Abgleich " .
Der Abgleichprozess dauert eine Weile, bis der Vorgang abgeschlossen ist. Es wird im Hintergrund ausgeführt, damit Sie die Arbeit fortsetzen können. Sie werden benachrichtigt, wenn der Vorgang abgeschlossen ist. Anschließend können Sie die Ergebnisdetails auf der Registerkarte Abgleichergebnisse überprüfen.
Schwellenwerte für automatische Prüfung und manuelle Prüfung von Sachbearbeitern ändern
Wenn Sie keine Paarprüfungen verwenden, um Empfehlungen zu erstellen, kann die Suche nach der richtigen Sensibilität für Autolink und manuelle Überprüfung für Ihre Anforderungen einige Versuche und Fehler in Anspruch nehmen. Bei speziellen Anforderungen für Ihre Organisation müssen Sie den Prozess zum Anpassen der Empfindlichkeit und zum Abgleichen der Daten möglicherweise mehrfach wiederholen.
Der gesamte Autolink-Schwellenwert wird berechnet, indem die Autolink-Empfindlichkeit (0-100) mit der maximal möglichen Übereinstimmungsbewertung multipliziert wird, die auf der Basis der ausgewählten Übereinstimmungsattribute und ihrer maximalen Gewichte im Algorithmus bestimmt wird.
Gehen Sie wie folgt vor, um die Sensitivität der Schwellenwerte für automatische und manuelle Überprüfung des übereinstimmenden Alogrithmus zu ändern:
- Klicken Sie im Navigationsmenü " Stammdaten" auf " Match setup ' ".
- Wählen Sie die Art der Entität, deren Abgleichalgorithmus Sie einstellen möchten.
- Wählen Sie Algorithmusoptimierung in der Seitenleiste aus, um auf die Algorithmusoptimierungstools zuzugreifen.
- Überprüfen Sie die aktuellen Einstellungen im Abschnitt Schwellenwerte .
- Verwenden Sie den Schieberegler oder geben Sie Zahlenwerte ein, um Ihre Schwellenwerte für automatische und manuelle Überprüfung zu aktualisieren, und klicken Sie anschließend auf Schwellenwert anwenden. Sie werden aufgefordert, einen Abgleich auszuführen, um Ihre Algorithmusänderungen anzuwenden.
- Optional können Sie den Bereich für die manuelle Überprüfung inaktivieren, indem Sie den Umschaltschalter Bereich für manuelle Überprüfung verwenden. Wenn der Bereich für manuelle Überprüfung inaktiviert ist, kann der Algorithmus nur Abgleichungs-oder Nichtübereinstimmungsentscheidungen treffen und keine potenziellen Abgleichtasks für Data-Stewards zur Korrektur in die Warteschlange stellen.
- Generieren Sie die Abgleichentitäten erneut auf der Basis der geänderten Einstellungen. Wechseln Sie zur Registerkarte " Abgleichsergebnisse " und klicken Sie in der Aktionsleiste auf das Symbol für die Ausführung des Abgleichs " .
Der Abgleichprozess dauert eine Weile, bis der Vorgang abgeschlossen ist. Es wird im Hintergrund ausgeführt, damit Sie die Arbeit fortsetzen können. Sie werden benachrichtigt, wenn der Vorgang abgeschlossen ist. Anschließend können Sie die Ergebnisdetails auf der Registerkarte Abgleichergebnisse überprüfen.
Nächste Schritte
Weitere Informationen
Übergeordnetes Thema: Stammdaten konfigurieren