0 / 0
Zurück zur englischen Version der Dokumentation
Anwendungsfall 'MLOps und vertrauenswürdige KI'
Anwendungsfall 'MLOps und vertrauenswürdige KI'

Anwendungsfall 'MLOps und vertrauenswürdige KI'

Für das Management von Daten und Modellassets über den gesamten KI-Lebenszyklus hinweg benötigt Ihr Unternehmen integrierte Systeme und Prozesse. Cloud Pak for Data as a Service stellt die Prozesse und Technologien bereit, mit denen Ihr Unternehmen Modelle für maschinelles Lernen (ML) und KI in der Produktion entwickeln, bereitstellen, verwalten und verwalten kann.

Sehen Sie sich dieses Video an, um den Anwendungsfall für Datenstrukturen zur Implementierung einer Lösung in Cloud Pak for Datazu sehen.

Dieses Video bietet eine visuelle Darstellung als Alternative zu den im Folgenden schriftlich dokumentierten Schritten.

Challenges (Abfragen)

Die Einrichtung von MLOps and trustworthy AI für Unternehmen umfasst die folgenden Herausforderungen:

Datenzugriff
Organisationen müssen einfachen Zugriff auf konsolidierte und regulierte Daten für Data-Science-Teams bereitstellen, die die Daten verwenden, um vertrauenswürdige KI-und ML-Anwendungen zu erstellen.

Operationalisierungsmodelle
Organisationen müssen wiederholt anwendbare Prozesse implementieren, um Modelle zu erstellen und bereitzustellen und die Modelle in Produktionsumgebungen zu übernehmen.

Modellgovernance und -konformität sicherstellen
Organisationen müssen Modelle in der Produktion überwachen, um sicherzustellen, dass die Modelle erklärbar, gültig und genau sind und keine Verzerrungen einführen oder von den beabsichtigten Zielen abweichen.

Sie können diese Herausforderungen lösen, indem Sie einen automatisierten MLOps-Lebenszyklus mit einem Datenfabric in Cloud Pak for Data as a Serviceimplementieren.


Beispiel: Herausforderungen der Goldenen Bank

Verfolgen Sie die Geschichte der Golden Bank, während sie einen MLOps and trustworthy AI implementiert, um ihr Geschäft zu erweitern, indem sie kostengünstige Hypothekenverlängerungen für Online-Anwendungen anbietet. Data-Scientists der Golden Bank müssen ein Hypothekengenehmigungsmodell erstellen, das unvorhergesehene Risiken vermeidet und alle Antragsteller fair behandelt.

Prozess

Zur Implementierung von MLOps and trustworthy AI für Ihr Unternehmen kann Ihr Unternehmen diesen Prozess befolgen:

  1. Daten gemeinsam nutzen
  2. Modelle erstellen und trainieren
  3. Modellbereitstellung
  4. Monitormodelle
  5. Modelle verfolgen
  6. Automatisierung des KI-Lebenszyklus

Die Services Watson Studio, Watson Machine Learning, Watson OpenScaleund Watson Knowledge Catalog in Cloud Pak for Data as a Service stellen die Tools und Prozesse bereit, die Ihre Organisation für die Implementierung eines MLOps and trustworthy AI -Lösung.

Abbildung mit dem Ablauf des MLOps-und trusworthy AI-Anwendungsfalls

1. Gemeinsame Nutzung der Daten

Der Katalog dient als Featuregeschäft, in dem Ihre Data-Scientist-Teams hochwertige Datenassets mit den benötigten Features finden können. Sie können Datenassets aus einem Katalog zu einem Projekt hinzufügen, wo sie zusammenarbeiten, um die Daten vorzubereiten, zu analysieren und zu modellieren.

Was Sie verwenden können Aktion Am besten zu verwenden, wenn
Kataloge Verwenden Sie Kataloge in Watson Knowledge Catalog als Feature-Store, um Ihre Assets so zu organisieren, dass sie von den Mitarbeitern in Ihrer Organisation gemeinsam genutzt werden können.

Nutzen Sie die KI-basierte semantische Suche und Empfehlungen, damit Benutzer finden, was sie benötigen.
Ihre Benutzer müssen die hochwertigen Daten auf einfache Weise verstehen, zusammenarbeiten, aufbereiten und auf sie zugreifen können.

Sie möchten die Sichtbarkeit von Daten und die Zusammenarbeit zwischen Geschäftsbenutzern verbessern.

Sie benötigen Benutzer zum Anzeigen, Zugreifen, Bearbeiten und Analysieren von Daten, ohne ihr physisches Format oder ihre Position zu verstehen, und ohne sie verschieben oder kopieren zu müssen.

Sie möchten, dass Benutzer Assets durch Bewertung und Prüfung erweitern.


Beispiel: Golden Bank-Katalog

Der Leiter des Governance-Teams erstellt den Katalog "Mortgage Approval Catalog" und fügt die Data-Stewards und Data-Scientists als Katalogmitarbeiter hinzu. Die Data-Stewards publizieren die von ihnen erstellten Datenassets im Katalog. Die Data-Scientists suchen die von den Data-Stewards kuratierten Datenassets im Katalog und kopieren diese Assets in ein Projekt. In ihrem Projekt können die Data-Scientists die Daten optimieren, um sie für das Training eines Modells vorzubereiten.


2. Modelle erstellen und trainieren

Um Vorhersageerkenntnisse auf der Basis Ihrer Daten zu erhalten, können Data-Scientists, Geschäftsanalysten und Entwickler für maschinelles Lernen Modelle erstellen und trainieren. Data-Scientists verwenden Cloud Pak for Data as a Service -Services, um die KI-Modelle zu erstellen und sicherzustellen, dass die richtigen Algorithmen und Optimierungen verwendet werden, um Vorhersagen zu treffen, die bei der Lösung von Geschäftsproblemen helfen.

Was Sie verwenden können Aktion Am besten zu verwenden, wenn
AutoAI Verwenden Sie AutoAI in Watson Studio , um Algorithmen automatisch auszuwählen, Funktionen zu entwickeln, Pipeline-Kandidaten zu generieren und Modellpipelinekandidaten zu trainieren.

Bewerten Sie dann die eingestuften Pipelines und speichern Sie die besten als Modelle.

Bereitstellen die trainierten Modelle in einen Bereich oder exportieren Sie die Modelltrainingspipeline, die Ihnen gefällt, aus AutoAI in ein Notebook, um sie zu optimieren.
Sie möchten eine erweiterte und automatisierte Methode zum schnellen Erstellen einer guten Gruppe von Trainingspipelines und -modellen.

Sie möchten in der Lage sein, die generierten Pipelines zu exportieren, um sie zu optimieren.
Notebooks und Scripts Verwenden Sie Notebooks und Scripts in Watson Studio , um Ihr eigenes Feature-Engineering-Modell-Training und Evaluierungscode in Pythonoder R auf der Basis von Trainingsdatasets, die im Projekt verfügbar sind, oder Verbindungen zu Datenquellen wie Datenbanken, Data-Lakes oder Objektspeicher zu schreiben.

Verwenden Sie Ihre bevorzugten Algorithmen und Bibliotheken.
Sie möchten Python -oder R-Programmierkenntnisse verwenden, um die volle Kontrolle über den Code zu haben, der zum Erstellen, Trainieren und Auswerten der Modelle verwendet wird.
SPSS Modeler-Abläufe Verwenden Sie SPSS Modeler -Abläufe in Watson Studio , um eigene Trainings-, Evaluierungs-und Scoring-Abläufe für Modelle auf der Basis von Trainingsdatasets, die im Projekt verfügbar sind, oder Verbindungen zu Datenquellen wie Datenbanken, Data Lakes oder Objektspeicher zu erstellen. Sie wollen eine einfache Methode zum Untersuchen von Daten und zum Definieren von Trainings-, Evaluierungs-und Scoring-Abläufen für Modelle.
RStudio Analysieren Sie Daten und erstellen und testen Sie Modelle, indem Sie mit R in einer Entwicklungsumgebung von RStudio Server mit R 3.6 arbeiten. Sie möchten eine Entwicklungsumgebung für die Arbeit in R verwenden.
Decision Optimization Mit Watson Machine Learningkönnen Sie Daten vorbereiten, Modelle importieren, Probleme lösen und Szenarien vergleichen, Daten visualisieren, Lösungen finden, Berichte erstellen und Modelle speichern, um sie bereitzustellen. Sie müssen Millionen von Möglichkeiten bewerten, um die beste Lösung für ein präskriptives Analyseproblem zu finden.
Föderiertes Lernen Trainieren Sie ein allgemeines Modell mit verteilten Daten. Sie müssen ein Modell trainieren, ohne Daten zu verschieben, zu kombinieren oder gemeinsam zu nutzen, die über mehrere Standorte verteilt sind.


Beispiel: Modellerstellung und -schulung der Golden Bank

Data-Scientists der Golden Bank erstellen ein Modell "Hypothekengenehmigungsmodell", das unvorhergesehene Risiken vermeidet und alle Antragsteller fair behandelt. Sie möchten den Verlauf und die Leistung des Modells von Anfang an verfolgen, sodass sie einen Modelleintrag zum "Hypothekenkatalog" hinzufügen. Sie führen ein Notebook aus, um das Modell zu erstellen und vorherzusagen, welche Antragsteller für Hypotheken qualifiziert sind. Die Details des Modelltrainings werden automatisch als Metadaten im Modelleintrag erfasst.


3. Modelle bereitstellen

Wenn Mitglieder des Betriebsteams Ihre KI-Modelle einsetzen, stehen die Modelle auch für Anwendungen bereit, die sie für Scoring und Vorhersagen nutzen können, um Laufwerkaktionen zu fördern.

Was Sie verwenden können Aktion Am besten zu verwenden, wenn
Benutzerschnittstelle (UI) der Bereiche Verwenden Sie die Bereichsbenutzerschnittstelle in Watson Machine Learning , um Modelle und andere Assets aus Projekten in Bereichen bereitzustellen. Wenn Sie die Verwendung einer Benutzerschnittstelle bevorzugen.
Befehlszeilentool (cpdctl) Mit dem Befehlszeilentool 'cpdctl' in Watson Machine Learning können Sie den Lebenszyklus von Modellen einschließlich der Konfigurationseinstellungen verwalten und einen End-to-End-Ablauf automatisieren, der das Trainieren des Modells, das Speichern des Modells, das Erstellen eines Bereitstellungsbereichs und das Bereitstellen des Modells umfasst. Sie möchten Modelle in Test-oder Produktionsumgebungen über eine Befehlszeile implementieren.


Beispiel: Modellbereitstellung der Golden Bank

Die Mitglieder des Betriebsteams der Golden Bank fördern das "Hypothekengenehmigungsmodell" aus dem Projekt in einen Bereitstellungsbereich und erstellen anschließend eine Onlinemodellbereitstellung.


4. Implementierte Modelle überwachen

Nachdem Modelle bereitgestellt wurden, ist es wichtig, sie zu regeln und zu überwachen, um sicherzustellen, dass sie erklärbar und transparent sind. Datenwissenschaftler müssen in der Lage sein zu erklären, wie die Modelle zu bestimmten Vorhersagen kommen, damit sie festlegen können, ob die Vorhersagen implizit oder explizit verzerrt sind. Darüber hinaus ist Best Practice, während des Lebenszyklus des Modells auf Probleme mit der Modellleistung und der Datenkonsistenz zu achten.

Was Sie verwenden können Aktion Am besten zu verwenden, wenn
Watson OpenScale Überwachen Sie Modellfairnessprobleme über mehrere Funktionen hinweg.

Überwachen Sie die Modellleistung und Datenkonsistenz über einen bestimmten Zeitraum hinweg.

Erläutern Sie, wie das Modell bei bestimmten Vorhersagen mit Gewichtungsfaktoren angekommen ist.

Verwalten und dokumentieren Sie die Modellgovernance und den Lebenszyklus in Ihrem gesamten Unternehmen.
Wenn Sie Funktionen haben, die geschützt sind oder zur Fairness bei der Vorhersage beitragen können.

Sie müssen die Modellleistung und Datenkonsistenzen im Zeitverlauf verfolgen.

Sie müssen wissen, warum das Modell bestimmte Vorhersagen liefert.


Beispiel: Modellüberwachung der Goldenen Bank

Data-Scientists von der Golden Bank verwenden Watson OpenScale , um das implementierte "Hypothekengenehmigungsmodell" zu überwachen, um sicherzustellen, dass es korrekt ist, und alle Antragsteller von Hypotheken der Golden Bank fair zu behandeln. Sie führen ein Notebook aus, um Monitore für das Modell einzurichten, und optimieren dann die Konfiguration mithilfe der Watson OpenScale -Benutzerschnittstelle. Mithilfe von Metriken der Qualitätsüberwachung und Fairnessüberwachung von Watson OpenScale bestimmen die Data-Scientists, wie gut das Modell Ergebnisse vorhersagt und ob es verzerrte Ergebnisse erzeugt. Sie erhalten auch ein Verständnis, wie das Modell zu Entscheidungen kommt, so dass die Entscheidungen den Hypothekenantragstellern erklärt werden können.


5. Modelle verfolgen

Neben der Überwachung Ihrer Modelle auf Fairness und Erklärbarkeit muss Ihr Team die Produktionsmodelle verfolgen, um sicherzustellen, dass sie gut funktionieren.

Was Sie verwenden können Aktion Am besten zu verwenden, wenn
Factsheets Zeigen Sie im Modellbestand in einem Katalog in Watson Knowledge Catalogden Lebenszyklusstatus für alle registrierten Assets an und führen Sie einen Drilldown zu detaillierten Factsheets für Modelle oder Bereitstellungen durch, die für den Modelleintrag registriert sind.

Zeigen Sie allgemeine Modelldetails, Trainingsinformationen und Metriken sowie Eingabe-und Ausgabeschema an.

Zeigen Sie allgemeine Bereitstellungsdetails, Bewertungsdetails, Qualitätsmetriken, Fairnessdetails und Abweichungsdetails an.
Sie wollen sicherstellen, dass Ihr Modell wie erwartet arbeitet.

Sie möchten feststellen, ob Sie Anpassungen vornehmen müssen.


Beispiel: Modellverfolgung der Goldenen Bank

Geschäftsanalysten der Golden Bank fordern ein "Hypothekengenehmigungsmodell" an. Anschließend können sie das Modell in allen Phasen des KI-Lebenszyklus verfolgen, während Data-Scientists das Modell erstellen und trainieren und ModelOps-Entwickler es bereitstellen und bewerten. Factsheets dokumentieren Details zum Modellverlauf und generieren Metriken, die seine Leistung anzeigen.


6. Automatisieren Sie den ML-Lebenszyklus

Ihr Team kann den MLOps-und KI-Lebenszyklus mit Watson Studio -Pipelines (Beta) automatisieren und vereinfachen.

Was Sie verwenden können Aktion Am besten zu verwenden, wenn
Pipelines (Beta) Verwenden Sie Pipelines in Watson Studio , um wiederholt anwendbare und geplante Abläufe zu erstellen, die Notebooks, Data Refineryund Pipelines für maschinelles Lernen automatisieren, von der Datenaufnahme bis hin zu Modelltraining, -tests und -bereitstellung. Sie möchten einen oder alle Schritte im MLOps-Ablauf automatisieren.


Beispiel: Automatisierter ML-Lebenszyklus der Golden Bank

Die Data-Scientists der Golden Bank können mithilfe von Pipelines auch den gesamten Lebenszyklus und die Prozesse von MLOps and trustworthy AI automatisieren, um den Hypothekengenehmigungsprozess zu vereinfachen.


Tutorials für MLOps and trustworthy AI

Lernprogramm Beschreibung Fachkenntnisse für das Lernprogramm
Modell erstellen und bereitstellen Sie trainieren ein Modell, stufen es in einen Bereitstellungsbereich hoch und stellen das Modell bereit. Führen Sie ein Notebook aus.
Modell testen und validieren Sie bewerten ein Modell auf Genauigkeit, Fairness und Erklärbarkeit. Führen Sie ein Notebook aus und zeigen Sie Ergebnisse in der Benutzerschnittstelle an.

Weitere Informationen

Übergeordnetes Thema: Übersicht über die Datenstrukturlösung