Schnelleinstieg: Modell für maschinelles Lernen erstellen und bereitstellen

Sie können den Erstellungsprozess für ein Modell für maschinelles Lernen mit dem AutoAI-Tool automatisieren. Lesen Sie die Informationen zum AutoAI-Tool, sehen Sie sich dann ein Video an und führen Sie ein Lernprogramm aus, das für Anfänger geeignet ist und bei dem keine Codierung erforderlich ist.

Erforderlicher Service Watson Machine Learning

Ihr grundlegender Workflow umfasst die folgenden Tasks:

  1. Sie erstellen ein Projekt. Projekte sind der Ort, an dem Sie gemeinsam mit anderen mit Daten arbeiten.
  2. Fügen Sie dem Projekt Daten hinzu. Sie können CSV-Dateien oder Daten aus einer fernen Datenquelle über eine Verbindung hinzufügen.
  3. Erstellen Sie ein AutoAI-Experiment im Projekt.
  4. Überprüfen Sie die Modellpipelines und speichern Sie die gewünschte Pipeline als Modell für die Bereitstellung oder als anzupassendes Notebook.
  5. Stellen Sie das Modell bereit und testen Sie es.

Lesen Sie mehr über AutoAI

Vom Grafiktool AutoAI in Watson Studio werden Daten automatisch analysiert und in Frage kommende Modellpipelines für das Vorhersagemodellierungsproblem generiert. Diese Modellpipelines werden iterativ erstellt, wobei AutoAI das Dataset analysiert und die Datentransformationen, Algorithmen und Parametereinstellungen ermittelt, die sich für Ihre Problemstellung am besten eignen. Die Ergebnisse werden in einer Bestenliste angezeigt, in der die automatisch generierten Modellpipelines entsprechend Ihrem Problemoptimierungsziel eingestuft werden.

Weitere Informationen zu AutoAI

Weitere Möglichkeiten zum Erstellen von Modellen

Video über die Erstellung eines Modells mit AutoAI ansehen

Video ansehenDieses Video zeigt, wie Sie ein AutoAI-Experiment basierend auf dem Bankmarketing-Beispiel erstellen und ausführen.

Dieses Video bietet eine visuelle Darstellung als Alternative zu den im Folgenden schriftlich dokumentierten Schritten.

  • Zeit Transkript
    00:00 In diesem Video wird gezeigt, wie Sie ein AutoAI-Beispielexperiment ausführen, um ein Watson Machine Learning-Modell zu erstellen.
    00:08 Beginnen Sie in einem Watson Studio-Projekt und fügen Sie diesem Projekt ein neues AutoAI-Experiment hinzu.
    00:16 Zum Ausführen eines AutoAI-Experiments benötigen Sie den Watson Machine Learning-Service.
    00:22 Hier haben Sie die Möglichkeit, diesem Projekt einen Watson Machine Learning-Service zuzuordnen.
    00:29 Sie können entweder eine neue Serviceinstanz erstellen oder eine vorhandene Serviceinstanz auswählen.
    00:39 Wenn Sie zu der Seite zurückkehren, auf der Sie das Experiment erstellen, laden Sie die Seite erneut, damit die neue Serviceinstanz aufgelistet wird.
    00:48 Für dieses erste Experiment wählen Sie eine Stichprobe aus.
    00:52 Das Beispiel "Bankmarketing" enthält Textdaten, die als Reaktion auf eine Marketingkampagne aus Telefonanrufen an eine Bank erfasst wurden.
    01:01 Wenn Sie ein Beispiel auswählen, werden der Name und die Beschreibung des Experiments automatisch eingetragen, sodass Sie direkt mit dem Erstellen des Experiments beginnen können.
    01:11 Als Nächstes wird AutoAI Experiment Builder angezeigt.
    01:15 Da dieses Experiment aus einem Beispiel stammt, ist die Quellendatei für das Bankmarketing bereits ausgewählt.
    01:22 Die Spalte für die Vorhersage ist ebenfalls bereits ausgewählt.
    01:26 In diesem Fall ist dies die Spalte "y", die angibt, ob sich ein Benutzer im Rahmen der Marketingkampagne für eine Termineinlage anmelden wird.
    01:35 Basierend auf dem Dataset und der ausgewählten Spalte für die Vorhersage analysiert AutoAI eine Teilmenge der Daten und wählt einen Vorhersagetyp und eine Metrik zur Optimierung aus.
    01:47 Da die vorherzusagende Spalte in diesem Fall die Werte "J" oder "N" (für Ja oder Nein) enthält, wurde die binäre Klassifikation ausgewählt.
    01:57 Die positive Klasse ist "Ja" und die optimierte Metrik ist ROC AUC.
    02:03 Die ROC AUC-Metrik gleicht Genauigkeit, Richtigkeit und Trefferquote aus.
    02:10 Führen Sie nun das Experiment aus und warten Sie, bis das "Pipeline-Leaderboard" ausgefüllt ist.
    02:17 Während des AutoAI-Trainings wird Ihr Dataset in zwei Teile unterteilt: Trainingsdaten und ausgeschlossene Daten.
    02:24 Die Trainingsdaten werden in den AutoAI-Trainingsphasen verwendet, um die Modellpipelines zu generieren. Mit Kreuzvalidierungsbewertungen werden sie nach dem Training eingestuft.
    02:34 Nach dem Training werden die ausgeschlossenen Daten für die Ergebnisauswertung des Pipelinemodells und die Berechnung von Leistungsinformationen wie ROC-Kurven und Wahrheitsmatrizen verwendet.
    02:48 Als Nächstes generiert AutoAI Pipelines mit unterschiedlichen Schätzern (z. B. dem XGBoost-Klassifikationsmerkmal) oder Erweiterungen (z. B. Hyperparameteroptimierung und Feature-Engineering), wobei die Pipelines auf Basis der Genauigkeitsmetrik eingestuft werden.
    03:06 Die Hyperparameteroptimierung ist ein Mechanismus zum automatischen Untersuchen eines Suchbereichs potenzieller Hyperparameter, zum Erstellen einer Reihe von Modellen und zum Vergleichen der Modelle unter Verwendung von relevanten Metriken.
    03:20 Im Verlauf der Merkmalentwicklung wird versucht, die Rohdaten in eine Kombination aus Merkmalen zu transformieren, die am besten dazu geeignet sind, die genaueste Vorhersage zu erstellen.
    03:31 Ok, die Ausführung ist abgeschlossen.
    03:34 In der Legende wird erläutert, wo sich die Daten, der höchste Algorithmus, die Pipelines und Feature-Transformer in der Beziehungszuordnung befinden.
    03:44 Sie können das vollständige Protokoll anzeigen, um die gesamten Details anzuzeigen.
    03:48 Standardmäßig wird die "Beziehungszuordnung" angezeigt, aber Sie auch zur Ansicht mit der "Fortschrittsübersicht" wechseln.
    03:57 Scrollen Sie nach unten, um sich die Bestenliste anzusehen.
    04:01 Sie können mit dem Vergleich der Pipelines beginnen.
    04:05 Dieses Diagramm enthält Metriken für die acht Pipelines, die nach Kreuzvalidierungsbewertung oder nach der Bewertung der ausgeschlossenen Daten angezeigt werden.
    04:13 Die Pipelines werden so angezeigt, wie sie auf Basis anderer Metriken, wie z. B. der durchschnittlichen Genauigkeit, eingestuft sind.
    04:21 Erweitern Sie auf der Registerkarte "Experimentübersicht" eine Pipeline, um die Maßnahmen zur Modellauswertung und die ROC-Kurve anzuzeigen.
    04:30 Sie können eine einzelne Pipeline anzeigen, um neben der Wahrheitsmatrix, der Precision-Recall-Kurve, Modellinformationen, Merkmalstransformationen und Merkmalbedeutung weitere Details anzuzeigen.
    04:49 Diese Pipeline hatte die höchste Einstufung, wodurch Sie sie als Modell für maschinelles Lernen speichern können.
    04:55 Akzeptieren Sie einfach die Standardwerte und speichern Sie das Modell.
    05:01 Nachdem Sie das Modell trainiert haben, können Sie es anzeigen und bereitstellen.
    05:06 Die Registerkarte "Übersicht" zeigt eine Modellzusammenfassung und das Eingabeschema an.
    05:12 Um das Modell bereitzustellen, müssen Sie es in einen Bereitstellungsbereich hochstufen.
    05:17 Da diesem Projekt noch kein Bereitstellungsbereich zugeordnet ist, müssen Sie zuerst die Zuordnung einrichten.
    05:25 Sie können entweder einen vorhandenen Bereitstellungsbereich auswählen oder einen neuen Bereitstellungsbereich erstellen.
    05:31 Wenn Sie einen neuen Bereich erstellen, geben Sie einfach einen Namen und eine Beschreibung an und wählen Sie den Service Cloud Object Storage und Watson Machine Learning aus.
    05:41 Erstellen Sie anschließend den Bereich.
    05:45 Wählen Sie nun diesen neuen Bereich aus, fügen Sie eine Beschreibung des Modells hinzu und klicken Sie auf "Hochstufen".
    05:53 Verwenden Sie den Link, um zum Bereitstellungsbereich zu wechseln.
    06:00 Hier ist das soeben erstellte Modell, das Sie jetzt bereitstellen können.
    06:04 In diesem Fall handelt es sich um eine Onlinebereitstellung.
    06:08 Geben Sie einfach einen Namen für die Bereitstellung an und klicken Sie auf "Erstellen".
    06:12 Warten Sie dann, während das Modell bereitgestellt wird.
    06:16 Wenn die Modellbereitstellung abgeschlossen ist, zeigen Sie sie an.
    06:20 Auf der Registerkarte "API-Referenz" finden Sie den Scoring-Endpunkt als zukünftige Referenz.
    06:26 Sie finden auch Code-Snippets für verschiedene Programmiersprachen, damit Sie diese Bereitstellung aus Ihrer Anwendung verwenden können.
    06:35 Auf der Registerkarte "Test" können Sie die Modellvorhersage testen.
    06:40 Sie können entweder Testeingabedaten eingeben oder JSON-Eingabedaten einfügen und dann auf "Vorhersagen" klicken.
    06:52 Es wird gezeigt, dass die erste Person mit sehr hoher Wahrscheinlichkeit keine Termineinlage abonniert und die zweite Person mit hoher Wahrscheinlichkeit eine Termineinlage abonniert.
    07:06 Im Projekt finden Sie auf der Registerkarte "Assets" das AutoAI-Experiment und das Modell.
    07:17 Weitere Videos finden Sie in der Dokumentation zu Cloud Pak for Data as a Service.

Lernprogramm zum Erstellen eines Modells mithilfe von AutoAI absolvieren

In diesem Lernprogramm führen Sie folgende Tasks aus:

  • Sie erstellen ein Projekt.
  • Ordnen Sie den Watson Machine Learning-Service dem Projekt zu.
  • Erstellen Sie ein AutoAI-Experiment im Projekt.
  • Erstellen und trainieren Sie ein Modell.
  • Speichern Sie eine Pipeline als Modell.
  • Stellen Sie das Modell bereit.
  • Testen Sie das Modell.

Für dieses Lernprogramm benötigen Sie ungefähr 30 Minuten.

Beispieldaten

Bei den Beispieldaten, die bei der angeleiteten Erkundung verwendet werden, handelt es sich um Daten zum Bankenmarketing, mit denen vorhergesagt wird, ob sich ein Kunde für eine Marketingaktion registriert. Die Daten werden automatisch hochgeladen und sind für Sie verfügbar, wenn Sie ein Beispiel aus der Gallery als Basis für Ihr Experiment auswählen.

Schritt 1: Ein Projekt erstellen und den Watson Machine Learning-Service zuordnen

{: #step1}Sie benötigen ein Projekt, um das AutoAI-Experiment zu speichern.

  1. Wenn Sie über ein bestehendes Projekt verfügen, öffnen Sie es. Wenn kein Projekt vorhanden ist, klicken Sie auf der Homepage auf Projekt erstellen oder auf der Seite Projekte auf Neues Projekt.
  2. Wählen Sie Leeres Projekt erstellen aus.
  3. Fügen Sie in der Anzeige Projekt erstellen einen Namen und optional eine Beschreibung für das Projekt hinzu.
  4. Wählen Sie eine vorhandene Instanz des Objektspeicherservice aus oder erstellen Sie eine neue Instanz.

  5. Klicken Sie auf Erstellen.

  6. Wenn das Projekt geöffnet wird, klicken Sie auf die Registerkarte Verwalten und wählen Sie die Seite Services und Integrationen aus.

  7. Klicken Sie im Abschnitt IBM Services auf Service zuordnen.
  8. Wenn Sie noch keine Watson Machine Learning-Serviceinstanz bereitgestellt haben, klicken Sie auf Neuer Service, wählen Sie 'Machine Learning' aus und klicken Sie auf Erstellen.
  9. Wählen Sie Ihre Watson Machine Learning-Instanz aus und klicken Sie auf Service zuordnen.
  10. Schließen Sie das Dialogfenster Service zuordnen.

Weitere Informationen sowie ein Video finden Sie unter Projekt erstellen.
Weitere Informationen zu zugehörigen Services finden Sie unter Zugeordnete Services hinzufügen.

Schritt 2: Das Modell erstellen und trainieren

{: #step2}Erstellen Sie das AutoAI-Experiment, überprüfen Sie die Modellpipelines und wählen Sie eine Pipeline zum Speichern als Modell aus.

  1. Klicken Sie auf der Registerkarte Assets Ihres Projekts auf Neues Asset > AutoAI-Experiment.
  2. Füllen Sie auf der Seite, die daraufhin geöffnet wird, die Felder für die grundlegenden Angaben aus:
    1. Klicken Sie auf Gallery-Beispiel und wählen Sie die Bankmarketing-Beispieldaten aus. Der Projektname und die Beschreibung werden für Sie ausgefüllt.
    2. Stellen Sie sicher, dass die Machine Learning-Serviceinstanz, die Sie Ihrem Projekt zugeordnet haben, im Abschnitt Machine Learning-Service ausgewählt ist.
  3. Klicken Sie auf Erstellen.
  4. In diesem AutoAI-Beispielexperiment sehen Sie, dass Beispieldaten für Bankmarketing bereits für Ihr Experiment ausgewählt wurden.
  5. Die Spalte "Y" wird automatisch für das Modell ausgewählt. Diese Spalte wird verwendet, um vorherzusagen, ob es wahrscheinlich ist, dass sich ein Kunde für eine Marketingaktion registrieren lässt. AutoAI analysiert die Daten und stellt fest, dass die Spalte 'Y' True/False-Informationen enthält, die für ein binäres Klassifikationsmodell geeignet sind. Die Standardmetrik für eine binäre Klassifizierung ist ROC/AUC.
  6. Basierend auf dem Dataset und der ausgewählten Spalte für die Vorhersage analysiert AutoAI eine Teilmenge der Daten und wählt einen Vorhersagetyp und eine Metrik zur Optimierung aus. In diesem Fall lautet der Vorhersagetyp Binäre Klassifizierung, die positive Klasse ist Ja und die optimierte Metrik ist ROC AUC.
  7. Klicken Sie auf Experiment ausführen. Während das Modell trainiert wird, wird eine Informationsgrafik angezeigt, die den Erstellungsprozess der Pipelines darstellt.
  8. Sobald die Pipelineerstellung abgeschlossen ist, können Sie die in einer Rangordnungsliste aufgeführten Pipelines anzeigen und vergleichen.
  9. Wählen Sie die Pipeline mit der höchsten Einstufung aus und wählen Sie im Aktionsmenü Modell speichern aus. Dadurch wird die Pipeline als Machine Learning-Asset in Ihrem Projekt gespeichert.
  10. Klicken Sie nach dem Speichern des Modells in der Benachrichtigung auf den Link In Projekt anzeigen, um das Modell in Ihrem Projekt anzuzeigen. Alternativ können Sie zur Registerkarte Assets im Projekt navigieren und im Abschnitt Machine Learning-Modell auf den Modellnamen klicken.

Schritt 3: Modell in einen Bereitstellungsbereich hochstufen und das trainierte Modell bereitstellen

Jetzt können Sie das Modell in einen Bereitstellungsbereich hochstufen, um das Modell bereitzustellen.

  1. Klicken Sie auf In Bereitstellungsbereich hochstufen.
  2. Wählen Sie einen vorhandenen Bereitstellungsbereich aus. Wenn kein Bereitstellungsbereich vorhanden ist, können Sie einen neuen erstellen:
    1. Geben Sie einen Bereichsnamen und optional eine Beschreibung an.
    2. Wählen Sie einen Speicherservice aus.
    3. Wählen Sie einen Machine Learning-Service aus.
    4. Klicken Sie auf Erstellen.
    5. Klicken Sie auf Schließen.
  3. Klicken Sie auf Hochstufen.
  4. Klicken Sie nach dem Hochstufen des Modells in der Benachrichtigung auf den Link Bereitstellungsbereich, um das Modell in Ihrem Projekt anzuzeigen. Alternativ können Sie über das Navigationsmenü zu Bereitstellungen navigieren und auf den Namen des Bereitstellungsbereichs klicken.
  5. Klicken Sie neben dem Modellnamen auf das Symbol Bereitstellen.
    1. Wählen Sie Online als Bereitstellungstyp aus.
    2. Geben Sie einen Namen für die Bereitstellung an.
    3. Klicken Sie auf Erstellen.
  6. Klicken Sie auf die Registerkarte Bereitstellungen und warten Sie, bis das Modell bereitgestellt wird.
  7. Klicken Sie nach Abschluss der Bereitstellung auf den Namen der Bereitstellung, um die Seite mit den Bereitstellungsdetails anzuzeigen.

Schritt 4: Das bereitgestellte Modell testen

{: #step4}Verwenden Sie die Bereitstellung, um das Modell mit neuen Daten zu testen.

  1. Klicken Sie auf die Registerkarte Test. Sie können das bereitgestellte Modell auf der Seite mit den Bereitstellungsdetails auf zwei Arten testen: Mithilfe eines Formulars oder mit JSON-Code.
  2. Klicken Sie auf das Symbol zum Bereitstellen von Eingabedaten als JSON, kopieren Sie dann die folgenden Testdaten und fügen Sie sie in den Bereich für den JSON-Text ein:

    {"input_data":[{
            "fields": ["age","job","marital","education","default","balance","housing","loan","contact","day", "month","duration","campaign","pdays","previous","poutcome"],
            "values": [[27,"unemployed", "married", "primary", "no",1787,"no", "no","cellular",19,"oct", 79, 1, -1, 0, "unknown" ]]
    }]}
    
  3. Klicken Sie auf Vorhersagen, um eine Vorhersage zu erhalten, die angibt, wie wahrscheinlich es ist, dass sich ein Kunde mit den angegebenen Attributen für eine bestimmte Art von Konto anmeldet. Die daraus resultierende Vorhersage zeigt an, dass für diesen Kunden eine hohe Wahrscheinlichkeit besteht, dass er sich nicht für die Marketing-Werbeaktion registriert.

Nächste Schritte

Sie können dieses Dataset nun für weitere Analysen verwenden. Beispielsweise können Sie oder andere Benutzer eine der folgenden Tasks ausführen:

Zusätzliche Ressourcen

Übergeordnetes Thema: Einstieg in den Aufbau, die Bereitstellung und das Vertrauen in Modelle