0 / 0
Zurück zur englischen Version der Dokumentation
Erstellen eines Textanalyseexperiments
Letzte Aktualisierung: 04. Okt. 2024
Erstellen eines Textanalyseexperiments

Verwenden Sie die Textanalysefunktion AutoAI's, um eine Textanalyse Ihrer Experimente durchzuführen. Führen Sie zum Beispiel eine grundlegende Stimmungsanalyse aus, um ein Ergebnis auf der Grundlage von Textkommentaren vorherzusagen.

Hinweis: Die Textanalyse ist nur für AutoAI -Klassifizierungs-und Regressionsexperimente verfügbar. Diese Funktion ist für Zeitreihenexperimente nicht verfügbar.

Übersicht über die Textanalyse

Wenn Sie ein Experiment erstellen, bei dem die Textanalysefunktion verwendet wird, wird der Text vom AutoAI-Prozess mithilfe des Algorithmus word2vec in Vektoren umgewandelt und danach ein Vergleich der Vektoren durchgeführt, um die Auswirkungen auf die Vorhersagespalte zu ermitteln.

Der Algorithmus word2vec verwendet einen Textkorpus als Eingabe und gibt eine Gruppe von Vektoren aus. Indem Text in eine numerische Darstellung verwandelt wird, kann er ähnliche Wörter erkennen und vergleichen. Wenn word2vec mit ausreichend Daten trainiert wird, kann der Algorithmus präzise Vorhersagen zur Bedeutung oder zur Beziehung eines Wortes zu anderen Wörtern machen. Die Vorhersagen können verwendet werden, um Texte zu analysieren und die Bedeutung in Anwendungen zur Stimmungsanalyse zu erraten.

Während der Feature-Engineering-Phase des Experimenttrainings werden mithilfe des Algorithmus word2vec 20 Features für die Textspalte generiert. Die automatische Erkennung von Textmerkmalen basiert auf der Analyse der Anzahl eindeutiger Werte in einer Spalte und der Anzahl der Tokens in einem Datensatz (Mindestanzahl = 3). Wenn die Anzahl eindeutiger Werte kleiner als die Anzahl aller Werte dividiert durch 5 ist, wird die Spalte nicht als Text behandelt.

Wenn das Experiment ausgeführt wurde, können Sie die Ergebnisse der Featureentwicklung auf der Seite mit den Details zur Pipeline überprüfen. Sie können eine Pipeline auch als Notebook speichern, in dem Sie die Transformationen und eine Visualisierung der Transformationen anzeigen können.

Hinweis: Wenn Sie beim Überprüfen des Experiments feststellen, dass eine Textspalte nicht erkannt und nicht von der automatischen Erkennung verarbeitet wurde, können Sie die Textspalte manuell in den Experimenteinstellungen angeben.

Beispiel: Analyse von Kundenkommentaren

In diesem Beispiel werden die Kommentare für ein fiktives Autovermietungsunternehmen verwendet, um ein Modell zu trainieren, das eine Zufriedenheitsbewertung vorhersagt, wenn ein neuer Kommentar eingegeben wird.

Sehen Sie sich folgende kurze Video mit dem Beispiel an und informieren Sie sich dann anhand der Abschnitte unterhalb des Videos über nähere Einzelheiten zur Textfunktion.

Video-Haftungsausschluss: Einige untergeordnete Schritte und grafische Elemente in diesem Video können von Ihrer Plattform abweichen.

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.

  • Videomitschrift
    Zeit Transkription
    00:00 In diesem Video erfahren Sie, wie Sie ein AutoAI-Experiment zum Durchführen einer Stimmungsanalyse für eine Textdatei erstellen können.
    00:09 Sie können die Textmerkmalsentwicklung für Textanalysen in Ihren Experimenten nutzen.
    00:15 Führen Sie zum Beispiel eine grundlegende Stimmungsanalyse aus, um ein Ergebnis auf der Grundlage von Textkommentaren vorherzusagen.
    00:22 Beginnen Sie in einem Projekt und fügen Sie diesem Projekt ein Asset hinzu, bei dem es sich um ein neues AutoAI-Experiment handelt.
    00:29 Geben Sie einfach einen Namen und eine Beschreibung an, wählen Sie einen Service für maschinelles Lernen aus und erstellen Sie dann das Experiment.
    00:38 Wenn AutoAI Experiment Builder angezeigt wird, können Sie die Datei hinzufügen.
    00:43 In diesem Fall ist die Datei bereits als Datenasset im Projekt gespeichert.
    00:48 Wählen Sie das Asset aus, das dem Experiment hinzugefügt werden soll.
    00:53 Zeigen Sie eine Vorschau der Daten an, bevor Sie fortfahren.
    00:56 Die Datei enthält zwei Spalten.
    00:59 Die erste Spalte enthält die Kommentare der Kunden, die zweite entweder 0 für 'Nicht zufrieden' oder 1 für 'Zufrieden'.
    01:08 Dies ist keine Zeitreihenvorhersage. Wählen Sie daher für diese Option 'Nein' aus.
    01:13 Wählen Sie dann die vorherzusagende Spalte aus, bei diesem Beispiel die Spalte 'Satisfaction' (Zufriedenheit).
    01:19 Von AutoAI wird festgestellt, dass die Zufriedenheitsspalte zwei mögliche Werte enthält, sodass sie für ein binäres Klassifikationsmodell geeignet ist.
    01:28 Und die positive Klasse ist 1, wobei 1 für 'Zufrieden' steht.
    01:32 Öffnen Sie die Experimenteinstellungen, wenn Sie das Experiment anpassen möchten.
    01:36 In der Datenquellenanzeige werden einige Optionen für die Textmerkmalsentwicklung angezeigt.
    01:41 Sie können die Textspalten automatisch auswählen lassen oder sich für eine stärkere Steuerung entscheiden, indem Sie die Spalten für die Textmerkmalsentwicklung manuell angeben.
    01:52 Sie können auch auswählen, wie viele Vektoren für jede Spalte bei der Textmerkmalsentwicklung erzeugt werden sollen.
    01:58 Eine niedrigere Zahl erhöht die Geschwindigkeit, eine höhere Zahl die Genauigkeit, reduziert jedoch die Geschwindigkeit.
    02:03 Führen Sie nun das Experiment aus, um die Transformationen und den Fortschritt anzuzeigen.
    02:09 Wenn Sie ein Experiment erstellen, das die Textanalysefunktion verwendet, wird der Text vom AutoAI-Prozess mithilfe des Algorithmus word2vec in Vektoren umgewandelt und die Vektoren werden verglichen, um die Auswirkung auf die Vorhersagespalte zu ermitteln.
    02:23 In der Phase der Textmerkmalsentwicklung werden beim Experimenttraining zwanzig Features für die Textspalte mit dem Algorithmus word2vec generiert.
    02:33 Wenn das Experiment ausgeführt wurde, können Sie die Ergebnisse der Featureentwicklung auf der Seite mit den Details zur Pipeline überprüfen.
    02:40 In der Zusammenfassungsanzeige für Merkmale können Sie die Texttransformationen überprüfen.
    02:45 Es ist zu sehen, dass AutoAI mehrere Textmerkmale erstellt hat, indem die Algorithmusfunktion auf die Spaltenelemente angewendet wurde. Die ebenfalls erzeugte Merkmalsbedeutung zeigt, welche Merkmale am meisten zur Vorhersageausgabe beitragen.
    02:59 Sie können diese Pipeline als Modell oder Notebook speichern.
    03:03 Das Notebook enthält den Code zum Anzeigen der Transformationen und für die Visualisierungen dieser Transformationen.
    03:09 Erstellen Sie in diesem Fall ein Modell.
    03:13 Verwenden Sie den Link, um das Modell anzuzeigen.
    03:16 Stufen Sie das Modell jetzt in einen Bereitstellungsbereich hoch.
    03:23 Hier sind die Modelldetails. Von jetzt an können Sie das Modell bereitstellen.
    03:28 In diesem Fall handelt es sich um eine Onlinebereitstellung.
    03:36 Wenn dieser Vorgang abgeschlossen ist, öffnen Sie die Bereitstellung.
    03:39 In der Test-App können Sie Kommentare für die Analyse angeben.
    03:46 Klicken Sie anschließend auf "Vorhersagen".
    03:49 Der erste Kunde wird der Vorhersage nicht mit dem Service zufrieden sein.
    03:54 Der zweite Kunde wird der Vorhersage nach mit dem Service zufrieden sein.
    03:59 Weitere Videos finden Sie in der Dokumentation zu Cloud Pak for Data as a Service.

Wenn ein Dataset eine Spalte mit Prüfkommentaren für die Mieterfahrung (Customer_service) und eine Spalte mit einer binären Zufriedenheitsbewertung (Zufriedenheit) enthält, wobei 0 einen negativen Kommentar und 1 einen positiven Kommentar darstellt, wird das Experiment trainiert, um eine Zufriedenheitsbewertung vorherzusagen, wenn neues Feedback eingegeben wird.

Training eines Texttransformationsexperiments

Nachdem Sie das Dataset geladen und die Vorhersagespalte (Zufriedenheit) angegeben haben, wählen die Experimenteinstellungen die Option Textfunktionsentwicklung verwenden aus.

Datenquelleneinstellungen für die Verwendung der Textfunktionsentwicklung

Beachten Sie einige der Details zur Optimierung Ihres Textanalyseexperiments:

  • Sie können die Standardauswahl akzeptieren, bei der die Textspalten automatisch ausgewählt werden, oder sich für eine stärkere Steuerung entscheiden, indem Sie die Spalten für die Textmerkmalsentwicklung manuell angeben.
  • Während das Experiment ausgeführt wird, werden standardmäßig 20 Features für die Textspalte unter Verwendung des Algorithmus word2vec generiert. Sie können diesen Wert bearbeiten, um die Anzahl der Merkmale zu erhöhen oder zu verringern. Je mehr Vektoren Sie generieren, desto genauer ist Ihr Modell, aber desto länger dauert das Training.
  • Der Rest der Optionen gilt für alle Typen von Experimenten, sodass Sie die Handhabung der endgültigen Trainingsdaten optimieren können.

Führen Sie das Experiment aus, um die jeweils bearbeiteten Transformationen anzuzeigen.

Pipeline-Rangliste des Algorithmus

Wählen Sie den Namen einer Pipeline aus und klicken dann auf Featurezusammenfassung , um die Texttransformationen zu überprüfen.

Funktionszusammenfassung der einzelnen Pipelines

Sie können die Experimentpipeline auch als Notebook speichern und die Transformationen als Visualisierung überprüfen.

Bereitstellung und Scoring eines Texttransformationsmodells

Wenn Sie dieses Modell bewerten, geben Sie neue Kommentare ein, um eine Vorhersage mit einem Verlässlichkeitsscore zu erhalten, ob der Kommentar zu einer positiven oder negativen Zufriedenheitsbewertung führt.

Die Eingabe des Kommentars 'Es hat fast drei Stunden gedauert, bis wir ein Auto hatten. Es war absurd " prognostiziert eine Zufriedenheitsbewertung von 0 mit einem Konfidenzwert von 95%.

Zufriedenheitsbewertung vorhersagen

Nächste Schritte

Experiment für Zeitreihenvorhersage erstellen

Übergeordnetes Thema: AutoAI -Modell erstellen

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen