0 / 0
Zurück zur englischen Version der Dokumentation
Auswertung von Textdaten mit Textanalyse
Letzte Aktualisierung: 20. Dez. 2024
Auswertung von Textdaten mit Text Analytics in SPSS Modeler

SPSS Modeler bietet Knoten, die auf die Verarbeitung von Text spezialisiert sind. Die Textanalyseknoten bieten leistungsstarke Textanalysefunktionen, die fortschrittliche linguistische Technologien und Natural Language Processing (NLP) nutzen. Sie können eine große Vielfalt an unstrukturierten Textdaten schnell verarbeiten und die wichtigsten Konzepte extrahieren. Text Analytics kann diese Konzepte auch organisieren und in Kategorien gruppieren.

In einem Unternehmen liegen rund 80% der Daten in Form von Textdokumenten vor, beispielsweise als Berichte, Webseiten, E-Mails und Call-Center-Notizen. Text ist ein Schlüsselfaktor für ein Unternehmen, das das Verhalten seiner Kunden besser verstehen möchte. Ein System mit integrierter Verarbeitung natürlicher Sprache ist in der Lage, Konzepte (inklusive verbundener Ausdrücke) intelligent zu extrahieren. Darüber hinaus ermöglichen Kenntnisse über die zugrunde liegende Sprache mithilfe von Bedeutung und Kontext die Klassifizierung von Begriffen in zusammengehörenden Gruppen (z. B. Produkte, Unternehmen und Personen). Daher können Sie umgehend feststellen, wie relevant die Informationen für Ihren Bedarf sind. Diese extrahierten Konzepte und Kategorien können mit vorhandenen strukturierten Daten, wie z. B. demografischen Daten, kombiniert und auf die Modellierung in SPSS Modeler angewendet werden, um bessere und zielgerichtetere Entscheidungen zu treffen.

Linguistische Systeme sind wissensfundiert - je mehr Informationen die Wörterbücher beinhalten, desto höher ist die Qualität der Ergebnisse. Text Analytics stellt eine Reihe von linguistischen Ressourcen bereit, z. B. Wörterverzeichnisse für Begriffe und Synonyme, Bibliotheken und Vorlagen. Mithilfe dieser Knoten können Sie diese linguistischen Ressourcen in Ihrem Kontext weiterentwickeln und verfeinern. Die Optimierung der linguistischen Ressourcen ist häufig ein iterativer Prozess und für die akkurate Konzeptabfrage und Kategorisierung erforderlich. Angepasste Vorlagen, Bibliotheken und Wörterverzeichnisse für bestimmte Fachgebiete wie CRM und Genomik sind ebenfalls enthalten.

Tipps für den Einstieg:

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.

Video-Haftungsausschluss: Einige kleinere Schritte und grafische Elemente in diesem Video können sich von Ihrer Plattform unterscheiden.

  
https://video.ibm.com/embed/channel/23952663/video/spss-text-analytics-workbench

Anwendungen

Generell kann jeder, der regelmäßig große Mengen von Dokumenten durcharbeiten muss, um Schlüsselelemente für eine genauere Untersuchung zu ermitteln, von Text Analytics profitieren. Hier einige Beispiele für spezielle Anwendungsbereiche:

  • Wissenschaftliche und medizinische Forschung. Sie können sekundäres Recherchematerial wie Patentberichte, Zeitungs-/Zeitschriftenartikel und Protokollveröffentlichungen untersuchen. Sie sind in der Lage, bisher unbekannte Zusammenhänge zu identifizieren (z. B. ein mit einem bestimmten Produkt verbundener Mediziner), wodurch sich Zugänge für eine genauere Untersuchung ergeben. Die für den Arzneimittelsuchprozess benötigte Zeit verringert sich. Der Einsatz als Unterstützung bei der Genomforschung ist ebenfalls möglich.
  • Investitionsforschung. Sie können tägliche Analystenberichte, Nachrichtenartikel und Pressemitteilungen von Unternehmen prüfen, um wichtige Strategiepositionen oder Marktveränderungen zu erkennen. Eine Trendanalyse solcher Informationen macht neu entstehende Probleme oder Chancen für ein Unternehmen oder eine Branche in einem bestimmten Zeitraum sichtbar.
  • Aufdeckung von Betrug. Durch den Einsatz im Hinblick auf Betrug im Banken- und Gesundheitswesen können Anomalien festgestellt und Warnsignale in großen Textmengen erkannt werden.
  • Marktforschung. Der Einsatz in der Marktforschung unterstützt die Ermittlung von wichtigen Themen in Antworten auf unbefristete Umfragen.
  • Analyse von Blogs und Webfeeds. Sie können die zentralen Ideen aus Newsfeed, Blogs usw. extrahieren und mit ihrer Hilfe Modelle entwickeln.
  • CRM. Sie können unter Verwendung von Daten aus allen Kundenkontaktpunkten (z. B. E-Mail, Transaktionen und Umfragen) Modelle erstellen.

Knoten

Neben den vielen Standardknoten in SPSS Modeler können Sie auch mit Textmining-Knoten arbeiten, um die Möglichkeiten der Textanalyse in Ihre Abläufe zu integrieren. Auf der Palette sind unter Text Analytics die folgenden Knoten verfügbar:
  • Der Language Identifier-Knoten ist ein Prozessknoten, der anhand einer Suche im Quellentext ermittelt, in welcher natürlichen Sprache der Text geschrieben ist, und dies anschließend in einem neuen Feld angibt. In erster Linie für den Einsatz bei großen Datenmengen entwickelt, ist dieser Knoten besonders zweckdienlich, wenn Ihre Datenquellen mehrere Sprachen enthalten und Sie nur eine einzige Sprache verarbeiten wollen.
  • Der Textlinkanalyseknoten extrahiert Konzepte und identifiziert ebenfalls auf der Basis von bekannten Mustern im Text Beziehungen zwischen Konzepten. Mithilfe der Musterextraktion können Sie Beziehungen zwischen Ihren Konzepten sowie alle diesen Konzepten zugeordneten Meinungen oder Qualifikationsmerkmale erkennen. Der Textlinkanalyseknoten ermöglicht eine direktere Identifizierung und Extraktion von Mustern aus Ihrem Text und fügt anschließend die Musterergebnisse zum Dataset im Ablauf hinzu. Sie können TLA aber auch mit einer Text Analytics Workbench-Sitzung über den Modellierungsknoten Text Mining durchführen.
  • Der Textmining-Knoten extrahiert mithilfe linguistischer Muster zentrale Konzepte aus einem Text, ermöglicht Ihnen die Erstellung von Kategorien mit diesen Konzepten sowie anderen Daten und bietet die Möglichkeit, auf der Basis von bekannten Mustern Beziehungen und Zusammenhänge zwischen Konzepten zu erkennen (dies wird als "Textlinkanalyse" bezeichnet). Mit diesem Knoten können Sie den Textdateninhalt untersuchen bzw. ein Konzeptmodell oder Kategoriemodell erzeugen. Diese Konzepte und Kategorien können mit vorhandenen strukturierten Daten (z. B. demografischen Daten) kombiniert und auf die Modellierung angewendet werden.
Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen