Graphen für die Drogenbehandlung erforschen

Letzte Aktualisierung: 11. Feb. 2025
Graphen für die Drogenbehandlung erforschen
In diesem Tutorial wird ein Beispiel dafür gegeben, wie ein medizinischer Forscher ein Bildmaterial für eine Studie zusammenstellen kann. Der Gerichtsmediziner sammelte Daten über eine Reihe von Patienten, die alle an der gleichen Krankheit litten. Im Behandlungsverlauf sprach jeder Patient auf eines von fünf Medikamenten an. Ihre Aufgabe besteht u. a. darin, mithilfe von Data-Mining herauszufinden, welches Medikament in Zukunft für einen Patienten geeignet sein kann, der an derselben Krankheit leidet.

Vorschau des Lernprogramms anzeigen

Video ansehen Sehen Sie sich dieses Video an, um eine Vorschau der Schritte in diesem Lernprogramm anzuzeigen. Die Benutzeroberfläche, die im Video gezeigt wird, kann geringfügig abweichen. Das Video ist als Ergänzung zum schriftlichen Tutorial gedacht. Dieses Video bietet eine visuelle Methode, um die Konzepte und Aufgaben in dieser Dokumentation zu erlernen.

Versuchen Sie das Tutorial

In diesem Lernprogramm werden Sie die folgenden Tasks ausführen:

Beispielhafter Modellierungsablauf und Datensatz

In diesem Lernprogramm wird der Ablauf "Drogenbehandlung - Explorationsdiagramme" im Beispielprojekt verwendet. Die verwendete Datendatei ist drug1n.csv. Das folgende Bild zeigt ein Beispiel für den Ablauf der Modellierung.

Abb. 1. Ablauf der Modellierung von Proben
Ablauf der Modellierung von Proben

Die Datenfelder, die in diesem Beispiel verwendet werden, sind:
Datenfeld Beschreibung
Age Alter des Patienten (Zahl)
Sex M oder F
BP Blutdruck: HIGH, NORMAL, oder LOW
Cholesterol Cholesterinspiegel im Blut: NORMAL oder HIGH
Na Natriumkonzentration im Blut
K Kaliumkonzentration im Blut
Drug Medikament, auf das ein Patient ansprach

Aufgabe 1: Öffnen Sie das Beispielprojekt

Das Beispielprojekt enthält mehrere Datensätze und Modellierungsabläufe. Wenn Sie das Beispielprojekt noch nicht haben, finden Sie unter Tutorials eine Anleitung zum Erstellen des Beispielprojekts. Gehen Sie dann wie folgt vor, um das Beispielprojekt zu öffnen:

  1. In Cloud Pak for Data wählen Sie im Navigationsmenü NavigationsmenüProjekte > Alle Projekte anzeigen aus.
  2. Klicken Sie auf SPSS Modeler Project.
  3. Klicken Sie auf die Registerkarte Assets, um die Datensätze und Modellierungsabläufe zu sehen.

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt die Registerkarte Assets des Projekts. Sie sind nun bereit, mit dem zu diesem Lehrgang gehörenden Beispielmodellierungsablauf zu arbeiten.

Beispielprojekt

Zurück zum Seitenanfang

Aufgabe 2: Untersuchen Sie den Datenbestand

Drogenbehandlung - Explorationsdiagramme enthält mehrere Knotenpunkte. Gehen Sie folgendermaßen vor, um den Knoten Daten-Asset zu untersuchen:

  1. Öffnen Sie auf der Registerkarte Assets den Modellierungsablauf Drogenbehandlung - Explorative Diagramme und warten Sie, bis der Canvas geladen ist.
  2. Doppelklicken Sie auf den Knoten drug1n.csv. Dieser Knoten ist ein Datenbestandsknoten, der auf die Datei drug1n.csv im Projekt verweist.
  3. Überprüfen Sie die Eigenschaften des Dateiformats.
  4. Optional: Klicken Sie auf Datenvorschau, um den vollständigen Datensatz zu sehen.

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Das folgende Bild zeigt den Knoten Data Asset. Sie können nun die Verteilungs- und Datenüberwachungsdiagramme untersuchen.

Datenasset

Zurück zum Seitenanfang

Aufgabe 3: Untersuchen Sie die Diagramme zur Verteilung und Datenprüfung

Während des Data-Minings ist es häufig hilfreich, die Daten anhand einer visuellen Übersicht zu untersuchen. SPSS Modeler bietet viele verschiedene Arten von Diagrammen zur Auswahl, je nach Art der Daten, die Sie zusammenfassen möchten. Um beispielsweise herauszufinden, welcher Anteil der Patienten auf ein bestimmtes Medikament anspricht, erkunden Sie einen Knoten Medikamentenart (Verteilung). Folgen Sie diesen Schritten, um einige Diagramme zu erkunden:

  1. Doppelklicken Sie auf den Knoten Arzneimitteltyp (Verteilung), um seine Eigenschaften anzuzeigen.
  2. Klicken Sie auf Cancel (Abbrechen).
  3. Bewegen Sie den Mauszeiger über den Knoten Arzneimitteltyp (Verteilung) und klicken Sie auf das Ausführungssymbol " .
  4. Klicken Sie im Fensterbereich Ausgaben und Modelle auf die Ausgabe des Arzneimitteltyps, um die Ergebnisse anzuzeigen.
Abbildung 2: Ansicht Ausgabe: Arzneimitteltyp
Ansicht Ausgabe: Arzneimitteltyp

Das Diagramm hilft Ihnen, die Form der Daten zu erkennen. Es zeigt sich, dass Patienten am häufigsten auf Medikament Y und am wenigsten auf Medikament B und C ansprachen.

Alternativ können Sie einen Knoten "7 Felder (Datenprüfung)" anhängen und ausführen, um Verteilungen und Histogramme für alle Felder auf einmal anzuzeigen.

  1. Doppelklicken Sie auf den Ausgabeknoten 7 Felder (Datenprüfung) nach dem Knoten Datenbestand.
  2. Bewegen Sie den Mauszeiger über den Knoten 7 Felder (Datenprüfung) und klicken Sie auf das Ausführungssymbol " .
  3. Klicken Sie im Fensterbereich Ausgaben und Modelle auf die Ausgabe 7 Felder (Datenprüfung), um die Ergebnisse anzuzeigen.
Abb. 3 Ausgabe ansehen: Datenprüfung von [7 Feldern]
Daten-Audit-Tabelle

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt den Ablauf. Jetzt können Sie das Streudiagramm erstellen und untersuchen.

Modellierungsablauf mit angezeigten Ausgaben und Modellen

Zurück zum Seitenanfang

Aufgabe 4: Erstellen und untersuchen Sie das Streudiagramm

Sie können sehen, welche Faktoren die Zielvariable " Drug beeinflussen könnten. Als Medizinforscher wissen Sie, dass die Konzentration von Natrium und Kalium im Blut wichtige Faktoren sind. Da es sich bei diesen Konzentrationen um numerische Werte handelt, können Sie ein Streudiagramm von Natrium und Kalium erstellen, das die Medikamentenkategorien als Farbüberlagerung verwendet. Befolgen Sie diese Schritte, um das Streudiagramm zu erstellen und zu untersuchen:

  1. Ziehen Sie im Abschnitt Diagramme der Palette den Knoten Darstellung auf die Leinwand.
  2. Bewegen Sie den Mauszeiger über den Knoten, klicken Sie auf die Schaltfläche Titel bearbeiten und benennen Sie ihn in " um Na v. K.
  3. Verbinden Sie den Knoten Plot mit dem Datenasset-Knoten drug1n.csv.
  4. Doppelklicken Sie auf den ' Na v. K (Plotten) Knoten, um seine Eigenschaften zu bearbeiten.
  5. Wählen Sie im Abschnitt " Darstellung" als X-Feld " Na, als Y-Feld " K und im Abschnitt " Überlagerung " als Farbfeld " Drug.
  6. Klicken Sie auf Speichern.
  7. Bewegen Sie den Mauszeiger über das Feld " Na v. K (Plot) Knoten und klicken Sie auf das Ausführungssymbol ' .
  8. Klicken Sie im Bereich Ausgaben und Modelle auf das Feld " Na v. K Ausgabe, um die Ergebnisse zu sehen.

Die Grafik zeigt deutlich einen Schwellenwert. Bei Werten, die über dem Schwellenwert liegen, ist das Medikament " Y immer das richtige Medikament. Und bei Werten, die unter dem Schwellenwert liegen, ist das Medikament " Y nie das richtige Medikament. Dieser Schwellenwert ist das Verhältnis von Natrium (Na) zu Kalium (K).

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Das folgende Bild zeigt das Streudiagramm. Jetzt können Sie das Netzdiagramm erstellen und erkunden.

Streudiagramm der Drogenverteilung

Zurück zum Seitenanfang

Aufgabe 5: Erstellen und untersuchen Sie das Netzdiagramm

Da viele der Datenfelder kategorisch sind, können Sie auch versuchen, ein Netzdiagramm zu erstellen, das Assoziationen zwischen verschiedenen Kategorien abbildet. Befolgen Sie diese Schritte, um ein Webdiagramm zu erkunden:

  1. Ziehen Sie den Knoten Web aus dem Abschnitt Diagramme in der Palette auf die Arbeitsfläche und verbinden Sie ihn mit dem Datenelementknoten drug1n.csv.
  2. Doppelklicken Sie auf den Knoten Web, um seine Eigenschaften zu bearbeiten.
  3. Klicken Sie im Abschnitt Felder auf Spalten hinzufügen. Markieren Sie die Spalten " BP (für Blutdruck) und " Drug.
  4. Klicken Sie auf Speichern.
  5. Bewegen Sie den Mauszeiger über den Web-Knoten und klicken Sie auf das Ausführungssymbol "
  6. Klicken Sie im Bereich Ausgaben und Modelle auf die Webausgabe, um die Ergebnisse anzuzeigen.

Aus dem Diagramm geht hervor, dass die Droge " Y mit allen drei Blutdruckstufen assoziiert ist. Dieses Ergebnis ist keine Überraschung, denn Sie haben bereits ermittelt, in welcher Situation das Medikament " Y am besten wirkt.

Aber wenn Sie das Medikament Y ignorieren und den Fokus auf die anderen Medikamente legen, können Sie sehen, dass die Medikamente A und B ebenfalls mit hohen Blutdruckwerten assoziiert sind. Und die Medikamente C und X sind mit niedrigen Blutdruckwerten assoziiert. Und normaler Blutdruck ist mit Medikament X assoziiert. Sie wissen aber immer noch nicht, wie Sie für einen bestimmten Patienten zwischen den Medikamenten ' A und ' B oder zwischen den Medikamenten ' C und ' X wählen sollen. In diesem Fall kann die Modellierung helfen.

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Das folgende Bild zeigt den Webplot. Sie sind nun bereit, fortgeschrittene Visualisierungen zu erkunden.

Netzdiagramm: Medikamente im Vergleich zum Blutdruck

Zurück zum Seitenanfang

Aufgabe 6: Erkunden Sie erweiterte Visualisierungen

In den vorangegangenen Abschnitten wurden verschiedene Arten von Graphknoten verwendet. Eine andere Möglichkeit, Daten zu untersuchen, bietet die erweiterte Visualisierungsfunktion. Folgen Sie diesen Schritten, um erweiterte Diagramme zu erstellen und zu erkunden:

  1. Ziehen Sie aus dem Abschnitt Diagramme in der Palette den Knoten Diagramme auf die Arbeitsfläche und verbinden Sie ihn mit dem Knoten drug1n.csv data asset.
  2. Doppelklicken Sie auf den Knoten Diagramme, um seine Eigenschaften anzuzeigen.
  3. Klicken Sie auf die Schaltfläche Chart Builder starten.

    Hier können Sie erweiterte Diagramme auswählen und erstellen, um Ihre Daten aus verschiedenen Perspektiven zu untersuchen und Muster, Verbindungen und Beziehungen innerhalb Ihrer Daten zu erkennen. Versuchen Sie, einige Diagramme zu erstellen, bevor Sie zum Modellierfluss zurückkehren.

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Das folgende Bild zeigt ein Beispiel für ein 3D. Sie können nun den Knoten Ableiten erkunden.

Erweiterte Visualisierungen

Zurück zum Seitenanfang

Aufgabe 7: Erkunden des Knotens Ableiten

Wie Sie anhand des Streudiagramms aus Aufgabe 4 gesehen haben, scheint das Verhältnis von Natrium zu Kalium den Zeitpunkt für den Einsatz von Medikament Y vorherzusagen. Sie können ein Feld ableiten, das den Wert dieses Verhältnisses für jeden Datensatz enthält. Dieses Feld kann für später nützlich sein, wenn Sie zur Voraussage, in welchen Fällen jedes der fünf Medikamente eingesetzt werden soll, ein Modell erstellen.

Folgen Sie diesen Schritten, um den Knoten Ableiten zu erkunden:

  1. Doppelklicken Sie auf den Knoten Na_to_K (Derive), um seine Eigenschaften zu bearbeiten.
  2. Schauen Sie sich den Abschnitt Expression an. Na/K ist der Ausdruck, weil man die neue Fläche erhält, indem man den Natriumwert durch den Kaliumwert dividiert.

    Sie können auch einen Ausdruck erstellen, indem Sie auf das Taschenrechnersymbol Symbol ausführen klicken, um den Ausdrucksgenerator zu öffnen. Mit diesem können Sie interaktiv Ausdrücke erstellen, indem Sie integrierte Listen mit Funktionen, Operanden und Feldern und deren Werte verwenden.
  3. Klicken Sie auf Abbrechen, um zu den Eigenschaften zurückzukehren, und klicken Sie erneut auf Abbrechen, um zum Ablauf zurückzukehren.
  4. Ziehen Sie im Abschnitt Diagramme der Palette den Knoten Histogramm auf die Leinwand und verbinden Sie ihn mit dem Knoten Na_to_K (Ableiten).
  5. Doppelklicken Sie auf den Knoten Histogramm, um seine Eigenschaften anzuzeigen.
  6. Geben Sie in den Eigenschaften des Histogrammknotens Na_to_K als das zu zeichnende Feld und Drug als das Farbüberlagerungsfeld an.
  7. Klicken Sie auf Speichern.
  8. Bewegen Sie den Mauszeiger über den Knoten " Histogramm" und klicken Sie auf das Ausführungssymbol " .
  9. Klicken Sie im Fensterbereich Ausgaben und Modelle auf die Ausgabe Histogramm, um die Ergebnisse anzuzeigen.

Aus dem Diagramm können Sie schließen, dass bei einem " Na_to_K von 15 oder mehr die Droge " Y die Droge der Wahl ist.

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Das folgende Bild zeigt das Histogramm. Sie können nun die Knoten Filter und Typ erkunden.

Histogrammknoten

Zurück zum Seitenanfang

Aufgabe 8: Untersuchen Sie die Filter- und Typknoten

Durch die Untersuchung und Manipulation der Daten können Sie einige Hypothesen aufstellen. Das Verhältnis der Natriumkonzentration zur Kaliumkonzentration im Blut scheint, wie auch der Blutdruck, einen Einfluss auf die Wahl des Medikaments zu haben. Sie sind jedoch noch nicht in der Lage, alle Beziehungen vollständig zu erklären. Die Modellierung kann einige Antworten liefern. Führen Sie zunächst die folgenden Schritte aus, um die Knoten Filter und Typ zu erkunden:

  1. Doppelklicken Sie auf den Knoten Felder verwerfen (Filter), um seine Eigenschaften anzuzeigen.
  2. Da das abgeleitete Feld " Na_to_K verwendet wird, werden die ursprünglichen Felder " Na und " K herausgefiltert, damit sie im Modellierungsalgorithmus nicht doppelt verwendet werden.

    Abbildung 4. Eigenschaften des Knotens "filter"
    Eigenschaften des Knotens "filter"
  3. Klicken Sie auf Cancel (Abbrechen).
  4. Doppelklicken Sie auf den Knoten Typen definieren (Typ), um seine Eigenschaften anzuzeigen.
  5. Mit dem Knoten Typ können Sie angeben, welche Arten von Feldern Sie verwenden und wie diese zur Vorhersage der Ergebnisse verwendet werden. Beachten Sie, dass die Rolle für das Feld " Drug auf " Ziel" eingestellt ist, was bedeutet, dass " Drug das Feld ist, das Sie vorhersagen wollen. Die Rolle für die anderen Felder ist auf Eingabe eingestellt, damit sie als Prädiktoren verwendet werden.

    Abbildung 5. Eigenschaften des Knotens "type"
    Eigenschaften des Knotens "type"
  6. Klicken Sie auf Cancel (Abbrechen).

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Die folgende Abbildung zeigt den Ablauf. Sie sind nun bereit, das Modell zu erstellen.

Modellierungsablauf mit angezeigten Ausgaben und Modellen

Zurück zum Seitenanfang

Aufgabe 9: Erzeugen des Modells

Gehen Sie wie folgt vor, um das Modell mit Hilfe eines C5.0 zu erstellen:

  1. Bewegen Sie den Mauszeiger über den Knoten Arzneimittel (C5.0) und klicken Sie auf das Ausführungssymbol " .
  2. Klicken Sie im Bereich Ausgaben und Modelle auf das Medikamentenmodell, um die Ergebnisse anzuzeigen.

    Das Baumdiagramm zeigt das Regelwerk, das vom C5.0 generiert wird, in Form eines Baumes an. Jetzt können Sie die fehlenden Teile des Puzzles sehen. Bei Menschen mit einem Na-K-Verhältnis von weniger als 14.829 und hohem Blutdruck bestimmt das Alter die Wahl des Medikaments. Bei Personen mit niedrigem Blutdruck scheint der Cholesterinspiegel der beste Prädiktor zu sein.

    Sie können den Mauszeiger über die Knoten im Diagramm bewegen, um weitere Details zu sehen, beispielsweise die Anzahl Fälle für jede Blutdruckkategorie sowie den Konfidenzprozentsatz von Fällen.

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Das folgende Bild zeigt das Baumdiagramm. Sie können nun einen Analyseknoten erstellen.

Ausgabe des Baumdiagramms

Zurück zum Seitenanfang

Aufgabe 10: Erstellen eines Analyseknotens

Gehen Sie wie folgt vor, um die Genauigkeit des Modells mit Hilfe eines Analyseknotens zu bewerten:

  1. Ziehen Sie aus dem Abschnitt Ausgaben in der Palette den Knoten Analyse auf die Leinwand und verbinden Sie ihn mit dem Modellnugget Droge (C5.0).
  2. Bewegen Sie den Mauszeiger über den Knoten Analyse und klicken Sie auf das Symbol Ausführen '
  3. Klicken Sie im Bereich Ausgaben und Modelle auf die Ausgabe Analyse von [Droge], um die Ergebnisse anzuzeigen.

    Die Ausgabe des Analyseknotens zeigt, dass das Modell bei diesem künstlichen Datensatz die Wahl des Medikaments für jeden Datensatz korrekt vorhersagte. Bei einem realen Datensatz ist es unwahrscheinlich, dass Sie eine 100%ige Genauigkeit erreichen, aber Sie können den Analyseknoten verwenden, um festzustellen, ob das Modell für Ihre spezielle Anwendung akzeptabel genau ist.

Kontrollpunkt-Symbol Überprüfen Sie Ihren Fortschritt

Das folgende Bild zeigt die Analyseausgabe.

Analyseausgabe

Zurück zum Seitenanfang

Zusammenfassung

In diesem Beispiel wurde gezeigt, wie man Diagramme für die medikamentöse Behandlung erstellt und untersucht, um herauszufinden, welches Medikament für einen zukünftigen Patienten mit der gleichen Krankheit geeignet sein könnte.

Nächste Schritte

Sie können jetzt weitere Tutorials von SPSS® Modeler ausprobieren.