Daten in Data Refinery visualisieren

Die Visualisierung von Informationen in grafischer Form bringt Ihnen Erkenntnisse in Bezug auf Ihre Daten. Sie können Ihrem Data Refinery-Ablauf Schritte hinzufügen, während Sie Ihre Daten visualisieren und die Änderungen sehen. Durch die Untersuchung von Daten unter verschiedenen Perspektiven mithilfe von Visualisierungen können Sie Muster, Verbindungen und Beziehungen in diesen Daten erkennen und sich schnell einen Einblick in große Informationsmengen verschaffen.

Sie können Ihre Daten mit denselben Diagrammen auch in einem SPSS Modeler-Ablauf visualisieren. Verwenden Sie den Diagrammknoten, der in der Knotenpalette unter "Diagramme" verfügbar ist. Doppelklicken Sie auf den Diagrammknoten, um das Eigenschaftsfenster zu öffnen. Klicken Sie anschließend auf Diagrammerstellung starten, um die Diagrammerstellung zu öffnen und eine oder mehrere Diagrammdefinitionen zu erstellen, die dem Knoten zugewiesen werden sollen.

Diagrammbeispiele

Gehen Sie wie folgt vor, um Ihre Daten zu visualisieren:

  1. Klicken Sie in Data Refinery auf die Registerkarte Visualisierungen.
  2. Beginnen Sie mit einem Diagramm oder wählen Sie Spalten aus:
  3. Klicken Sie auf eines der verfügbaren Diagramme. Fügen Sie anschließend Spalten im Teilfenster DETAILS hinzu, das links auf der Seite geöffnet wird.
  4. Wählen Sie die Spalten aus, mit denen Sie arbeiten möchten. Diagrammvorschläge sind jeweils mit einem Punkt neben dem Namen des Diagrammtyps gekennzeichnet. Klicken Sie auf ein Diagramm für die Visualisierung Ihrer Daten.

Wichtig: Verfügbare Diagrammtypen werden ausgehend von den ausgewählten Spalten von den relevantesten zu den am wenigsten relevanten Diagrammtypen sortiert. Wenn das Dataset keine Spalten mit einem Datentyp enthält, der für einen Diagrammtyp unterstützt wird, so ist dieses Diagramm nicht verfügbar. Wird der Datentyp einer Spalte für ein Diagramm nicht unterstützt, kann diese Spalte für dieses Diagramm nicht ausgewählt werden. Punkte neben den Namen der Diagramme schlagen die besten Diagramme für Ihre Daten vor.

Diagramme

Die folgenden Diagramme sind verfügbar:

  • 3-D-Diagramme zeigen Daten in einem 3-D-Koordinatensystem an, indem jede Säule in Form eines Quaders dargestellt wird, um einen 3-D-Effekt zu erzeugen.

  • Balkendiagramme sind praktisch, um Kategorien von Daten nebeneinander darzustellen und zu vergleichen. Die Balken können in beliebiger Reihenfolge dargestellt werden. Sie können sie auch nach Größe absteigend oder aufsteigend anordnen.

  • Box-Plot-Diagramme vergleichen Verteilungen zwischen vielen Gruppen oder Datasets. Sie zeigen die Variation in Gruppen von Daten, d. h. die Streuung und die ungleiche Verteilung dieser Daten sowie die Ausreißer an.

  • Blasendiagramme zeigen jede Kategorie in den Gruppen als Blase an.

  • Candlestick-Diagramme sind ein Typ von Finanzdiagramm, das die Kursbewegungen eines Wertpapiers, eines Derivats oder einer Währung anzeigt.

  • Kreispackungsdiagramme zeigen hierarchische Daten als Gruppe verschachtelter Bereiche an.

  • Angepasste Diagramme geben Ihnen die Möglichkeit, Diagramme auf der Basis von JSON-Eingaben auszugeben.

  • Diagramme mit doppelter Y-Achse verwenden zwei Y-Achsen, um die Beziehungen zwischen Daten anzuzeigen.

  • Fehlerbalken zeigen den Fehler oder die Unsicherheit in einem Wert an. Sie vermitteln einen allgemeinen Eindruck davon, wie präzise ein Wert ist, oder umgekehrt, wie weit ein Wert vom wahren Wert entfernt sein könnte.

  • Evaluierungsdiagramme sind Kombinationsdiagramme, die die Qualität eines binären Klassifikationsmerkmals messen. Drei Eingabespalten sind erforderlich: aktueller Wert (Zielwert), Vorhersagewert und Konfidenz (0 oder 1). Bewegen Sie den Schieberegler im Trennwertdiagramm, um die anderen Diagramme dynamisch zu aktualisieren. Das ROC-Diagramm und andere Diagramme sind Standardmessungen für das Klassifikationsmerkmal.

  • Heat-Map-Diagramme (Wärmebilddiagramme) zeigen Daten durch Farben an, um Aktivitätsebenen oder Dichte zu vermitteln. Niedrige Werte werden in der Regel durch kühlere Farben und hohe Werte durch wärmere Farben dargestellt.

  • Histogrammdiagramme zeigen die Häufigkeitsverteilung von Daten an.

  • Kurvendiagramme zeigen Trends in den Daten im Zeitverlauf an. Dazu wird für eine Spalte eine Auswertungsstatistik für jeden Wert einer anderen Spalte berechnet und dann eine Linie gezeichnet, die die Werte verbindet.

  • Kartendiagramme zeigen geografische Punktdaten an, sodass Sie Werte vergleichen und Kategorien in geografischen Regionen anzeigen können.

  • Diagramme mit mathematischen Kurven basieren auf den von Ihnen eingegebenen Gleichungen. Für diese Diagramme werden keine Datasets verwendet. Stattdessen werden diese Diagramme verwendet, um die Ergebnisse mit dem Dataset in einem anderen Diagramm, beispielsweise einem Streudiagramm, zu vergleichen.

  • Mehrfachdiagramme zeigen bis zu vier Kombinationen aus Balken-, Kurven-, Kreis- und Streudiagrammen an. Sie können dieselbe Art von Diagramm mehrfach mit verschiedenen Daten anzeigen. Sie können zum Beispiel zwei Kreisdiagramme mit Daten aus verschiedenen Spalten anzeigen.

  • Mehrfachzeitreihendiagramme zeigen Daten aus mehreren Datasets oder mehreren Spalten als Reihe von Punkten an, die durch gerade Linien oder Balken verbunden werden.

  • Parallel-Koordinaten-Diagramme zeigen und vergleichen Reihen von Daten (so genannte 'Profile'), um Ähnlichkeiten aufzuspüren. Jede Zeile ist eine Linie und der Wert in jeder Spalte der Zeile wird durch einen Punkt auf dieser Linie dargestellt.

  • Kreisdiagramme zeigen Anteile an. Jeder Wert in einer Serie (Datenreihe) wird als proportionaler Kreisausschnitt angezeigt. Der Kreis stellt dabei die Gesamtsumme der Werte dar.

  • Bevölkerungspyramidendiagramme zeigen die Häufigkeitsverteilung einer Variablen in Kategorien an. Sie werden in der Regel zur Darstellung von Änderungen in demografischen Daten verwendet.

  • Bei Quantil-Quantil-Plot-Diagrammen (Q-Q-Plot-Diagramme) werden die erwarteten Verteilungswerte mit den tatsächlich beobachteten Werten verglichen. Dazu werden ihre Quantile eingezeichnet.

  • Radardiagramme integrieren drei oder mehr quantitative Variablen, die auf Achsen (Radien) dargestellt werden, zu einer einzigen sternförmigen Abbildung. Daten werden auf jeder Achse dargestellt und mit benachbarten Achsen durch Verbindungslinien verknüpft. Radardiagramme sind nützlich, um Korrelationen darzustellen und kategorisierte Daten zu vergleichen.

  • Beziehungsdiagramme zeigen, wie Spalten von Daten zueinander in Beziehung stehen und wie stark diese Beziehung ist. Dazu werden unterschiedliche Arten von Linien verwendet.

  • Streumatrixdiagramme vergleichen Spalten miteinander und zeigen die zugehörigen Streudiagramme und die Korrelation der Spalten an. Verwenden Sie diese Diagramme zum Vergleichen mehrerer Spalten und zum Ermitteln des Korrelationsausmaßes der Spalten.

  • Streudiagramme zeigen die Korrelationen zwischen Variablen an (d. h. wie stark eine Variable von einer anderen beeinflusst wird), indem die Werte in zwei Spalten angezeigt und miteinander verglichen werden.

  • Sunburst-Diagramme sind mit Kreisdiagrammen mit mehreren Ebenen vergleichbar, in denen verschiedene Anteile verschiedener Kategorien gleichzeitig auf mehreren Ebenen angezeigt werden.

  • Themen-Flussdiagramme sind eine spezialisierte Art von Ablaufdiagramm, das Änderungen im Zeitverlauf darstellt.

  • Zeitdiagramme zeigen Datenpunkte in aufeinander folgenden Zeitintervallen an.

  • Diagramme vom Typ 't-SNE' (t-distributed Stochastic Neighbor Embedding) helfen bei der Visualisierung hochdimensionaler Datasets. Sie eignen sich zum Einbetten von hochdimensionalen Daten in einem Bereich mit zwei oder drei Dimensionen, die dann in einem Streudiagramm visualisiert werden können.

  • Baumdiagramme zeigen hierarchische Daten an und teilen diese nach Kategorien in verschiedene Zweige auf. Sie können damit verschiedenen Datasets nach verschiedenen Kategorien sortieren. Das Baumdiagramm besteht aus einem Stammknoten, als Verzweigungen bezeichneten Verbindungslinien zur Darstellung der Beziehungen und Verbindungen zwischen den Elementen sowie aus Blattknoten, die keine untergeordneten Knoten haben.

  • Treemap-Diagramme zeigen hierarchische Daten als Gruppe verschachtelter Bereiche an. Sie dienen zum Größenvergleich zwischen Gruppen und einzelnen in den Gruppen verschachtelten Elementen.

  • Wortwolkendiagramme zeigen an, wie häufig Wörter im Text erscheinen, indem sie jedes Wort in einer Größe proportional zu seiner Häufigkeit anzeigen.

Aktionen

Sie können die folgenden Aktionen durchführen:

  • Von vorne beginnen: Löscht die Visualisierung und das Teilfenster DETAILS und kehrt zur Startseite für Visualisierungen zurück.

  • Geben Sie an, ob der Feldwert oder die Feldbezeichnung angezeigt werden soll. Diese Option gilt nur für SPSS Modeler beim Definieren von Beschriftungen. Beispiel: Sie haben ein Feld "Geschlecht" und haben eine Beschriftung als "weiblich" mit dem Wert "0" und dann die Beschriftung "männlich" für den Wert "1" definiert. Wenn keine Beschriftung definiert ist, wird der Wert angezeigt.

  • 'Download visualization' (Visualisierung herunterladen):

    • 'Download chart image' (Diagrammabbildung herunterladen): Lädt eine PNG-Datei herunter, die eine Abbildung des aktuellen Diagramms enthält.

    • 'Download chart details' (Diagrammdetails herunterladen): Lädt eine JSON-Datei herunter, die die Details für das aktuelle Diagramm enthält.

  • Globale Vorgaben festlegen, die für alle Diagramme gelten

Aktionen für Diagramme

Welche Aktionen für Diagramme verfügbar sind, hängt vom jeweiligen Diagramm ab. Es gibt die folgenden Aktionen für Diagramme:

  • 'Zoom' (Vergrößern)

  • 'Restore' (Wiederherstellen): Zeigt das Diagramm wieder in der normalen Größe an.

  • 'Select data' (Daten auswählen): Hebt die im Diagrammm ausgewählten Daten auf der Registerkarte 'Daten' hervor.

  • 'Clear selection' (Auswahl löschen): Entfernt die Hervorhebung von Daten auf der Registerkarte für Daten.

Weitere Informationen

Datenvisualisierung – Auswahl des richtigen Diagrammtyps

Übergeordnetes Thema: Daten optimieren