Messniveaus
Das Maß, das auch als "Messniveau" bezeichnet wird, beschreibt die Nutzung von Datenfeldern in SPSS Modeler.
Sie können das Maß in den Knoteneigenschaften eines Importknotens oder eines Typknotens angeben. Beispiel: Sie möchten das Maß für ein Feld ganzer Zahlen mit den Werten 1
und 0
auf Flag setzen. Das bedeutet normalerweise, dass 1 = True
und 0 = False
ist.
Speicherung versus Messung. Bitte beachten Sie, dass das Messniveau eines Felds etwas anderes ist als sein Speichertyp, der angibt, ob die Daten als Zeichenfolge, ganze Zahl, reelle Zahl, Datum, Zeit oder Zeitmarke gespeichert werden sollen. Während Sie die Datentypen mithilfe eines Typknotens an jeder beliebigen Stelle im Ablauf ändern können, muss der Speichertyp beim Einlesen der Daten stets an der Quelle festgelegt werden (was Sie jedoch später mithilfe einer Konvertierungsfunktion ändern können).
- Standard. Daten, deren Speichertyp und Werte unbekannt sind (z. B. weil sie noch nicht gelesen wurden), werden als Standard angezeigt.
- Stetig. Wird zur Beschreibung numerischer Werte verwendet, beispielsweise des Bereichs 0-100 oder 0,75-1,25. Ein stetiger Wert kann eine ganze Zahl, eine reelle Zahl oder ein Datum/eine Uhrzeit sein.
- Kategorial. Wird für Zeichenfolgewerte verwendet, wenn eine exakte Anzahl unterschiedlicher Werte nicht bekannt ist. Dies ist ein Datentyp ohne Instanz, was bedeutet, dass nicht alle möglichen Informationen zur Speicherung und Verwendung der Daten bereits bekannt sind. Nach dem Lesen der Daten ist das Messniveau Flag, Nominaloder Ohne Typ, abhängig von der maximalen Anzahl der Mitglieder für die angegebenen nominalen Felder.
- Flag. Wird für Daten mit zwei unterschiedlichen Werten verwendet, die das Vorhandensein oder Nichtvorhandensein einer Eigenschaft angeben, z. B.
true
undfalse
,Yes
undNo
oder0
und1
. Die verwendeten Werte können variieren, aber man muss immer einen Wert als den "wahren" Wert und den anderen als "falschen" Wert angeben. Die Daten können als Text, ganze Zahl, reelle Zahl, Datum/Uhrzeit oder Zeitmarke dargestellt sein. - Nominal. Wird verwendet, um Daten mit mehreren unterschiedlichen Werten zu beschreiben, die jeweils als Mitglied eines Satzes behandelt werden, z. B.
small/medium/large
. Nominale Daten können jeden beliebigen Speichertyp aufweisen: "Numerisch", "Zeichenfolge" oder "Datum/Uhrzeit". Hinweis: Durch das Setzen des Messniveaus auf Nominal werden nicht automatisch die Werte auf Zeichenfolgenspeicherung geändert. - Ordinalzahl. Wird zur Beschreibung von Daten mit mehreren unterschiedlichen Werten verwendet, die eine natürliche Reihenfolge aufweisen. Gehaltskategorien oder Zufriedenheitsbewertungen beispielsweise können als ordinale Daten klassifiziert werden. Die Reihenfolge wird durch die natürliche Sortierfolge der Datenelemente definiert. So ist
1, 3, 5
die Standardsortierreihenfolge für eine Menge von ganzen Zahlen, währendHIGH, LOW, NORMAL
(aufsteigende alphabetische Reihenfolge) die Reihenfolge für eine Menge von Zeichenfolgen ist. Mit dem ordinalen Messniveau können Sie eine Menge kategorialer Daten als ordinale Daten festlegen - zum Zwecke der Visualisierung, Modellerstellung und zum Export in andere Anwendungen, beispielsweise IBM SPSS Statistics, die ordinale Daten als gesonderten Typ erkennen. Sie können ein ordinales Feld überall dort verwenden, wo sich ein nominales Feld verwenden lässt. Außerdem können Felder jedes beliebigen Speichertyps ("Reelle Zahl", "Ganzzahl", "Zeichenfolge", "Datum", "Zeit" usw.) als "ordinal" definiert werden. - Ohne Typ. Wird für Daten verwendet, die keiner der Typen Standard, Kontinuierlich, Kategorisch, Flag, Nominal oder Ordinal entsprechen, für Felder mit einem einzigen Wert oder für nominale Daten, bei denen der Satz mehr Mitglieder als das definierte Maximum hat. Typlos ist auch für Fälle nützlich, in denen das Messniveau andernfalls ein Satz mit vielen Mitgliedern (z. B. einer Kontonummer) wäre. Bei Auswahl von Ohne Typ für ein Feld wird für die Rolle automatisch Keine festgelegt, wobei Datensatz-ID die einzige Alternative ist. Die Standardmaximalgröße für Sets liegt bei 250 eindeutigen Werten.
- Sammlung. Dient zur Angabe nicht georäumlicher Daten, die in einer Liste erfasst werden. Eine Sammlung ist im Grunde ein Listenfeld mit einer Tiefe von null, wobei die Elemente in dieser Liste eine der anderen Messniveaus aufweisen.
- Räumlich. Wird mit dem Speichertyp "Liste" zur Angabe von Geodaten verwendet. Listen können entweder Liste der Ganzzahl oder Liste von reellen Zahlen- Felder mit einer Listentiefe zwischen Null und Zwei, inklusive, sein.
Sie können die Messniveaus wahlweise manuell festlegen oder auch die Daten durch die Software einlesen und dann das Messniveau auf der Grundlage der eingelesenen Werte automatisch bestimmen lassen. Alternativ können Sie bei mehreren stetigen Datenfeldern, die als kategoriale Daten behandelt werden sollen, eine Option auswählen, um sie umzuwandeln. Siehe Konvertierte Daten konvertieren.
Automatische Typfestlegung verwenden
- Setzen Sie in einem Typknoten die Spalte Wertmodus für die gewünschten Felder auf Lesen. Dadurch werden die Metadaten für alle nachgeordneten Knoten verfügbar.
- Klicken Sie auf Werte lesen, um sofort die Werte aus der Datenquelle zu lesen.
Messniveau für ein Feld manuell festlegen
- Wählen Sie ein Feld in der Tabelle aus.
- Wählen Sie in der Dropdown-Liste in der Spalte Maß ein Messniveau für das Feld aus.
- Alternativ können Sie mithilfe der Kontrollkästchen mehrere Felder auswählen und dann die übergeordnete Dropdown-Liste verwenden, um das Messniveau für alle ausgewählten Felder auf einmal festzulegen.