GLMM-Knoten

Letzte Aktualisierung: 12. Feb. 2025
GLMM-Knoten (SPSS Modeler)

Dieser Knoten erstellt ein verallgemeinertes lineares gemischtes Modell (Generalized Linear Mixed Model, GLMM).

Verallgemeinerte lineare gemischte Modelle erweitern das lineare Modell wie folgt:
  • Das Ziel steht über eine angegebene Verknüpfungsfunktion in einer linearen Beziehung zu den Faktoren und Kovariaten.
  • Das Ziel kann eine von der Normalverteilung abweichende Verteilung aufweisen.
  • Es kann eine Korrelation zwischen den Beobachtungen bestehen.

Verallgemeinerte lineare gemischte Modelle decken eine breite Palette verschiedener Modelle ab, von einfacher linearer Regression bis hin zu komplexen Mehrebenenmodellen für nicht normalverteilte Longitudinaldaten.

Beispiele. Eine Schulbehörde kann ein verallgemeinertes lineares gemischtes Modell verwenden, um zu ermitteln, ob eine experimentelle Lehrmethode die Mathematikleistungen effektiv verbessert. Studenten aus dem gleichen Klassenzimmer sollten korreliert werden, da sie von demselben Lehrer unterrichtet werden, und Klassenräume innerhalb der gleichen Schule können auch korreliert werden, so dass wir zufällige Effekte auf Schul-und Klassenstufen einbeziehen können, um verschiedene Quellen der Variabilität zu berücksichtigen.

Wissenschaftler aus der Medizinforschung können ein verallgemeinertes lineares gemischtes Modell verwenden, um zu ermitteln, ob ein neues Antikonvulsivum die Häufigkeit epileptischer Anfälle bei einem Patienten verringern kann. Messwiederholungen bei ein und demselben Patienten sind in der Regel positiv korreliert. Daher sollte ein gemischtes Modell mit einigen Zufallseffekten angemessen sein. Das Zielfeld, also die Anzahl der Anfälle, nimmt positive ganzzahlige Werte an. Daher kann ein verallgemeinertes lineares gemischtes Modell mit einer Poisson-Verteilung und einer Log-Verknüpfung geeignet sein.

Die Geschäftsführung eines Kabelanbieters für Fernseh-, Telefon- und Internetdienstleistungen kann ein verallgemeinertes lineares gemischtes Modell verwenden, um mehr über potenzielle Kunden zu erfahren. Da mögliche Antworten nominale Messniveaus aufweisen, verwendet der Unternehmensanalyst ein generalisiertes, gemischtes Modell mit einem zufälligen Intercept, um die Korrelation zwischen Antworten auf die Service-Nutzungsfragen über Servicetypen (Fernsehen, Telefon, Internet) im Rahmen einer bestimmten Umfrage Antworten der Responder zu erfassen.

Mit den Optionen für die Datenstruktur in den Knoteneigenschaften können Sie die strukturellen Beziehungen zwischen Datensätzen in Ihrem Dataset festlegen, wenn Beobachtungen miteinander korrelieren. Wenn die Datensätze im Dataset unabhängige Beobachtungen darstellen, müssen Sie keine Datenstrukturoptionen festlegen.

Subjekte. Die Wertekombination der angegebenen kategorialen Felder sollte die Subjekte innerhalb des Datasets eindeutig definieren. Beispielsweise sollte ein einzelnes Feld Patient ID ausreichen, um Subjekte in einem einzelnen Krankenhaus zu definieren, aber die Kombination von Hospital ID und Patient ID kann erforderlich sein, wenn die Patientenidentifikationsnummern in Krankenhäusern nicht eindeutig sind. Bei einer Einstellung mit wiederholten Messungen werden für jedes Subjekt mehrere Beobachtungen aufgezeichnet, sodass jedes Subjekt mehrere Datensätze im Dataset belegen kann.

Ein Subjekt ist eine Beobachtungseinheit, die als unabhängig von anderen Subjekten betrachtet werden kann. Die Blutdruckmessungen eines Patienten in einer medizinischen Studie können beispielsweise als unabhängig von den Messungen anderer Patienten angesehen werden. Die Definition von Subjekten ist vor allem dann wichtig, wenn für jedes Subjekt Messwiederholungen durchgeführt werden und Sie die Korrelation zwischen diesen Beobachtungen analysieren möchten. So ist beispielsweise zu erwarten, dass Blutdruckmessungen bei einem bestimmten Patienten bei aufeinander folgenden Arztbesuchen miteinander korrelieren.

Alle Felder, die in den Knoteneigenschaften als Subjekte angegeben sind, werden dazu verwendet, Subjekte für die Kovarianzstruktur der Residuen zu definieren, und stellen die Liste der möglichen Felder zum Definieren der Subjekte für die Kovarianzstrukturen der Zufallseffekte im Block für zufällige Effekte bereit.

Messwiederholung. Die hier angegebenen Felder werden verwendet, um Beobachtungswiederholungen zu kennzeichnen. Beispielsweise kann eine einzelne Variable Week die 10 Wochen an Beobachtungen in einer medizinischen Studie identifizieren oder Month und Day können zusammen verwendet werden, um tägliche Beobachtungen im Laufe eines Jahres zu identifizieren.

Kovarianzgruppen definieren nach. Die hier festgelegten kategorialen Felder definieren unabhängige Sets von Parametern für die Kovarianzen der wiederholten Effekte; einen für jede Kategorie, die durch die Kreuzklassifikation der Gruppierungsfelder definiert werden. Alle Subjekte weisen denselben Kovarianztyp auf und Subjekte innerhalb derselben Kovarianzgruppierung weisen dieselben Werte für die Parameter auf.

Koordinaten für räumliche Kovarianz. Die Variablen in dieser Liste geben die Koordinaten der Beobachtungswiederholungen an, wenn einer der räumlichen Kovarianztypen als Kovarianztyp bei Messwiederholung ausgewählt wird.

Kovarianztyp bei Messwiederholung. Hiermit wird die Kovarianzstruktur für die Residuen angegeben. Die folgenden Strukturen sind verfügbar:

  • Autoregressiv der ersten Ordnung (AR1)
  • Autoregressiv mit gleitendem Durchschnitt (1,1) (ARMA11)
  • Zusammengesetzt symmetrisch
  • Diagonal
  • Skalierte Identität
  • Räumlich: Teststärke
  • Räumlich: exponentiell
  • Räumlich: gaußsch
  • Räumlich: linear
  • Räumlich: linear logistisch
  • Räumlich: kugelförmig
  • Toeplitz
  • Unstrukturiert
  • Varianzkomponenten