Was ist der Vorteil der Multiplen Regression? Warum ist sie v.a. in der Psychologie so wichtig?
- Verfahren kann relativen Einfluss einzelner Prädiktoren im Kontext
der anderen Prädiktoren ermitteln
- wägt die Vorhersagekraft der einzelnen Prädiktoren
gegeneinander ab, indem sie Überschneidungen
(Interkorrelationen) zwischen den einzelnen Prädiktoren
berücksichtigt
- durch den Einbezug weiterer Prädiktoren verbessert sich die
Übereinstimmung zwischen beobachtetem und geschätzten Wert
-> man hat weniger Residuen
-> Beta-Werte miteinander vergleichen
psychologische Konstrukte sind so gut wie nie nur durch einen
Prädikator erklärbar!
der anderen Prädiktoren ermitteln
- wägt die Vorhersagekraft der einzelnen Prädiktoren
gegeneinander ab, indem sie Überschneidungen
(Interkorrelationen) zwischen den einzelnen Prädiktoren
berücksichtigt
- durch den Einbezug weiterer Prädiktoren verbessert sich die
Übereinstimmung zwischen beobachtetem und geschätzten Wert
-> man hat weniger Residuen
-> Beta-Werte miteinander vergleichen
psychologische Konstrukte sind so gut wie nie nur durch einen
Prädikator erklärbar!
Tags: Multiple Regression, VL 10
Quelle:
Quelle:
Wie sieht die Gleichung der Multiplen Regression aus?
= a + b1* Prädikator1 + b2 * Prädikator2 + b3*Prädikator3
Tags: Multiple Regression, Vl 10
Quelle:
Quelle:
Nenne die Ablaufschritte der multiplen Regressionsanalyse!
(im Prinzip äquivalent zur einfacheren Regr., dort sind aber Schritt 3+4 identisch)
1. Modellformulierung: Beruht auf theoretischen Vorüberlegungen, Modelle und Annahmen zur Kausalität
2. Schätzung der Regressionsfunktion
3. Prüfung der Regressionsfunktion
4. Prüfung der Regressionskoeffizienten
5. Prüfung der Modellprämissen
1. Modellformulierung: Beruht auf theoretischen Vorüberlegungen, Modelle und Annahmen zur Kausalität
2. Schätzung der Regressionsfunktion
3. Prüfung der Regressionsfunktion
4. Prüfung der Regressionskoeffizienten
5. Prüfung der Modellprämissen
Tags: Multiple Regression, VL 10
Quelle:
Quelle:
Wie lauten die Schritte für die Prüfung zur Regressionsfunktion (Multiple Regressionsanalyse)?
2 Schritte:
globale Prüfung der Regressionfunktion:
= wie gut wird Y durch das Regressionsmodell erklärt?
Ist das Modell als Ganzes nicht geeignet, erübrigt sich die Prüfung der einzelnen Koeffizienten.
Prüfung der Regressionskoeffizienten:
= wie gut tragen einzelne Variablen des Regr.modells zur Erklärung bei?
Wenn eine Variable keinen Beitrag zur Erklärung liefert, ist sie aus der Regressionsfunktion zu entfernen.
globale Prüfung der Regressionfunktion:
= wie gut wird Y durch das Regressionsmodell erklärt?
Ist das Modell als Ganzes nicht geeignet, erübrigt sich die Prüfung der einzelnen Koeffizienten.
Prüfung der Regressionskoeffizienten:
= wie gut tragen einzelne Variablen des Regr.modells zur Erklärung bei?
Wenn eine Variable keinen Beitrag zur Erklärung liefert, ist sie aus der Regressionsfunktion zu entfernen.
Tags: Multiple Regrssion, VL 10
Quelle:
Quelle:
Was sind die Gütemaße zur globalen Prüfung der Regressionsfunktion?
Bestimmungsmaß r^2:
der durch die UV erklärte Anteil, Wertebereich zw. 0 und 1
(1, wenn die gesamte Streuung erklärt wird, mit jedem hinzukommenden Prädikator wird mehr erklärt)
die F-Statistik:
besitzt das geschätzte Modell auch über die Stichprobe hinaus Gütligkeit für die Grundgesamteheit, empirischer F-Wert wird mit kritischem Wert verglichen
der Standardfehler.
der durch die UV erklärte Anteil, Wertebereich zw. 0 und 1
(1, wenn die gesamte Streuung erklärt wird, mit jedem hinzukommenden Prädikator wird mehr erklärt)
die F-Statistik:
besitzt das geschätzte Modell auch über die Stichprobe hinaus Gütligkeit für die Grundgesamteheit, empirischer F-Wert wird mit kritischem Wert verglichen
der Standardfehler.
Tags: Multiple Regression, VL 10
Quelle:
Quelle:
Wie läuft die Prüfung des Regressionskoeffizienten bei der Multiplen Regressionsanalyse ab?
(wie gut tragen einzelne Variablen des Regressionsmodells zur Erklärung bei? Wenn eine Variable keinen Beitrag zur Erklärung liefert, ist sie aus der Regressionsfunktion zu entfernen)
- t-Test
die einzelnen Regressionskoeffizienten werden durch eine t-Verteilung geprüft, man erhält den t-Wert, indem der Regressionskoeffizient durch den Standardfehler dividiert wird
- Beta-Wert
- t-Test
die einzelnen Regressionskoeffizienten werden durch eine t-Verteilung geprüft, man erhält den t-Wert, indem der Regressionskoeffizient durch den Standardfehler dividiert wird
- Beta-Wert
Tags: Multiple Regression, VL 10
Quelle:
Quelle:
Wie läuft die Prüfung der Modellprämissen bei der Multiplen Regressionsanalyse ab?
Gegenüber der einfachen Regression kommt hinzu:
- Keine übermäßige Multikollinearität der Prädiktoren
Unter Multikollinearität versteht man sehr hohe lineare Zusammenhänge zwischen den Prädiktoren, so dass im Extremfall eine Prädiktorvariable aus den anderen Prädiktoren vorhersagbar wäre.
- Dies würde dazu führen, dass die Einflussgewichte der einzelnen Prädiktoren nicht mehr genau bestimmbar sind.
- Keine übermäßige Multikollinearität der Prädiktoren
Unter Multikollinearität versteht man sehr hohe lineare Zusammenhänge zwischen den Prädiktoren, so dass im Extremfall eine Prädiktorvariable aus den anderen Prädiktoren vorhersagbar wäre.
- Dies würde dazu führen, dass die Einflussgewichte der einzelnen Prädiktoren nicht mehr genau bestimmbar sind.
Tags: Multiple Regression, VL 10
Quelle:
Quelle:
Welche verschiedenen Regressionsanalyse-Möglichkeiten gibt es?
-schrittweise Regressionsanalyse
-blockweise Regressionsanalyse
-hierarchische Regressionsanalyse
-blockweise Regressionsanalyse
-hierarchische Regressionsanalyse
Tags: Multiple Regression, VL 10
Quelle:
Quelle:
Wie sieht die schrittweise Regressionsanalyse genauer aus? Was wird an dieser Methode kritisiert?
- bei 3 Prädktoren kann man 7 verschiedene Modelle bilden:
- 3 Modelle mit einem Prädiktor, 3 mit zwei P. und eins mit drei P.
- Entscheidung über theor. Vorüberlegung, dann mit der Methode
"Einschluss" berechnet
- durch das 'schrittweise'-Modell kann man sich eine Auswahl von
Modellen anzeigen lassen, die das Datenmaterial gut abbilden,
und versucht, das gewählte Modell sinnvoll zu interpretieren.
- außerdem werden die Prädikatoren einzeln nacheinander in die
Regressionsgleichung einbezogen. Es wird jeweils eine Variable
gewählt, die ein bestimmtes Gütekriterium maximiert.
- erster Schritt: Variable mit höchster Korrelation (=höchster
Erklärungswert); folgende Schritte: jeweils die, mit der höchsten
partiellen Korrelation
- Rangfolge: statistische Wichtigkeit der Variable
Kritik: explorativer Charakter (das Modell wird ja nicht theoretisch abgeleitet) und: wenn ein Prädiktor allein nicht zur Varianzaufklärung in y beiträgt, wird er nicht ins Modell aufgenommen
- 3 Modelle mit einem Prädiktor, 3 mit zwei P. und eins mit drei P.
- Entscheidung über theor. Vorüberlegung, dann mit der Methode
"Einschluss" berechnet
- durch das 'schrittweise'-Modell kann man sich eine Auswahl von
Modellen anzeigen lassen, die das Datenmaterial gut abbilden,
und versucht, das gewählte Modell sinnvoll zu interpretieren.
- außerdem werden die Prädikatoren einzeln nacheinander in die
Regressionsgleichung einbezogen. Es wird jeweils eine Variable
gewählt, die ein bestimmtes Gütekriterium maximiert.
- erster Schritt: Variable mit höchster Korrelation (=höchster
Erklärungswert); folgende Schritte: jeweils die, mit der höchsten
partiellen Korrelation
- Rangfolge: statistische Wichtigkeit der Variable
Kritik: explorativer Charakter (das Modell wird ja nicht theoretisch abgeleitet) und: wenn ein Prädiktor allein nicht zur Varianzaufklärung in y beiträgt, wird er nicht ins Modell aufgenommen
Tags: Multiple Regression, Vl 10
Quelle:
Quelle:
Was versteht man unter der blockweisen Regressionsanalyse?
– In SPSS Methode „Einschluss“ – (theoriegeleitet) werden Variablen in einem Block in die Regressionsanalyse einbezogen
– Alle Variablen werden berücksichtigt, in der Tabelle „Koeffizienten“ wird der Beta-Koeffizient angegeben, durch den man bestimmen kann, welcher Prädiktor den höchsten Einfluss nimmt
– Alle Variablen werden berücksichtigt, in der Tabelle „Koeffizienten“ wird der Beta-Koeffizient angegeben, durch den man bestimmen kann, welcher Prädiktor den höchsten Einfluss nimmt
Tags: Regressionsanalyse, VL 10
Quelle:
Quelle:
Was passiert bei der hierarchischen Regressionsanalyse?
– Die Funktion Einschluss wird genutzt, um (theoriegeleitet) unterschiedliche Blöcke von Variablen in die Regressionsanalyse einzubeziehen
– Zunächst nimmt man die Variable(n), die vor dem Hintergr. d. Theorie zentral erscheinen
– In einem zweiten Block fügt man (eine) potenziell weitere erklärende Variable(n) hinzu und kann über die Funktion „Änderung in R-Quadrat“ feststellen, ob diese die Vorhersage signifikant verbessert
– Gegenstand der multiplen (hierarchischen) Regression:
Erklärung der Varianz in der Kriteriumsvariablen durch zwei (oder mehr) Prädiktor/Moderatorvariablen
– Beispiel: Wie viel Varianz der Gedächtnisleistung wird durch Alter und Intelligenz erklärt?
– Zunächst nimmt man die Variable(n), die vor dem Hintergr. d. Theorie zentral erscheinen
– In einem zweiten Block fügt man (eine) potenziell weitere erklärende Variable(n) hinzu und kann über die Funktion „Änderung in R-Quadrat“ feststellen, ob diese die Vorhersage signifikant verbessert
– Gegenstand der multiplen (hierarchischen) Regression:
Erklärung der Varianz in der Kriteriumsvariablen durch zwei (oder mehr) Prädiktor/Moderatorvariablen
– Beispiel: Wie viel Varianz der Gedächtnisleistung wird durch Alter und Intelligenz erklärt?
Tags: Regressionsanalyse, VL 10
Quelle:
Quelle:
Ist die moderierte Regression nicht-linear oder linear?
Nenne Beispiele für Kriteium und Prädiktor
Nenne Beispiele für Kriteium und Prädiktor
= nicht-lineare Regression, in der die multiple Regression um das Produkt aus zwei Prädiktorvariablen erweitert wird.
d.h.:
Kriterium : Gedächtniswert
Prädiktoren : Alter
Intelligenz
-> Alter * Intelligenz
d.h.:
Kriterium : Gedächtniswert
Prädiktoren : Alter
Intelligenz
-> Alter * Intelligenz
Tags: Regressionsanalyse, VL 10
Quelle:
Quelle:
Was passiert bei der Moderierten Regression, wenn ich einfach die beiden Prädiktorvariablen miteinander multipliziere?
Wenn beide Variablen gleich skaliert sind und deren Mittelwerte gleich sind: Alles OK
Beispiel: verbale Intelligenz plus non-verbale Intelligenz
jeweils Mittelwert in Stichprobe = 100, SD = 15
Kommt in der Realität so gut wie nie vor
Wenn beide Variablen nicht gleich skaliert sind und deren Mittelwerte nicht gleich sind:
Die Variablen gehen mit unterschiedlichen Gewichten in den multiplikativen Term ein
→ keine homogene Interaktion analysierbar
Beispiel: verbale Intelligenz plus non-verbale Intelligenz
jeweils Mittelwert in Stichprobe = 100, SD = 15
Kommt in der Realität so gut wie nie vor
Wenn beide Variablen nicht gleich skaliert sind und deren Mittelwerte nicht gleich sind:
Die Variablen gehen mit unterschiedlichen Gewichten in den multiplikativen Term ein
→ keine homogene Interaktion analysierbar
Tags: Regressionsanalyse, VL 10
Quelle:
Quelle:
Was kann ich tun, um aus zwei Prädiktorvariablen mit ungleichen Skalen/Mittelwerten den
multiplikativen Term bilden zu können?
multiplikativen Term bilden zu können?
Standardisieren von Variablen:
Z-Standardisierung; Ergebnis: Mittelwert = 0 SD = 1
oder
Zentralisieren von Variablen: (Aiken & West, 1991)
Bei beiden Variablen wird getrennt voneinander der Mittelwert auf 0 gesetzt indem die Abweichungen vom Mittelwert pro Vpn berechnet werden. Bsp.: mx = mean(alter) alter_z = alter – mx
Verteilungsform (SD) der Variablen bleibt erhalten: zentralisierte Variablen haben die gleiche SD wie vor der Zentralisierung.
Aus den beiden zentralisierten Variablen wird das Produkt gebildet.
Anschließend: Berechnung einer multiplen (hierarchischen) Regression mit den beiden Prädiktor/Moderatorvariablen plus dem multiplikativen Term der zentralisierten Prädiktorvariablen.
Z-Standardisierung; Ergebnis: Mittelwert = 0 SD = 1
oder
Zentralisieren von Variablen: (Aiken & West, 1991)
Bei beiden Variablen wird getrennt voneinander der Mittelwert auf 0 gesetzt indem die Abweichungen vom Mittelwert pro Vpn berechnet werden. Bsp.: mx = mean(alter) alter_z = alter – mx
Verteilungsform (SD) der Variablen bleibt erhalten: zentralisierte Variablen haben die gleiche SD wie vor der Zentralisierung.
Aus den beiden zentralisierten Variablen wird das Produkt gebildet.
Anschließend: Berechnung einer multiplen (hierarchischen) Regression mit den beiden Prädiktor/Moderatorvariablen plus dem multiplikativen Term der zentralisierten Prädiktorvariablen.
Tags: VL 10
Quelle:
Quelle:
Moderierte Regression: Was sagt mir eine signifikante Interaktion?
- zunächst einfach „nur“, dass durch die Interaktion der beiden Prädiktorvariablen mehr Varianz in der Kriteriumvariablen erklärt wird als durch die beiden Prädiktorvariablen zusammengenommen
- Betrachtung (und Berechnung) der „single slopes“ erklärt die „Richtung“ des Interaktionseffektes
- Betrachtung (und Berechnung) der „single slopes“ erklärt die „Richtung“ des Interaktionseffektes
Tags: Regressionsanalyse, VL 10
Quelle:
Quelle:
Kann man eine moderierte Regression auch durchführen, wenn eine der Prädiktorvariablen dichotom ist („dummy Variable“)? Nenne ein Beispiel.
JA!
Kriterium: Gedächtniswert
Prädiktoren: Umgebungskontext (mit Fernseher/ohne Fernseher)
Aufmerksamkeitsleistung; (Umgebung * Aufmerksamkeit)
Design:
– 100 Vpn, Kriteriumvariable: Score in einem Gedächtnistest
– 2 Gruppen (jeweils n = 50):
• A) Gedächtnistest während Fernseher läuft
• B) Gedächtnistest in ruhigem Raum
Moderatorvariable: Aufmerksamkeitsleistung (wurde vorher erfasst)
Kriteriumvariable: Score in einem Gedächtnistest
Prädiktorvariable: „Gruppe“ (Fernsehen vs. Ruhe)
Hypothese: Ausprägung der Gedächtnisleistung (Kriterium) wird durch die Gruppenzugehörigkeit (Prädiktor) erklärt; der Effekt der Gruppenzugehörigkeit auf die Gedächtnisleistung wird jedoch durch die generelle Aufmerksamkeitsleistung (Moderator) moderiert.
Kriterium: Gedächtniswert
Prädiktoren: Umgebungskontext (mit Fernseher/ohne Fernseher)
Aufmerksamkeitsleistung; (Umgebung * Aufmerksamkeit)
Design:
– 100 Vpn, Kriteriumvariable: Score in einem Gedächtnistest
– 2 Gruppen (jeweils n = 50):
• A) Gedächtnistest während Fernseher läuft
• B) Gedächtnistest in ruhigem Raum
Moderatorvariable: Aufmerksamkeitsleistung (wurde vorher erfasst)
Kriteriumvariable: Score in einem Gedächtnistest
Prädiktorvariable: „Gruppe“ (Fernsehen vs. Ruhe)
Hypothese: Ausprägung der Gedächtnisleistung (Kriterium) wird durch die Gruppenzugehörigkeit (Prädiktor) erklärt; der Effekt der Gruppenzugehörigkeit auf die Gedächtnisleistung wird jedoch durch die generelle Aufmerksamkeitsleistung (Moderator) moderiert.
Tags: Regressionsanalyse, VL 10
Quelle:
Quelle:
Was bringt bei diesem Design (moderierte Regression mit dichotomer Mod./Präd.-Variablen) eine moderierte Regression mehr als t-Test plus Korrelation?
mit t-Test +Korrelation: nur Aussagen über den Gruppenunterschied und über den Zusammenhang zwischen den beiden Variablen (Kriterium und Moderatorvariable) möglich. Keine Aussagen über die Interaktion zwischen Gruppenzugehörigkeit und Moderatorvariable möglich
Tags: Regressionsanalyse, VL 10
Quelle:
Quelle:
Kartensatzinfo:
Autor: P-H-I-L
Oberthema: Statistik
Thema: Inferenzstatistik
Veröffentlicht: 13.04.2010
Schlagwörter Karten:
Alle Karten (167)
Chi-Quadrat-Test (12)
Clusteranalyse (21)
Effektstärke (2)
Kruskal-Wallis (4)
Regressionsanalyse (24)
Tutorium (2)
Übung (6)
Varianzanalyse (68)
VL 09 (17)
VL 10 (15)
Vl 10 (2)
VL 11 (15)
Vl 11 (1)
VL03 (14)
VL04 (22)
VL05 (11)
VL06 (2)
VL07 (11)
VL08 (21)