VO Persönlichkeits- und differentielle Psychologie | Learn flashcards online

All main topics / Psychologie / Differentielle Psychologie

VO Persönlichkeits- und differentielle Psychologie (220 Cards)

Welche Forderungen sind an das "objektive Messen" in den Sozialwissenschaften zu stellen?

Testunabhängige Fähigkeitsmaße (Personenparameter)
Stichprobenunabhängige Itemschwierigkeitsmaße (Itemparameter)

Die beiden Punkte entsprechen der Forderung von G. Rasch nach spezifischer Objektivität von Vergleichen und beinhaltet das Prinzip der sogenannten Stichprobenunabhängigkeit.

Tags: Item Response Theorie, Objektivität, Rasch-Modell
Source: S43

65
Cardlink

Was sind die Grundannahmen des Rasch-Modells als Skalenkonstruktionsmethode?

Das RM geht nicht vom Rohwert (Testwert, Score) aus, sondern setzt beim einzelnen Item an. Damit wird eine Prüfung, ob alle Items dieselbe latente Dimension messen überhaupt erst möglich.

drei Komponenten

Die manifeste Variable (Antworten der Personen auf Items) sind Indikatoren einer postulierten latenten Fähigkeits- oder Eigenschaftsdimension (sprich: Xi)
Der Zusammenhang zwischen manifester Variable und latenter Dimension ist systematisch, er wird für jedes einzelne Item i durch die Itemcharakteristik (Funktion) hergestellt:

eindeutigen Funktion

ein Item zu lösen (probabilistischer Charakter der Item-Response-Theory).- Person mit gleicher Fähigkeitsgraden (

) haben auch dieselbe Chance fi(

), die Aufgabe i zu lösen.- Die Item Lösungswahrscheinlichkeit soll nie 0 oder 1 erreichen, weil der Schäwcste einmal Glück haben kann bzw. dem Besten ein Fehler unterlaufen kann.

Wenn diese Betrachtung richtig ist und somit einelatente Dimension existiert, dann könnte man diese latente Dimension (statistisch) konstant halten (herauspartialisieren).
Es folgt: nach Konstanthaltung müssten die Zusammenhänge zwischen den manifesten Variablen verschwinden - lokal stochastische Unabhängigkeit

d.h. Die Wahrscheinlichkeit, dass eine Vp mit Fähigkeit

beide Items (i und j) löst ist gleich dem Produkt aus der Wahrscheinlichkeit der Einzelreaktionen, nämlich der Wahrscheinlichkeit Item i zu lösen und der Wahrscheinlichkeit Item j zu lösen. Aus der lokalen stochastischen Unabhängigkeit folgt auch insbesondere, dass die Antworten einer Person auf ein Item nicht von Antworten auf andere Items abhängen darf.

Zusätzlich wird im Rasch Modell angenommen, dass die Antworten verschiedene Personen__ voneinander stochastisch unabhängig sind (d.h. Schummeln verboten - beeinträchtigt die empirische Modellgeltung).

Tags: Rasch-Modell
Source: S44

66
Cardlink

Was bedeutet die lokale stochastische Unabhängigkeit beim RM?

Zusammenhänge zwischen den manifesten Variablen (z.B. 2 Antworten 2 verschiedener Items) sind nicht Ausdruck direkter Abhängigkeit zwischen den einzelnen Verhaltensweisen, sondern Ausdruck ihrer Abhängigkeit von einer, allen manifesten Variablen gemeinsam zugrunde liegenden latenten Dimension.

Wenn diese Betrachtung richtig ist und somit einelatente Dimension existiert, dann könnte man diese latente Dimension (statistisch) konstant halten (herauspartialisieren).
Es folgt: nach Konstanthaltung müssten die Zusammenhänge zwischen den manifesten Variablen verschwinden - lokal stochastische Unabhängigkeit

Formel:

d.h. Die Wahrscheinlichkeit, dass eine Vp mit Fähigkeit

beide Items (i und j) löst ist gleich dem Produkt aus der Wahrscheinlichkeit der Einzelreaktionen, nämlich der Wahrscheinlichkeit Item i zu lösen und der Wahrscheinlichkeit Item j zu lösen. Aus der lokalen stochastischen Unabhängigkeit folgt auch insbesondere, dass die Antworten einer Person auf ein Item nicht von Antworten auf andere Items abhängen darf.

Zusätzlich wird im Rasch Modell angenommen, dass die Antworten verschiedene Personen voneinander stochastisch unabhängig sind (d.h. Schummeln verboten - beeinträchtigt die empirische Modellgeltung).

Tags: lokale stochastische Unabhängigkeit, Rasch-Modell
Source: S44

67
Cardlink

Wovon soll - laut RM - das Lösen einer Aufgabe abhängen?

Die Wahrscheinlichkeit einer Aufgabe zu lösen [p ( + ӏ ξ v , σi)] soll abhängen von …

… Fähigkeit der Person ξv (ξ v ist der zu schätzende Fähigkeitsparameter der Person v)
… Schwierigkeit d. Aufgabe σi (σi ist der zu schätzende Itemparameter für Item i)
… sonst nichts, d.h. andere Itemauswahl (aus dem Itempool) oder andere Personenauswahl (aus der Grundgesamtheit) sollen keinen systematischen Einfluss auf die zu schätzenden Parameter haben.

Tags: Rasch-Modell
Source: S44

68
Cardlink

Wie ist die Datenmatrix zur Schätzung der Parameter im Rasch-Modell aufgebaut?

Dichotomes logistische Modell von RASCH (1960)

Die statistische Information zur Schätzung der Parameter findet sich in der folgenden Datenmatrix (Modellgeltung vorausgesetzt):

Jede Person ist im RM durch ihre Position

v auf der latenten Dimension charakterisiert.

v ist ein "Personen(fähigkeits)parameter", der - wie andere statistische Parameter auch - erst geschätzt werden muss.
Analoges gilt für die Itemparameter: Jedes Item ist durch seine Position (Lage)

i auf der latenten Dimension charaktersisiert.

i ist ein "Item(schwierigkeits)parameter", der erst geschätzt werden muss.

Tags: Rasch-Modell
Source: VO06

69
Cardlink

Was ist die Grundgleichung des Rasch-Modells und auf welcher mathematischen Funktion basiert diese?
Erkläre dies anhand eines Beispiels..

Welche mathematische Funktion entspricht nun den durch Rasch aufgestellten Forderungen und Grundannahmen?
Die sog. logistische Funktion

Daher kommt Rasch zu folgender Grundgleichung des RM (Darstellung mit logarithmierten Parametern)

Im RM wird also die Lösungswahrscheinlichkeit als logistische Funktion der Differenz d von Personenfähigkeit und Itemschwierigkeit (

v -

i) beschrieben.

Berechnungsbeispiel einer Itemcharakteristik
Die Festlegung der Struktur eines probabilistischen Testmodells besteht in der Spezifikation der Funktionen fi (ξ). Sind diese Funktionen bekannt, dann können die Parameter geschätzt werden.

Anmerkung

Rasch-Modell benötigt dichotome Testaufgaben.
p(+): Wahrscheinlichkeit ein Item zu lösen; hängt nicht davon ab, wie groß v und wie groß i ist, sondern lediglich von der Differenz v-i
p(+) = 0,5: wenn v = i; das ist auch inhaltlich sinnvoll, weil Person v dann gleich fähig ist wie das Item i schwierig ist (= Lösungsschwierigkeit 1/2)

Tags: Rasch-Modell
Source: S45

70
Cardlink

Was sind Kennzeichen des Rasch-Modells (ergänzende Bemerkungen)?

Das RM ist das einzige probabilistische Testmodell, das spezifisch objektive Vergleiche ermöglicht und dadurch "Stichprobenunabhängigkeit" der Messung realisiert
Eindimensionalität der Testaufgaben

Alle "latente" Personenmerkmale

vollständig

Erschöpfende Statistik

wie viele

welche

Wünscht man einen Test, bei dem der Testrohwert (rv) interpretiert werden kann, so mus für diesen Test das Rasch-Modell gelten (und dies ist mathematisch beweisbar)!
Beachte: Nahezu alle herkömmlichen Fähigkeitstests die mittels KTT entwickelt wurden, interpretieren den Testrohwert (=Summe der gelösten Aufgaben), jedoch ohne zu überprüfen, ob das korrekt ist!

Tags: Rasch-Modell
Source: S46

71
Cardlink

Was sind die Konsequenzen für die Anwendungspraxis bei
Gültigkeit des RM?

Test misst für alle Personen (begabte/unbegabte; m/w [gender fairness!]; jüngere/ältere, etc.) dieselbe latenten Dimension (sprich: die Items sind Rasch homogen oder eindimensional).
Die Rohwerte (Vpn‐Randsummen) enthalten die gesamten Informationen, die zur Schätzung der Personenfähigkeitsparameter notwendig sind.

nachweislich

Der Zusammenhang zwischen den rangskalierten Rohwerten und den intervallskalierten Fähigkeitsparametern ist empirisch begründet (d.h. durch Daten untermauert und durch Modelltests abgesichert). Damit ist eine intervallskalierte Fähigkeitsskala etabliert und man kann von „echter Messung“ der zugrunde liegenden Eigenschaft (Dimension) sprechen.

Tags: Rasch-Modell
Source: VO06

72
Cardlink

Was sind die Vorzüge des Rasch-Modells?

Mittels Modellgeltungskontrollen kann im RM geprüft werden, ob die im Modell enthaltenen Annahmen für einen empirisch gegebenen Datensatz gelten oder nicht. Wenn das Modell empirisch gilt, darf gefolgert werden

Der Test misst für alle Testpersonen (jüngere/ältere; begabte/unbegabte; männliche/weibliche; etc.) dieselbe latente Fähigkeitsdimension (dasselbe Konstrukt). Die Testaufgaben sind in diesem Sinne eindimensional und messen fair (z.B. auch Gender-Fair)
Die Personenparameter (Fähigkeitsparameter) kennzeichnen die Fähigkeitsgrade der Personen. Sie liegen auf einer Intervallskala und sind unabhängig davon, welche und wie viele Items im Test vorgegeben wurden.
Die Itemparameter (Aufgabenschwierigkeitsparameter) liegen auf derselben Intervallskala wie die Personenparameter. Sie kennzeichnen die Schwierigkeitsgrade von Items und sind unabhängig davon, welche Personengruppen getestet werden.
Zur Bestimmung der Personenfähigkeiten genügt es zu wissen, wie viele Items gelöst wurden und nicht welche Testitems gelöst wurden.
Die Reihenfolge, in der die Items vorgegeben werden spielt für das Testergebnis keine Rolle.
Fähigkeitsangepasstes Testen (sog. Adaptives Testen) ist optional möglich, wenn ein genügend großer Aufgabenpool vorhanden ist.
Veränderungen können gemessen werden. In der klassischen Testtheorie sagt eine Verbesserung um 1 Rohwertpunkt nicht aus um wieviel sich die Person verbessert hat.

ABER:
Der Aufwand für Testkonstruktion auf Basis des Rasch Modells ist weitaus größer als auf Basis der klassischen Testtheorie. (Das mag zum Teil erklären, dass auch heute noch - trotz unbestrittener Vorzüge der Item-Response-Theorie - Testkonstruktionen mittels klassischer Testtheorie vorgenommen werden.)

Tags: Rasch-Modell
Source: S47

73
Cardlink

Was ist der 3DW?
Und welche Ergebnisse zeigte die Überprüfung hinsichtlich des Rasch-Modells?

Ein Rasch‐skalierter Test zur Messung des räumlichen
Vorstellungsvermögens (Gittler, 1990)

Testinstruktion(verkürzt): Jeder Würfel hat sechs verschiedene Muster, nur drei davon kann man sehen. Prüfen Sie, ob einer der Würfel A bis F derselbe Würfel sein kann, wie der links gezeigte Würfel X, oder ob die Antwort G „kein Würfel richtig“ zutreffend ist. Sollte eine Aufgabe zu schwierig sein, dann wählen Sie die Antwort H „Ich weiß die Lösung nicht“.

Empirisch bestimmter Zusammenhang zwischen rangskalierten Testrohwerten und intervallskalierten Fähigkeitsparametern im 3DW

Weitere empirische Ergebnisse zum 3DW:
li.: Grafischer Modelltest (nieder/hoch)
re: theoretische und empirische Item Response Functions

Signifikante Leistungsänderungen

Tags: Beispiel, Rasch-Modell
Source: VO06

74
Cardlink

Was sind die Anwendungsbespiele für das Rasch-Modell im Überblick?

Item-Bias
Transkulturelles Testen
Computerisiertes Adaptives Testen (CAT)
Psychometrische Qualitätskontrolle von Tests
Veränderungsmessung

Tags: Anwendung, Rasch-Modell
Source: S48

75
Cardlink

Inwiefern unterstützt das Rasch-Modell bei der Skalen und Testkonstruktion?

(Aufwand hoch im Vergleich zur KTT wegen der zahlreichen Modellprüfungen an großen Datensätzen)

Entdeckung von Item‐Bias: Sofern einzelne Items eines Tests Gruppen von Personen benachteiligen spricht man von Item‐Bias oder "Differential Item Functioning" (kurz: DIF).
Derartige DIF‐Items bevorzugen ungerechtfertigter Weise Personengruppen (z.B. Begabungsgruppen, Geschlechtergruppen, ethnische Gruppen, Alters‐ oder Ausbildungsgruppen etc.) und stellen somit eine Gefahr für die Testinterpretation dar. Allgemein kann man sagen: Ein Test, der DIF‐Items enthält, misst nicht fair.
Fehlinterpretationen, Verminderung der Messeffizienz (Reliabilität, Validität etc.) des gesamten Tests.

Ein Item ist als verzerrt od. unfair anzusehen, wenn seine IC-Kurve in zwei unabhängig von diesem Item definierten Gruppen verschieden ist; ein Test wird unfair sein, wenn zumindest ein Item "biased" ist.
(Beachte: Die Definition von Item-Homogenität oder Item-Bias erfolgt stets im Rahmen eines bestimmten Modells.)

Tags: Rasch-Modell
Source: S48

76
Cardlink

Inwiefern unterstützt das Rasch-Modell das transkulturelle Testen?

Entwicklung und Evaluierung von „culture fair“ Tests:

Nachweis der Gültigkeit des RM in der „Ausgangskultur“
Sorgfältige Übersetzung bzw. Übertragung eines Tests in andere Sprache
Nachweis der Gültigkeit des RM in der „Zielkultur“
Nachweis Gültigkeit des Rasch Modells über beide Kulturen: Im Sinne des RMs ist ein Test dann als culture fair zu bezeichnen, wenn alle Items in den untersuchten Kulturen gemeinsam Rasch homogen sind.

(Anmerkung: Häufig werden nonverbal-bildhaft dargebotene Testaufgaben, zu deren Lösung keine speziellen Kulturtechniken wie Lesen oder Mathematik nötig sind, als Culture-Fair eingestuft - dies reicht aus Sicht der modernen Psychometrie nicht aus. Es muss empirisch nachgewiesen werden.)

Tags: Rasch-Modell
Source: S48

77
Cardlink

Inwiefern unterstützt das Rasch-Modell das computerisierte Adaptive Testen (CAT)? Vor- und Nachteile von CAT?

Entwicklung von Aufgabenpools für das computerisierte
adaptive Testen (= fähigkeitsangepasstes Testen):

Es werden individuell unterschiedlich schwierige Aufgaben aus dem Itempool (während der Computertestung) vorgegeben, die dem Fähigkeitsniveau der jeweiligen Vp bestmöglich entsprechen.

Die Auswahl der Items erfolgt durch den Computer - Nach jeder Itembeantwortung wird der aktuelle Fähigkeitsparameter

v der Vp geschätzt und danach das bestpassende Item (= informativste Item mit

i ungefähr

v) aus dem Poo vorgegeben.

Positive Konsequenzen des CAT:

Wenige "unnütze" Items im Test (zu leicht bzw. schwere werden vermieden)
Höhere Messgenauigkeit bei ev. weniger Items (kürzere Testdauer)
Auch in Extrembereichen kann präziser gemessen werden
Testabbruch kann auf diagnostische Anforderungen eingestellt werden (z.B. nur grobes Screening oder präzise Messung)
Testsicherheit und Testfairness erhöht, weil "Testknackermethoden" weitgehend unwirksam
Abschauen bzw. Schummeln bei Gruppentestungen unterbunden
Die Bekanntgabe des Itemtyps der im Pool enthalten Aufgaben (nicht die Poolaufgabe selbst) zur Testvorbereitung ist möglich.

Nachteile:

Massiv erhöhter Testkonstruktionsaufwand für den Testkonstrukteur bei der Entwicklung eines Rasch-homogenen Itempools

Tags: CAT, Rasch-Modell
Source: S49

78
Cardlink

Inwiefern unterstützt das Rasch-Modell die psychometrische Qualitätskontrolle von Tests?

z.B. Frage, ob zwei ähnliche Tests auch dasselbe Konstrukt erfassen.

Wenn Tests ähnliche latente Dimensionen erfassen, ist es aus testökonomischer Sicht nicht gerechtfertigt, sie gemeinsam in einer Testbatterie zu belassen.

Im klassischen Ansatz wird die Gleichartigkeit von Tests mittels Korrelationen ermittelt, die jedoch keine konklusive (eindeutige) Aussage ermöglichen.
Bei gemeinsamer Verrechnung der Tests im RM ist der Modelltests zwischen den Itemgruppen (Reasoning-Test WMT räumlicher Anteile vs. Raumvorstellungstest 3DW) signifikant - Tests messen nicht dieselbe Subdimension des Konstrukts Raumvorstellung.

Aus dieser Überprüfung mit dem Rasch-Modell können positive Aussagen zum Nutzen und zur Konstruktvalidität der Tests abgeleitet werden.

Tags: Psychometrie, Rasch-Modell, Test
Source: S50

79
Cardlink

Inwiefern unterstützt das Rasch-Modell die Veränderungsmessung?

Veränderungsmessung im Prä‐ / Posttest Design:

Der Hauptvorteil Rasch homogener Tests liegt in der Intervallskaleneigenschaft der Personenfähigkeitsparameter und der Itemschwierigkeitsparameter.
Unter zusätzlicher Verwendung eines weiteren IRT‐Modells (lineares Logistisches Modell, LLTM) können die Effekte spezifiziert werden (vgl. Beispiele hinten).

Tags: Rasch-Modell
Source: S50

80
Cardlink

Was sind Anwendungsbeispiele für Veränderungsmessungen?

Anwendungsbeispiel 1 zum linearen logistischen
Modell (LLTM): Veränderungsmessung

Keine signifikanten Unterschiede zwischen Kaugummikau-Gruppe und Kontrollgruppe.

Anwendungsbeispiel 2 zum LLTM: Veränderungsmessung

„Pheromone Exposure Impairs Spatial Task Performance in Young men“

Männer mussten Aufgaben des Raumvorstellungstests (3DW) bearbeiten)
Dazwischen mussten sie eine Atemmaske aufsetzen:
Hypothese - Androgynie-Vorstellung der Raumverstellung: weibliche Männer und männliche Frauen haben bessere Raumvorstellungsfähigkeiten.
Indirekt über die Pheromone wird das Testosterone erhöht.
Ergebnis: es gab tatsächlich signifikante Veränderungen der Leistung – die Pheromone-Gruppe haben im 2. Teil des Leistungstest signifikant schlechtere Ergebnisse erzielt.

Tags: Beispiel, Rasch-Modell
Source: VO06