Zuverlässigkeit in der psychologischen Diagnostik

 

Reliabilität bedeutet die Reproduzierbarkeit der gewonnenen diagnostischen Informationen. Reliabilität bezeichnet den Grad der Genauigkeit eines diagnostischen Ergebnisses, mit dem ein gemessenes Merkmal erfasst wird. 

Merkmale, über die gezielt diagnostische Informationen erhoben werden, um anhand dieser Informationen zu einem diagnostischen Schluss zu gelangen, müssen reproduzierbar sein. Anhand der Reliabilität ist es Wissenschaftlern möglich, sich untereinander zu kontrollieren oder Forschungsergebnisse mit modifizierten Fragestellungen untereinander zu vergleichen.

Für die Bestimmung der Reliabilität von Testverfahren stehen drei Techniken zur Auswahl:
Paralleltestreliabilität 
Ein Test wird in zwei Parallelversionen entwickelt und den Probanden möglichst zeitnah vorgelegt. Beispielsweise wird zum einem Test A ein paralleler Test B mit ähnlichen Items entwickelt, um derselben Probandengruppe beide Tests nacheinander vorzulegen. Eine Teilgruppe von Probanden führt erst den Test A und dann den Test B durch, während die andere Teilgruppe mit Test B anfängt und dann Test A bearbeitet.
Testwiederholung (Retest-Reliabilität)
Derselbe Test wird mit denselben Probanden unter den gleichen Bedingungen wiederholt. Die Korrelation zwischen den Ergebnissen der ersten und der zweiten Darbietung gibt das Ausmaß der Paralleltestreliabilität an. Eine Problematik bei dieser Reliabilitätsbestimmung besteht in der zeitlichen Trennung zwischen der ersten und der zweiten Darbietung, da einerseits Erinnerungseffekte vermieden werden sollen, was für einen langen Zeitabstand spricht, andererseits sollen jedoch Merkmale verglichen werden, die sich mit der Zeit verändern können, was wiederum für einen kurzen Zeitabstand spricht.
Testhalbierung (Split-half-Methode)
Der Test wird in zwei gleichwertige Hälften aufgeteilt und die Messwerte einzelner Probanden aus beiden Hälften werden miteinander korreliert.
Hierbei ist es notwenig, dass die Items sich inhaltlich und anzahlmässig in zwei Hälften aufteilen lassen. Der Vorteil liegt in der Einfachheit gegenüber der Paralleltestmethode und der Testwiederholung. Die Nachteile liegen in der Qualität der Reliabiliätsbestimmung, da die Halbierungstechniken hierbei besondere Beachtung finden müssen.

Die Reliabilität kann mathematisch anhand des Reliabilitätskoeffizienten (r) überprüft werden, der die Reliabilität eines diagnostischen Verfahrens ausgedrückt. Eine Korrelation definiert den Zusammenhang von zwei quantitativen Variablen (x und y). Die Berechnung des Korrelationskoeffizienten erfolgt über die Gleichung:

wobei:
= Variable x,
= Variable y,
= Anzahl der Personen und
= Summationsindex der Personen.

Der Reliabilitätskoeffizient kann zwischen minus eins und plus eins liegen. Ein Reliabilitätskoeffizient von r = 0 bedeutet, dass ein diagnostisches Verfahren überhaupt keine Messgenauigkeit besitzt; die Antworten der Probanden sind in einer Reliabilitätsüberprüfung völlig unterschiedlich. Bei einem Reliabilitätskoeffizienten von r = -1 handelt es sich nicht nur um völlig unterschiedliche, sondern um gegenteilige Antworten. Bei einem Reliabilitätskoeffizienten von r = 1 handelt es sich um ein in höchstem Maße messgenaues diagnostisches Verfahren, bei welchem die Antworten der Probanden in einer Reliabilitätsüberprüfung exakt den Vergleichsantworten gleichen.
„Bei Intelligenztests wird man aus der Erfahrung heraus eine Reliabilität von 0,8 bis 0,95 (maximal) erwarten. Persönlichkeitstests werden wesentlich niedrigere Reliabilitätskoeffizienten aufweisen, sie liegen meist in der Größenordnung von 0,6 bis 0,7“ (Wottawa, 1993, 77).