Operante Konditionierung nach Thorndike

Thorndike

E. L. Thorndike war fasziniert von der Darwin'schen Evolutionstheorie, die erklärt, auf welche Weise sich Lebewesen im Verlauf von Millionen Jahren den sich ständig verändernden Bedingungen angepasst haben.
Thorndike promovierte (1898) über die Intelligenz von Tieren. In seinen Experimenten, die etwa zur selben Zeit stattfanden wie die eines russischen Physiologen namens I. P. Pawlow,  versuchte er einen Zusammenhang zwischen Lernen und der Darwin'schen Theorie zu finden. Demnach würden Tiere (es ging zunächst nur um Tiere) sich im Laufe der Zeit durch Lernen an ihre Umwelt anpassen, um besser mit - und in ihr - zu agieren.

Thorndike gehört nach Meinung von Mietzel (2001, 125) zu den ersten Psychologen, die versuchten, Lernen auf experimentellem Wege zu erforschen. 1898 begann Edward Thorndike mit Katzen zu experimentieren. Er versuchte herauszufinden, wie sich Verhaltenskonsequenzen (also das Resultat auf eine Verhaltensweise) auf das Verhalten selbst auswirken:

 Trial-and-Error (Lernen durch Versuch und Irrtum)

Bildquelle: Mietzel (1998, 175)


Bildquelle: Website Jungwirth & Kaimberger (1998)

Thorndike konstruierte den sogenannten 'Problemkasten', ein Gefängnis für Katzen. In diesem Problemkasten befanden sich einige Hebel. Einer dieser Hebel öffnete durch einen intelligenten Mechanismus die Tür. Es wurde dem Tier ermöglicht, durch das Betätigen dieses Hebels aus dem Gefängnis zu entkommen und an das Futter zu gelangen, welches Thorndike bei seinen Versuchen vor den Käfig stellte, um der Katze einen Anreiz zu bieten, aus dem Gefängnis zu entkommen. 

Sobald Thorndike eine Katze in den Käfig setzte, beschwerte sich das Tier über den Freiheitsentzug durch Kreischen, Kratzen und Beißen. Wahllos versuchte die Katze sich aus dem Käfig zu befreien, wobei das Futter anscheinend nur eine untergeordnete Rolle spielte - es schien als wäre es dem Tier wichtiger, sich aus der Gefangenschaft zu befreien. 
Nach einiger Zeit betätigte das Tier zufällig den richtigen Hebel und gelangte in die Freiheit. Bei jedem weiteren Versuch gelang es der Katze immer schneller, den richtigen Hebel zu betätigen und in Freiheit bzw. zu dem Futter zu gelangen. Nach einigen Wiederholungen betätigte das Tier den Hebel sofort, nachdem sie in den Käfig gesperrt wurde. Durch das Futter wurde die Handlung (eigene Befreiung) verstärkt. 


"Wenn man sie in den Käfig steckt, zeigt die Katze offensichtliche Anzeichen des Unbehagens und entwickelt einen Impuls, der Gefangenschaft zu entfliehen. Sie versucht, sich durch jede Öffnung zu zwängen; sie krallt und beißt sich an den Gitterstäben oder Drähten fest; sie schlägt ihr Pfoten durch jede Öffnung hinaus und krallt sich an alles, was sie erreichen kann ... Sie schenkt dem Futter außerhalb des Käfigs kaum Beachtung (der Belohnung für die hungrige Katze), sondern scheint einfach instinktiv danach zu streben, der Gefangenschaft zu entkommen. Die Vitalität, mit der sie kämpft, ist außerordentlich. Zehn Minuten lang hört sie nicht auf, zu krallen, zu beißen, sich hinauszuzwängen ... Sei es, dass der Impuls zu kämpfen aus einer instinktiven Reaktion auf das Gefangensein herrührt oder von einer Assoziation, er wird wahrscheinlich dazu führen, dass die Katze dem Käfig entkommt. Die Katze, die in ihren impulsiven Anstrengungen alles ankrallt, was im Käfig ist, hat irgendwann der Draht oder den Knopf in ihren Krallen, der die Tür öffnet. Und allmählich werden all die anderen erfolglosen Versuche ausgelöscht und der besondere Impuls, der zu der erfolgreichen Ausführung führte, wird durch die erreichte Befriedigung eingeprägt, bis nach vielen Durchgängen die Katze, wenn sie erneut in den Käfig gesteckt wird, sofort den Knopf oder Draht auf unzweideutige Weise betätigt." E. Thorndike, 1898, S. 13 zitiert nach Zimbardo (1992, 240)

Lernen findet statt, indem erfolglose Verhaltensweisen, die nicht zu einer erwünschten Konsequenz führen, seltener oder gar nicht mehr gezeigt werden und solche Verhaltensweisen, die zu einer gewünschten Konsequenz führen, häufiger auftreten. 
Ob ein emittiertes Verhalten in Zukunft häufiger gezeigt wird, hängt von den Konsequenzen - der Reaktionen bzw. dem Ergebnis auf dieses Verhalten ab. Verhaltensweisen ergeben zufällig eine gewünschte oder erfolglose Konsequenz, d.h. sie entstehen nicht durch Denken, sondern durch Ausprobieren.

Verhalten orientiert sich an den damit erreichten Effekten.

"Verhaltensweisen oder Reaktionen, die bestimmte Folgen haben, dienen also als Mittel oder Instrument, den Organismus in der Wiederholung eben dieses Verhaltens zu bestärken oder zu entmutigen." Davison & Neale (1998, 48)

Positive Konsequenzen auf ein Verhalten bezeichnete Thorndike als Satisfier und negative Konsequenzen auf ein Verhalten als Annoyer. Für Thorndike ist Aktivität ein Mittel zur Erreichung einer bestimmten Konsequenz. Es ist notwendig, Verhaltensweisen zu emittieren (Versuche zu unternehmen), um zu einer Lösung zu gelangen bzw. nicht hilfreiche Versuche zu unterlassen.

Fällt Ihnen eine Verhaltensweise ein, die Sie selbst aufgrund der Thorndike'schen Theorie erlernt haben?

  Denkanstöße / Praxisbeispiele
Hat man Ihnen erklärt, in welche Richtung man eine Schraube drehen muss - oder haben Sie es ausprobiert und die richtige 'Drehart' erlernt?
Mit einer Behinderung am Bein oder Fuß sind Sie auf Gehhilfen angewiesen. Den für Sie günstigsten Umgang mit diesen temporären Ersatzbeinen haben Sie vielleicht auch durch Ausprobieren erlernt.
Viele bringen sich Fähigkeiten im Umgang mit Computersoftware selbst bei. Einiges mag selbsterklärend sein - verschiedene Funktionen erkunden wir jedoch, indem wir sie ausprobieren und dieselben Funktionen wieder anwenden, wenn sie sich schon einmal bei derselben Problemstellung als hilfreich erwiesen.

 

 

Zitate zum Lernen durch Versuch-und-Irrtum nach Thorndike:
"Thorndike glaubte, dass Reaktionen, denen eine Belohnung unmittelbar folgt, "Befriedigung" erbrachten. Als Resultat dessen würden sie verstärkt oder "eingeprägt", nicht belohnte Reaktionen hingegen würden geschwächt oder "gelöscht"." Zimbardo (1992, 240)

"Thorndike beschrieb seine Befunde folgendermaßen: "Die Ergebnisse aller unter allen Bedingungen zustande gekommenen Vergleiche besagen ausnahmslos, daß eine belohnte Verbindung immer beträchtlich verstärkt wird, daß dagegen bei Bestrafung nur eine geringe oder überhaupt keine Schwächung eintritt" (1932 b, Seite 58)." Hilgard & Bower (1973, 42)

"Für Thorndike bestand Lernen in der Bindung von Reiz-Reaktions-Verbindungen als Funktion ihrer Wiederholung oder der Konsequenzen der Reaktionen. Er bezeichnete den Prozeß des Lernens als "Einstanzen" ("stamping-in"), Vergessen kommt durch "Ausstanzen" ("stamping-out") zustande." Lefrancois (1994, 211)

"Für ihn besteht Lernen in der Vermehrung von physiologischen Verbindungen zwischen Reizen und Reaktionen. Diese Verbindungen werden durch Übung und wegen der angenehmen Konsequenzen eingestanzt - oder umgekehrt, durch Nichtgebrauch und wegen der unangenehmen Konsequenzen geschwächt oder ausgestanzt." Lefrancois (1994, 27)

"Da Thorndike den Lernvorgang als mechanistisch ansah, spielen in seiner Theorie Bewusstseinsinhalte keine Rolle. Trotzdem glaubte er an den Einfluss der Einstellung des Organismus zum Lernprozess als wichtigen motivierenden Faktor." Angermeier (1978, 12)

"In allen Fällen waren Thorndikes Experimente so arrangiert, daß die Folgen vom Verhalten der Vp abhängen. Diese Art des Lernens war immer "instrumentell" in dem Sinne, daß sich dadurch die Umweltbedingungen für die Vp änderten, und deshalb spricht man manchmal von "instrumentellem" Konditionieren." Krech & Crutchfield (1992, Band 2, S. 31)

 

Merkmale der operanten Konditionierung nach Thorndike

Gesetz der Bereitschaft (engl.: 'law of readiness')
Die Bereitschaft zum Lernen muss vorhanden sein. Diese Bereitschaft ist ein Bedürfnis, welches befriedigt werden soll. Lernen ist nach Thorndike nur möglich, wenn ein Individuum einen angenehmen Zustand herstellen oder eine unangenehmen Zustand vermeiden will. 
"Es gibt nach Thorndike drei derartige Umstände (1913 a, Seite 128):
1. Wenn eine verknüpfungsfähige Einheit zum Vollzug der Verknüpfung bereit ist, so wirkt diese Verknüpfung lustbetont, sofern der Ablauf dieses Vorganges nicht beeinträchtigt wird.
2. Wenn eine zur Verknüpfung bereitete Einheit die Verknüpfung nicht vollzieht, dann wirkt dies unlustbetont und ruft die jeweilige von der Natur für diesen besonderen Mangelzustand vorgesehene Reaktion hervor.
3. Wenn eine nicht zur Verknüpfung bereitete Einheit zum Vollzug der Verknüpfung gezwungen wird, so wirkt dies unlustbetont." Hilgard & Bower (1973, 33)

Beispiel Gesetz der Bereitschaft:
Die Katzen lernten in diesem Versuch nur sich zu befreien, wenn sie entweder hungrig waren oder aus der unangenehmen Enge des Käfig entkommen wollten um wieder frei zu sein. Hätte es den Tieren im Käfig (aus welchen Gründen auch immer) gut gefallen, und die Katzen hätten nicht das Bedürfnis verspürt, aus dem Käfig zu kommen, wäre ein Lernprozess ausgeblieben. 


Gesetz der Übung (engl.: 'law of exercise')
Die Verhaltensweise muss wiederholt werden, um sie dauerhaft zu erlernen. In Thorndikes Versuch mit dem Problemkäfig wird die Katze bei jedem Mal schneller, sie benötigt in jedem weiteren Durchgang weniger Zeit, um sich zu befreien. Der Katze ist es jedoch nicht möglich, nach ein oder zwei Durchgängen sofort den Hebel zu betätigen. Es erfordert wiederholte Ein-Übung des Erfolg bringenden Verhaltens.

"Das Gesetz der Übung betrifft einerseits Verstärkung von Verknüpfungen durch Übung (Gesetz des Gebrauchs: law of use), andererseits deren Schwächung, also das Vergessen, wenn die Übung nicht fortgeführt wird (Gesetz des Nichtgebrauchs: law of disuse)." Hilgard & Bower (1973, 34)


Gesetz der Auswirkung (engl.: 'law of effect')
Das Gesetz der Auswirkung besagt, dass Lernen als Resultat einer Verhaltenskonsequenz auftritt: Führt eine Verhaltensweise (z.B. Händewaschen vor einer Mahlzeit) zu einer positiven Konsequenz (z.B. Lob durch die Eltern), so wird die Verhaltensweise häufiger wiederholt. Führt die Verhaltensweise jedoch nur zu einer negativen Konsequenz (z.B. vom Freund ausgelacht werden), so wird die Verhaltensweise als unbefriedigend erlebt und seltener oder gar nicht mehr wiederholt.
Die durch die Verhaltenskonsequenz entstehende Motivation steht im Vordergrund. 

Thorndike unterstellte, dass es für die Katze eine positive Konsequenz bedeutete, aus dem Käfig zu entkommen. Um diese positive Konsequenz wiederzuerlangen, wenn sie in den Käfig gesetzt wurde, versuchte das Tier, das erfolgversprechende Verhalten zu wiederholen. 

Die Häufigkeit des gezeigten Verhaltens hängt demnach von den Konsequenzen ab, die nach dem jeweiligen Verhalten eintreten. Jeder Organismus ist bestrebt, seine Verhaltensweisen so anzulegen bzw. zu erlernen, dass dieses Verhalten mit einer positiven Konsequenz belohnt oder eine negative Konsequenz vermieden wird.
Fehlschläge werden eliminiert, und das Verhalten wird danach ausgerichtet, die gewünschte Befriedigung zu erlangen: "Aus einer großen Gesamtmenge möglicher Verhaltensweisen werden einige bestimmte als Folge von Ereignissen in der Umwelt ausgewählt.

"Wenn eine modifizierbare Verknüpfung entsteht und dies von einem lustbetonten Zustand begleitet oder gefolgt wird, dann erhöht sich die Stärke der Verknüpfung. Wenn das Zustandekommen der Verknüpfung dagegen zu einem unlustbetonten Zustand führt, so ergibt sich eine Schwächung." Hilgard & Bower (1973, 35)

Beispiel Gesetz der Auswirkung:
Ein Schüler möchte von seinen Eltern mehr Taschengeld bekommen. Er probierte verschiedene Möglichkeiten aus, um dieses Ziel zu erreichen:
Eine Diskussion über 'gestiegene Kosten für Teenager', das Versprechen mehr im Haushalt zu helfen, etc.
Die Eltern waren aber erst bereit, das Taschengeld des Jungen zu erhöhen, als er deutlich bessere Schulnoten mit nach Hause brachte. Die Bedürfnisse des Schülers werden also befriedigt, wenn dieser gute Leistungen in der Schule erbringt. Er wird bestrebt sein, dieses Verhalten (ein guter Schüler zu sein) weiterhin zu zeigen, um durch die Konsequenz des Verhaltens seine Bedürfnisse zu befriedigen.