Instrumentelle und operante Konditionierung

Die operante Konditionierung ist eine Form des Lernens. Bei ihr verändert ein Individuum sein Verhalten aufgrund der Konsequenzen (Ergebnisse) des Verhaltens.

Der Mensch oder das Tier lernt, dass sein Verhalten eine Konsequenz hat. Diese Konsequenz kann sein

Verstärkung: ein positives oder lohnendes Ereignis. Dies führt dazu, dass das Verhalten häufiger auftritt
Bestrafung: ein negatives oder bestrafendes Ereignis. Dadurch tritt das Verhalten weniger häufig auf
Aussterben: es folgt kein Ereignis, so dass das Verhalten keine Konsequenzen hat. Wenn ein Verhalten keine Folgen hat, wird es seltener vorkommen.

Bei der operanten Konditionierung gibt es vier verschiedene Kontexte. Hier werden die Begriffe "positiv" und "negativ" nicht in ihrer Grundbedeutung verwendet; positiv bedeutet, dass etwas hinzugefügt wird, und negativ bedeutet, dass etwas weggenommen wird:

Positive Verstärkung (oft nur "Verstärkung") tritt auf, wenn es eine Belohnung für eine Verhaltensweise gibt. Dadurch wird die Häufigkeit, mit der das Verhalten auftritt, erhöht. Im Skinner-Box-Experiment besteht die Belohnung in Form von Futter, wenn die Ratte einen Hebel betätigt.
Negative Verstärkung (manchmal "Flucht") tritt auf, wenn ein aversiver Stimulus entfernt wird. Dadurch wird die Frequenz, mit der das Verhalten auftritt, erhöht. Im Skinner-Box-Experiment gab es ein lautes Geräusch, das entfernt wurde, wenn die Ratte den Hebel drückte.
Eine positive Bestrafung tritt ein, wenn ein Stimulus hinzugefügt wird, was dazu führt, dass das Verhalten seltener auftritt. Beispielreize können lauter Lärm, ein elektrischer Schlag (Ratte) oder eine Tracht Prügel (Kind) sein.
Negative Bestrafung tritt auf, wenn ein Stimulus weggenommen wird, was dazu führt, dass das Verhalten seltener auftritt. Ein Beispiel könnte das Spielzeug eines Kindes sein, das weggenommen wird, nachdem das Kind ein unerwünschtes Verhalten gezeigt hat.

Die Idee der operanten Konditionierung wurde zuerst von Edward Thorndike entdeckt und von B.F. Skinner analysiert.

Die operante Konditionierung unterscheidet sich von Pavlovs klassischer Konditionierung. Die operante Konditionierung befasst sich mit der willentlichen Modifikation von Verhalten; die klassische Konditionierung mit der Schulung eines Reflexes.

Thorndike'sches Wirkungsgesetz

Die operante Konditionierung, manchmal auch instrumentales Lernen genannt, wurde zuerst von Edward L. Thorndike (1874-1949) studiert. Er beobachtete das Verhalten von Katzen, die versuchten, aus selbstgemachten Puzzleboxen zu entkommen. Als die Katzen zum ersten Mal in die Schachteln gesteckt wurden, brauchten sie lange, um zu entkommen. Mit zunehmender Erfahrung traten erfolgreiche Reaktionen häufiger auf, so dass die Katzen in kürzerer Zeit entkommen konnten. In seinem Wirkungsgesetz stellte Thorndike die Theorie auf, dass Verhaltensweisen, denen befriedigende Konsequenzen folgen, dazu neigen, sich zu wiederholen, und solche, die unangenehme Konsequenzen hervorrufen, weniger wahrscheinlich sind. Kurz gesagt, einige Konsequenzen verstärkten das Verhalten und einige Konsequenzen schwächten das Verhalten. Thorndike erstellte mit diesem Verfahren die ersten bekannten Lernkurven.

B.F. Skinner (1904-1990) erarbeitete eine detailliertere Analyse der operanten Konditionierung. Skinner erfand die operante Konditionierungskammer, die es ihm ermöglichte, die Reaktionsgeschwindigkeit als schlüsselabhängige Variable zu messen. Er verwendete eine Aufzeichnung von Hebelbetätigungen oder Tastenanschlägen.

Prinzipien der operanten Konditionierung:

Diskriminierung, Verallgemeinerung und die Bedeutung des Kontextes.

Lernen findet in Kontexten statt.
Das meiste Verhalten steht unter Reizkontrolle: eine bestimmte Reaktion tritt nur dann auf, wenn ein entsprechender Reiz vorhanden ist.
Die Stimuluskontrolle ist auch dann wirksam, wenn der Stimulus für den Probanden keine Bedeutung hat.

Extinktion: operantes Verhalten erfährt eine Extinktion, wenn die Verstärkung aufhört.

Die Verstärkungen erfolgen nur dann, wenn die richtige Reaktion erfolgt ist, und selbst dann darf sie nicht erfolgen. Das Verhalten wird dadurch nicht geschwächt und erlischt nicht.
Die Ergebnisse hängen zum Teil davon ab, wie oft Verstärkung erhalten wird.

Zeitpläne für die Verstärkung: Der Zeitpunkt der Verstärkungen ist entscheidend.

Zeitplan mit festen Intervallen: Verstärkungen werden zu festen Zeiträumen präsentiert, vorausgesetzt, es wird entsprechend reagiert.
Variabler Intervallplan: ein Verhalten wird auf der Grundlage einer durchschnittlichen Zeit verstärkt, die seit der letzten Verstärkung verstrichen ist. Verhältniszeitpläne: basieren auf dem Verhältnis von Reaktionen auf Verstärkungen.
Fester Intervallplan: Die Verstärkung wird nach einer bestimmten Anzahl von Antworten geliefert. Der Sonderfall, Verstärkung nach jeder Antwort zu geben, wird als kontinuierliche Verstärkung bezeichnet.
Variabler Intervallplan: Die Zustellungsverstärkung basiert auf einer bestimmten durchschnittlichen Anzahl von Antworten.

Fragen und Antworten

F: Was ist operante Konditionierung?

A: Operante Konditionierung ist eine Form des Lernens, bei der ein Individuum sein Verhalten aufgrund der Konsequenzen (Ergebnisse) des Verhaltens ändert.

F: Was sind die vier Kontexte der operanten Konditionierung?

A: Die vier Kontexte der operanten Konditionierung sind positive Verstärkung, negative Verstärkung, positive Bestrafung und negative Bestrafung.

F: Wie funktioniert die positive Verstärkung?

A: Positive Verstärkung liegt vor, wenn es eine Belohnung für ein bestimmtes Verhalten gibt, wodurch die Häufigkeit des Verhaltens erhöht wird.

F: Wie funktioniert die negative Verstärkung?

A: Negative Verstärkung tritt auf, wenn ein aversiver Reiz entfernt wird, wodurch die Häufigkeit des Verhaltens zunimmt.

F: Wie funktioniert die positive Bestrafung?

A: Positive Bestrafung liegt vor, wenn ein Anreiz hinzugefügt wird, der dazu führt, dass das Verhalten seltener auftritt.
F: Wie funktioniert die negative Bestrafung? A: Negative Bestrafung liegt vor, wenn ein Reiz weggenommen wird, was dazu führt, dass das Verhalten seltener vorkommt.

F: Wer hat die operante Konditionierung zuerst entdeckt?

A: Edward Thorndike entdeckte die operante Konditionierung als Erster und wurde später von B.F. Skinner analysiert.