Operante Konditionierung – Noch bevor es die Wissenschaft zu ihrer Aufgabe ansah wurde bereits das Verhalten von Tieren studiert. Früh in der Steinzeit half es den Bewohnern um zu überleben. Heut zu Tage ist es nicht mehr ganz so drastisch, allerdings hilft es uns, unsere Lieblinge besser zu verstehen. Aus diesem Grund entstand eine Lernmethode für Hunde, die als operante Konditionierung bekannt geworden ist. Was es damit auf sich hat, erkläre ich dir in diesem Artikel.
Operante Konditionierung – Die frühen Studien von Thorndike
Der Psychologe Edward Lee Thorndike (1874-1949) stellte er bei seinen Verhaltensstudien an Tieren fest, dass manche Tiere auf bestimmte Aktionen auf immer gleiche Art und Weise reagieren. Dazu sperrte er hungrige Katzen in einen Käfig ein, doch dieser ließ sich durch eine einfache Methode wieder öffnen.
Die völlig verängstigten und hungrigen Katzen versuchten nun, aus dem Käfig wieder heraus zu kommen und nutzen dazu verschiedene Methoden, bis sie durch Zufalle die leichte Verschlussart öffneten. Er wiederholte dieses Experiment erneut und stellte fest, dass die Katzen sich nun deutlich schneller befreien konnten. In weiteren Versuchen verringerte sich die Zeit bis zur Befreiung erneut. Die Katzen haben anscheinend verstand und dazu gelernt, dass sie sich durch bestimmte Verhaltensweisen schneller befreien können. Zusätzlich wurden die bisherigen Fehlversuche scheinbar vollkommen aus dem Gedächtnis gestrichen und nur die erfolgsversprechende Variante blieb im Gedächtnis.
Die Theorie von Thorndike besagt, dass man durch die konsequenten Verhaltensmuster dazu lernen kann und soll deutlich effektiver sein, als die bloße Reiz-Koppelung durch das Experiment von Pawlow.
Das Learning aus den Thorndike-Experimenten
Man muss bedenken, dass diese Studien bzw. die Veröffentlichung seines Studiums zur Operanten Konditionierung bereits 1898 entstanden sind, sodass man diese Lernmethode nach Thorndike als fraglich, aber grundlegend einstufen könnte. Die Katzen aus seinem Experiment können auch durch bloßes Versuchen ans Ziel gekommen sein und nicht durch rationale Verknüpfung logischer Schritte. Die Katzen führten dabei wahllos verschiedene Aktionen aus, wobei viele Aktionen recht sinnlos und aussichtslos waren, bis die eine wahre Lösung zufällig dazwischen kam. Dadurch wurde lediglich die letzte Verhaltensweise bestärkt. Für eine effektive Nutzung aus heutiger Sicht gelten die Experimente von Thorndike als Grundlage für die operante Konditionierung durch weitere Versuche, aber nicht als zielführend.
Experimente durch Skinner
Dies erkannte auch der Psychologe Burrhus Frederic Skinner (1904-1990) und nahm die Gedanken von Thorndike auf um weiter zu forschen. Sein Ziel war es, herauszufinden, wie man das Verhalten für seine eigenen Zwecke manipulieren, kontrollieren und nutzen kann. Er entwickelte das Verfahren, die er die „operante Konditionierung“ nannte. Dazu manipulierte er das Verhalten bzw. die Konsequenzen, um die anschließende Reaktionen beobachten zu können. Seine Resultate und sein Vorgehen werde ich dir nun näher vorstellen. Die angewandten Versuche gelten den Hunden, weshalb es für uns Hundebesitzer äußerst interessant sein wird.
Die kontingente Verstärkung
Unter kontingenter Verstärkung versteht man für die operante Konditionierung ein bestimmtes Verhalten eines Hundes, welches im direkten Zusammenhang zwischen einer Verhaltensweise und einer Veränderung besteht. Hat sich dieses Verhalten des Hundes positiv verändert, kann hier von kontingenter Verstärkung gesprochen werden. Um es zu verdeutlichen, was darunter zu verstehen ist, habe ich dir folgendes Beispiel ausfgeführt:
Bringst du deinen Hund dazu sich zu setzen und gibst ihm dafür als Belohnung ein Leckerli, verstärkst du den Willen des Hundes, die richtige Aktion erneut durchzuführen um an die Belohnung zu kommen. Wenn er nun erneut beim „Sitz“ sich erfolgreich hinsetzt und bekommt dafür erneut ein Leckerli, hast du sein Verhalten kontingent verstärkt. Dazu ist es wichtig, dass keine anderen Aktionen des Hundes dazwischen kommt, wie beispielsweise direktes Wiederaufstehen oder Kopf wegdrehen, da die Verstärkung sonst nicht verstanden wird. Es ist wichtig, die genaue Konzentration in dem richtigen Zeitpunkt zu erwischen, damit die kontingente Verstärkung vom Hund verstanden wird.
Die kontingente Verstärkung gilt heutzutage als Grundlage für ein gezieltes Hundetraining, das bedeutet, dass bestimmte Verhaltensweisen eine bestimmte Konsequenz mit sich zieht und das Verhalten des Hunden dementsprechend zuverlässiger wird.
Verstärkung oder Bestrafung
Bei dieser Lernmethode geht es in der operanten Konditionierung darum, bestimmte Verhaltensweisen nach einer Aktion zu erhöhen oder zu verringern. Hierbei erhöht die Verstärkung die Wahrscheinlichkeit, dass eine bestimmte Aktion des Hundes und dadurch sein Verhalten resultiert. Die Bestrafung des Hundes verringert die Wahrscheinlichkeit hingegen.
Es ist zu unterscheiden zwischen der positiven und negativen Verstärkung bzw. Bestrafung. Allerdings ist mit „positiv“ und „negativ“ keine Bewertung gemeint, sondern sind eher als Addition bzw. Subtraktion, ähnlich wie in der Mathematik, zu verstehen. Dies bedeutet, dass bei „positiv“ etwas hinzugefügt wird, wohingegen bei „negativ“ etwas weg genommen wird.
Im Folgenden gehen wir alle Varianten einmal durch, dass macht es noch etwas deutlicher.
Positive Verstärkung
Die positive Verstärkung dient dazu, ein richtiges Verhalten des Hundes zu belohnen. Setzt sich dein Hund bei dem Kommando „Sitz“, erhält er dafür eine Belohnung. Dies kann ein Leckerli, aber auch intensives Streicheln oder Zuwendung, aber auch plötzliches Spielen mit seinem Lieblingsspielzeug sein. Dadurch wird die Auftrittswahrscheinlichkeit seines vorab erzielten Verhaltens erhöht. Der Hundebesitzer hat dem Hund also etwas gegeben (addiert) und sein Verhalten zu bestärken. Dies ist die vermutlich bekannteste Methode in der Operante Konditionierung.
Negative Verstärkung
Im Gegensatz zur positiven Verstärkung verhält es sich bei der negativen Verstärkung ganz anders. Der Hund wird für sein Verhalten nicht belohnt, sondern hier wird dem Hund etwas Unangenehmes entfernt, wodurch seine Verhaltensweise häufiger auftritt. Klingelt es an der Haustür und der Hund beginnt das lautstarke Bellen (vor Freude), sollte der Hund in einen anderen Raum gebracht werden. Hat der Hund sich wieder beruhigt und bellt nicht mehr, darf den Besuch willkommen heißen, wodurch er lernt, dass seine Ruhe die richtige Aktion war. Es wird dadurch sein Verhalten (= in Zukunft ruhig zu sein) verstärkt.
Positive Bestrafung
Bei der positiven Bestrafung wird ein aversiver Reiz ergänzt, um die Anzahl und die Wahrscheinlichkeit eines Verhaltens zu verringern. Zu diesem Zweck werden häufig spezielle Halsbänder verwendet, die einen elektrischen Impuls an den Hund übertragen, sobald er sich zum Beispiel über eine bestimmte Grundstücksgrenze hinweg bewegt. Es soll dem Hund zeigen, dass er eine falsche Handlung getan hat und ihn ermutigen, dies in Zukunft nicht mehr zu machen. Im Laufe der Zeit wird der Hund sein Verhalten ändern und die negative Aktion gänzlich abstellen. Es wurde also ein Reiz hinzugefügt, um den Hund etwas abzutrainieren.
Negative Bestrafung
Auf der anderen Seite existiert die negative Bestrafung. Hier wird dem Hund etwas reduziert, bzw. weggenommen. Dadurch soll sich sein Verhalten ändern und die Wahrscheinlichkeit, dass die negative Aktion erneut auftritt, reduziert werden. Ein Beispiel hierfür ist das Betteln am Tisch. Sitzt dein Hund neben dir am Esstisch und bellt dich an, damit er etwas von deinem leckeren Essen bekommt und du ihn einfach ignorierst, nimmst du ihm etwas Angenehmes weg. Hier handelt es sich um die zu erlangende Aufmerksamkeit des Hundebesitzers, woraufhin er nach einiger Zeit das Bellen und Betteln einstellen wird.
Man kann dies in folgendes Schema vereinfacht darstellen:
Negativ (Wegnahme einer Konsequenz) | Positiv (Zugabe einer Konsequenz) | |
Verstärkung | Verhalten tritt häufiger auf | Verhalten tritt häufiger auf |
Bestrafung | Verhalten tritt seltener auf | Verhalten tritt seltener auf |
Operante Löschung
Ist es möglich, schlechte Angewohnheiten beim Hund vollkommen zu löschen? Wie in der klassischen Konditionierung können auch bestimmte Verhalten tatsächlich beim Hund wieder entfernt werden. Dadurch kann man den Zustand wieder hervorrufen, der vor der Konditionierung existierte. Dies ist häufig zu beobachten bei mittlerweile als selbstverständlich geltenden Aktionen des Hundes. Bei Beginn ist es noch wunderbar, wenn der Hund zum Herrchen auf Zuruf zurückkommt, doch in der Zwischenzeit ist es einfach nur „Standard“ geworden. Lobt man den Hund nicht mehr für seine gute Handlung, wird er dies in Zukunft vielleicht wieder reduzieren und seltener auf Zuruf zu seinem Herrchen zurückkommen. Ignoriere also niemals eine gute Tat deines Hundes. Hundetraining ist ein permanenter Prozess und keine abgeschlossene Handlung.
Diskriminativer Reiz
Bei dem diskriminativen Reiz handelt es sich um einen Reiz, der eine bestimmte Reaktion beim Hund auslöst. Hast du dich schon einmal gefragt, warum dein Hund auch bei anderen Person auf „Sitz“ hört (wenn er es denn tut). Dies ist darin begründet, dass der Hund bei bestimmten Signalen von dir konditioniert bekommen hat, darauf zu reagieren. Hat er anfangs für ein „Sitz“ ein Leckerli als Belohnung erhalten, hat er sich das gemerkt. Die Folge davon ist, dass er verstanden hat, dass dieses Schlüsselwort „Sitz“ einen bestimmten Impuls in ihm ausgelöst hat, beispielsweise Freude auf das Leckerli. Weil der Hund ist verstanden hat, ist dieser diskriminativer Reiz entstanden, der auch bei anderen Personen funktioniert, auch wenn die Stimme nicht gleich ist mit deiner Stimme. Hauptsache das Leckerli wird für den Hund überreicht. Auch wenn du den Hund lange nicht mehr mit einem Leckerli belohnt hast, hat es sich in sein Bewusstsein hineingesetzt, dass es eine positive Erfahrung für den Hund war und auch heute noch ist.
Primärer und sekundärer Verstärker
Unter primäre und sekundäre Verstärker handelt es sich um alle Verstärker, die die Grundbedürfnisse deines Hundes befriedigen, wie zum Beispiel Essen, Trinken oder Schlafen. Um den Hunger zu stillen, will dein Hund sein Futter fressen. Aus diesem Grund gelten Leckerli als besonders wertvoll und sind dadurch zu einem primären Verstärker mutiert. Als sekundärer Verstärker gelten nun alle Verstärker, die dem Hund signalisieren, dass ein primärer Verstärker als Belohnung kommen wird (in diesem Beispiel das Leckerli). Dazu ist es wichtig, dass der sekundäre Verstärker, der auch deshalb als konditionierter Verstärker bekannt ist, dem Hund bekannt gemacht wird. Gerade bei dem Clickertraining hat der Hund verstanden, dass der sekundäre Verstärker (Klicker) den primären Verstärker (Leckerli) ankündigt. Dadurch wird das Verhalten des Hundes mit einem Klicker verstärkt und auf einen Klick sollte immer eine Belohnung folgen, da sonst der Effekt des Klicks einfach verpufft und nicht als sekundärer Verstärker konditioniert wird.
Verstärkerpläne
„Quotenpläne“ und „Intervallpläne“ bilden zusammen die Verstärkerpläne. Durch einen Quotenplan kann man nach einer bestimmten Anzahl von Verhaltensweisen diese verstärken, wohingegen bei einem Intervallplan diese Verhaltensweisen nur nach einer bestimmten Zeit verstärkt wird. Damit ein Hund nun etwas neu gelerntes besser versteht, wird es vom Hund besonders gut gelernt. Dies kann daran liegen, dass es neu und aufregend ist und der Hund seine besondere Konzentration darauf ausrichtet. Hier ist es wichtig, dass man nun dieses Training kontinuierlich fortführt, damit eine Automatisierung bzw. eine Verstärkung eintritt. Bleiben wir bei dem Beispiel mit „Sitz“. Beginnst du dein Training mit dem Hund und versuchst ihm „Sitz“ beizubringen, solltest du ihn bei jedem Hinsetzen direkt belohnen. Der Hund muss den Zusammenhang verstehen und weiß, wenn ich mich nun hinsetze nach „Sitz“, bekomme ich dafür eine Belohnung (positiven Verstärker). Möchtest du nun, dass dein Hund sitzen bleibt und erst wieder aufsteht, dann musst du die Zeitspanne für die Belohnung verlängern. Damit diese Umsetzung funktioniert, werden diese Verstärkerpläne verwendet.
Partielle Verstärkung
Nun hat dein Hund verstanden, was er bei „Sitz“ machen soll. Jetzt ist die Zeit gekommen, dass du deinen Hund nicht jedes mal beim Hinsetzen ein Leckerli übergibst, sondern dies nur ab und zu machst. Die bereits gelernten Verhaltensweisen werden durch bestimmte Impulse partiell verstärkt und gelten als intensiv löschungsresistent. Aus diesem Grund kannst du ihm beibringen, dass er immer belohnt wird, wenn auch nicht ständig mit einem Leckerli.
Shaping für den Hund
Bekannt ist „Shaping“ aus dem Fitnessbereich, wo gerne Body-Shaping betrieben wird. Ähnlich verhält es sich auch beim Hundetraining und gerade bei der operanten Konditionierung beim Hund. Shaping bedeutet letztendlich nichts anders als Verhaltensformung. Der Körper des Sportlers existiert bereits und wird verformt. Beim Hund bedeutet das, dass er bereits verstandene Verhaltensmuster umgeformt bekommt. Schritt für Schritt wird sein Verhalten umgeformt oder auch durch ein neues Verhalten geformt. Hierbei werden anfangs kleine Schritte in eine spezielle Richtung verstärkt und nach einer gewissen Zeit nur noch die Verhaltensweisen verstärkt, die dem Ziel am nächsten liegen.
Ein Hund, der „Sitz“ lernen soll, wird anfangs sich nicht richtig hinsetzen und nur kurz in die Hocke gehen, um dann wieder aufzustehen. Er wird versuchen zu schauen, was der Besitzer nun macht. Bekomme ich das Leckerli oder nicht? Damit du als Hundebesitzer das Verhalten deines Hundes formen kannst, belohnst du nun die ersten Schritte, die in die richtige Richtung gehen. Hockt dein Hund sich kurz, kannst du dies nun verstärken. Nach und nach solltest du dann länger warten mit der Belohnung, da der Hund sich letztendlich richtig hinsetzen und auch kurze Zeit sitzen bleiben soll. Das Verhalten des Hundes wird Schritt für Schritt geformt, bis du das gewünschte Ziel erreicht hast.
Chaining
Dieser Begriff stammt auch aus dem Englischen. Eine „Chain“ bedeutet Kette, daher handelt es sich bei dieser Art der operanten Konditionierung um eine Verkettung von verschiedenen Verhaltensweisen. Am Ende dieser Kette winkt für den Hund dann wieder der primäre Verstärker als Belohnung. Du kannst auch bereits gelernte Verhaltensweisen als sekundäre Verstärker nutzen. Wichtig ist hierbei, dass eine Kette von Verhalten eingehalten wird für die operante Konditionierung.
Du beginnst mit der bestimmten Verhaltensweise, die primär verstärkt werden soll. Diese wird anschließend zu einem sekundären Verstärker, der wiederum durch einen neuen primären Verstärker folgt. Dadurch lassen sich komplexere Verhaltensverkettungen konditionieren. Es klingt komplex, ist es aber in der Praxis gar nicht. Ein Beispiel vielleicht? Gerne…
Nehmen wir mal das Apportieren eines Futterbeutels. Zu Beginn lernt dein Hund, den Futterbeutel über einen längeren Zeitraum im Maul zu halten. Dies erweiterst du, indem du deinen Hund den Futterbeutel neben dir tragen lässt. Anschließend bringst du deinem Hund bei, mit dem Futterbeutel zu dir zu kommen und sich hin zu setzen. Nun soll er dir den Futterbeutel in die offene Hand legen. Dein Hund bekommt aus dem Futterbeutel nun seinen primären Verstärker, nämlich das Leckerchen. Die zuvor ausgeführten Verhaltensweisen vom holen des Futterbeutels bis in die Hand legen sind sekundäre Verstärker, die sich zusammen zu einer Verhaltenskette zusammengeschlossen haben. Diese Kette lässt sich im Prinzip unendlich fortführen und mit anderen Ketten verknüpfen. Durch dieses Lernverfahren der operanten Konditionierung brauchst du deinem Hund nicht mehr jeden einzelnen Schritt beibringen, sondern nur noch die Kette an Verhaltensweisen.
Was bedeutet die operante Konditionierung für mich als Hundehalter?
Im Prinzip kann man die operante Konditionierung beim Hund für den Hundehalter mit der klassischen Konditionierung zusammenfassen. Allerdings sind beide Lerntheorien wiederum unterschiedlich und jeweils bestens geeignet, um einen Hund zu einem optimalen Begleiter zu erziehen. Für die Hundeerziehung ist es für den Hundehalter immens wichtig nachvollziehen zu können, wie ein Hund manche Situationen sieht und aus diesem Grund bestimmte Verhaltensweisen an den Tag legt. Wir müssen beginnen fast schon wie unser Hund zu denken. Diese Begrifflichkeiten der operanten Konditionierung sind sinnvolle Hilfsmittel, damit wir verstehen, wie wir unserem Hund auch komplexere Verhaltensweisen an- bzw. abtrainieren können.
Damit dies gezielt funktioniert, sollte man sich direkt am Anfang die Frage stellen, welches Zielverhalten mein Hund im Hundetraining erreichen soll. Dementsprechend sind die jeweiligen Schritte für die ersten Übungen zu wählen. Grundsätzlich und egal welches Mittel man hier verwendet, sollte die Umgebung bei den Übungen für den Hund ablenkungsfrei sein, damit er die jeweiligen Schritte konzentriert versteht und nachvollziehen kann. Eine ruhige Atmosphäre sorgt für dich und deinen Hund für ein erfolgreicheres Lernen neuer Dinge. Zu viele Störfaktoren können den Erfolg immens beeinträchtigen und gegebenenfalls länger werden lassen.
Die neue Verhaltensweise muss deinem Hund später natürlich auch bei größerer Ablenkung gelingen und dafür auch unter extremeren Bedingungen antrainiert bzw. konditioniert werden. Bringe es deinem Hund also in einer ruhigen Atmosphäre bei und verlagere, nachdem er es verstanden hat, in eine unruhigere Situation und Örtlichkeit, Hunde benötigen zum Nachvollziehen mancher Übungen in einer stressigeren Situation einen gewissen Kontext. Das bedeutet, dass sie im Prinzip immer und überall lernen, ähnlich wie bei uns Menschen. Machst du die „Sitz“-Übungen nur in der Wohnung und es funktioniert wunderbar, kann es beim nächsten Gassigang draußen vergessen sein. Deinem Hund fehlt der Kontext. Also trainiere das Sitz beim Gassi gehen und dein Hund wird sich an den Befehl aus der Wohnung früher oder später erinnern und sich hinsetzen.
Sei bitte nicht enttäuscht von deinem Hund, wenn du das erste mal draußen merkst, dass „Sitz“ nicht funktioniert. Es ist nicht alles vergessen, du musst es ihm nur noch beibringen, dass das auch für draußen gilt.
Fazit
Die operante Konditionierung ist ein wichtiges und wissenschaftliches fundiertes Hilfsmittel bei der Hundeerziehung. Es hilft dem Hundebesitzer auf bestimmte Verhaltensweisen seines Hundes ideal reagieren zu können. Möchte ich etwas abtrainiern oder möchte ich ihm etwas neues beibringen? Hier unterscheidet sich grundsätzlich eine Herangehensweise an die Hundeübung und mit dem nun erworbenen Wissen der operanten Konditionierung versteht man nun leichter, wie man an das Ziel der Verhaltensweise des Hundes gelangt.
Leider ist so eine Methode wie die Operante Konditionierung nicht einfach darzustellen, doch ich habe versucht, alles anhand von Praxisbeispielen zu verdeutlichen. Beim Lernen des Hundes werden im Gehirn neuronale Strukturen verändert. Neue Strukturen kommen hinzu, andere werden wiederum ausgeschlossen. So ein komplexes Thema einmal verstanden zu haben, ist ein großer Gewinn für jeden Hundebesitzer und erleichtert das tägliche Training und den Umgang mit deinem Hund.
Am Schluss möchte ich allerdings noch darauf hinweisen, dass man nicht jedes Verhalten des Hundes mit der operanten Konditionierung erklären kann. Es beschreibt viele Eigenschaften und erklärt einige Verhaltensweisen. Aber das schöne daran ist doch, dass uns unser Hund jedes mal aufs neues wieder überraschen kann, auch nach längerer Zeit.
Ein Gedanke zu „Operante Konditionierung beim Hund“