Condicionament instrumental
© Joan Sansa i Aguilar
Tots els drets reservats
© d'aquesta edició, FUOC, 2020
Av. Tibidabo, 39-43, 08035 Barcelona
Realizació editorial: FUOC

Índex
- Introducció
- 1.Definició de condicionament instrumental
- 2.Preparacions experimentals: assajos discrets i conducta operant
- 2.1.Assajos discrets
- 2.2.Operant lliure
- 2.3.L'emmotllament
- 3.Procediments de condicionament instrumental
- 4.Elements del condicionament operant
- 5.Programes de reforçament
- 6.Extinció de la resposta instrumental
- 7.Condicionament aversiu
- 7.1.Evitació i escapada
- 7.2.Càstig
- 8.Teories del condicionament instrumental
- 9.Generalització i discriminació
- 10.Aprenentatge per observació
- Exercicis d'autoavaluació
- Glossari
- FAQ
- Bibliografia
Introducció
1.Definició de condicionament instrumental
1.1.La conducta emergent o voluntària. L'hedonisme com a mecanisme de la conducta voluntària
1.2.Comparació entre condicionament clàssic i instrumental
-
En el condicionament clàssic, els esdeveniments que queden associats són dos estímuls que l'organisme no pot manipular. Podem aprendre que un cel ennuvolat pot significar una probabilitat alta de pluja. En conseqüència, podem no sortir de casa o, en cas de sortir, agafar el paraigües. Aquestes conductes, però, en cap cas no alteraran la presentació dels estímuls.
-
En canvi, en el condicionament instrumental, els esdeveniment implicats són una conducta i un estímul de tal manera que la conducta alterarà aquest estímul, i el farà aparèixer si estava absent o el farà desaparèixer si estava present. Si es posa a ploure mentre anem pel carrer, obrir el paraigües impedirà que ens mullem.

2.Preparacions experimentals: assajos discrets i conducta operant
2.1.Assajos discrets

2.2.Operant lliure


2.3.L'emmotllament
3.Procediments de condicionament instrumental
-
En el primer cas, la persona s'ha trobat directament amb l'estímul aversiu (el gos) i la resposta ha provocat la desaparició de l'estímul. En altres paraules, la persona ha escapat de la situació aversiva. Aquest procediment rep el nom de procediment d'escapada.
-
En el segon cas, l'estímul aversiu (l'avaria del cotxe) no s'ha arribat a produir, és a dir, la conducta es fa sense que sigui present l'estímul aversiu i impedeix que aparegui. Es tracta d'un procediment d'evitació. És important destacar que en el cas de l'evitació, hi ha d'haver algun fet que anticipi la possibilitat de la situació aversiva.
Tipus de conseqüència |
|||
---|---|---|---|
Apetitiva |
Aversiva |
||
Correlació resposta-conseqüència |
Positiva |
Reforçament positiu |
Càstig positiu |
Negativa |
Càstig negatiu o entrenament d'omissió |
Reforçament negatiu: 1) Escapada 2) Evitació |
4.Elements del condicionament operant
4.1.L'estímul discriminant
4.2.La resposta instrumental

4.3.L'estímul reforçador
-
Hull (1943) definia un reforçador no per les característiques de l'estímul sinó per les seves propietats a l'hora de reduir un estat de necessitat. Per exemple, si un animal ha passat hores sense menjar, l'aliment serà un reforçador eficaç perquè permet reduir un estat de necessitat. En canvi, si l'animal està saciat, el menjar deixarà de ser un reforçador eficaç. Aquesta definició ens permet predir quan un estímul serà un bon reforçador.
-
D'una manera similar, Premack (1959) defineix un reforçador no en termes d'estímuls sinó d'activitat. Si observem a quines activitats es dedica lliurement un nen quan arriba a casa després de l'escola, probablement observarem que passa estones menjant, mirant la televisió, jugant a la play station, fent deures o llegint. Evidentment, cadascuna d'aquestes activitats variarà en freqüència d'aparició i no serà excessivament imprudent predir que dedicarà molt de temps a mirar la televisió i a jugar a la play station, i menys temps a fer deures o llegir un llibre.
4.4.La relació resposta-reforçador: contigüitat temporal i contingència
5.Programes de reforçament
5.1.Programes de reforçament continu
5.2.Programes de raó

5.3.Programes d'interval


5.4.Comparació dels programes de raó i d'interval
5.5.Conducta d'elecció: programa concurrent i programa concurrent encadenat
5.5.1.Programa concurrent
en què RA és la taxa de resposta a la tecla A i RB és la taxa de resposta a la tecla B.
en què rA és la taxa de reforçament a la tecla A i rB és la taxa de reforçament a la tecla B.
en què RA i RB són les taxes de resposta a les tecles A i B, i rA i rB les taxes de reforçament a les tecles A i B.
Jugador |
Dos punts |
Tres punts |
||||
---|---|---|---|---|---|---|
Encistellades |
Punts |
Llançaments |
Encistellades |
Punts |
Llançaments |
|
Rudy Fernández |
105 |
210 |
177 |
90 |
270 |
220 |
Demond Mallet |
37 |
74 |
82 |
88 |
264 |
207 |
Mallet: R3/(R3 + R2) = 207/(207 + 82) = 0,72
Mallet: r3/(r3 + r2) = 88/(88 + 37) = 0,70
Mallet: M3/(M3 + M2) = 264/(264 + 74) = 0,78
-
Els biaixos s'observen quan els subjectes tenen una preferència clara per una de les alternatives de resposta, per exemple, la palanca de la dreta. En aquests casos, la preferència per un dels mecanismes de resposta interfereix en els paràmetres de la recompensa i produeix un biaix respecte al que preveu la llei de la igualació.
-
La sobreigualació fa referència a una taxa de resposta superior per al millor dels dos programes amb relació al que prediu la fórmula de la igualació. Aquest error es produeix quan hi ha un cost addicional per a canviar d'una alternativa a l'altra. Per exemple, és comú que en un programa concurrent les primeres respostes després del canvi no siguin reforçades per a evitar que se'n reforci precisament l'alternança. Aquesta tècnica s'anomena temps fora i si és relativament llarg acostuma a produir la sobreigualació.
-
El tercer error que ha detectat Baum és la infraigualació i es refereix al fet que la taxa de resposta a l'alternativa millor és més baixa que la que cal esperar a partir de la llei de la igualació.
en què RA, RB, rA i rB són les respostes i les freqüències del reforçador en els programes A i B, respectivament; k és una constant que representa el biaix de resposta i s és un exponent que regula la sensibilitat del subjecte vers els dos programes.
5.5.2.Programa concurrent encadenat
-
Som a casa disposats a estudiar per a l'examen que tenim d'aquí a 15 dies quan els amics ens telefonen i ens conviden a anar a la discoteca. Què farem en aquesta situació? El més probable és que anem a la discoteca.
-
Volem deixar de fumar. Sabem que després d'un temps sense fumar trobarem unes millores importants amb relació a la salut, no farem pudor de fum, no haurem de sortir del lloc de treball cada dos per tres per a fer la cigarreta, etc. En canvi, després de sis hores sense encendre cap cigarreta ens comencem a notar nerviosos, no ens concentrem en el que fem, mengem més sovint i el nostre humor s'ha tornat agre. Sabem que si fem una cigarreta tots aquests símptomes desapareixeran. Què farem en aquesta situació? La resposta més probable serà encendre la cigarreta.
en què K és la taxa de descompte del valor.
6.Extinció de la resposta instrumental
Fase |
Adquisició |
Extinció |
---|---|---|
Procediment |
Resposta → Reforçador |
Resposta → Ø |
Exemple |
Pressió de palanca → menjar |
Pressió de palanca → no menjar |
6.1.Altres efectes de l'extinció sobre la resposta instrumental
7.Condicionament aversiu
7.1.Evitació i escapada

Reforçament negatiu |
||
---|---|---|
Escapada |
Evitació |
|
Contingència resposta-reforçador |
Negativa |
Negativa |
Conseqüència de la resposta |
Elimina un estímul aversiu |
Impedeix un estímul aversiu |
Resultat sobre la conducta |
Es manté la conducta |
Es manté la conducta |
Teories |
Condicionament instrumental |
|
7.2.Càstig

-
Si volem suprimir una conducta mitjançant el càstig cal que introduïm l'estímul aversiu amb la seva màxima intensitat des d'un bon començament. Ja hem comentat en analitzar l'experiment d'Azrin (1960) que els subjectes es poden habituar a un estímul aversiu suau i diversos estudis han mostrat que aquesta habituació es pot generalitzar a altres estímuls aversius més intensos. Azrin, Holz i Hake (1963) van trobar que uns coloms deixaven d'executar la conducta si aquesta produïa una descàrrega de 80 volts des del primer moment, però si la intensitat de la descàrrega començava amb una intensitat baixa en les primeres presentacions i s'anava incrementant a poc a poc al llarg de les sessions experimentals, els coloms continuaven responent fins i tot quan la resposta produïa descàrregues de 130 volts.
-
Un altre factor que interfereix en l'eficàcia del càstig és la immediatesa amb què es presenta l'estímul aversiu. Igual que en el reforçament la demora entre la conducta i el reforçador reduïa l'eficàcia del reforçador, en el càstig s'ha demostrat que la demora de l'estímul aversiu respecte a la conducta que es vol suprimir no té cap efecte. Tothom que té animals de companyia sap la inutilitat de castigar un gos o un gat per haver defecat enmig del menjador si el càstig no s'administra en el moment en què es produeix la conducta de l'animal. De la mateixa manera, advertir un infant que es porta malament pel carrer que quan arribem a casa el castigarem té pocs efectes.
-
Els programes de càstig, és a dir, el patró amb què s'administra el càstig també té repercussions sobre la seva eficàcia. La manera més efectiva d'eliminar una conducta és mitjançant un programa continu de càstig i no d'un programa intermitent. Abans de presentar els estudis que mostren alguns dels efectes dels programes de càstig cal recordar que en aquests experiments els animals aprenen a donar la resposta per a obtenir menjar i, posteriorment, s'introdueix el càstig de la mateixa conducta. Per tant, els animals estan altament motivats per a executar la conducta que es castiga. Amb aquest procediment, Azrin i col·laboradors (1963) van comparar diferents programes de càstig de RF que anaven des d'una raó igual a 1 a una raó de 1.000. Van trobar que com més petita era la raó, més eficaç era el programa per a reduir la conducta. També s'ha trobat (Azrin, 1956) que quan es castiga una conducta amb un programa d'IF60seg provoca un patró de respostes desaccelerat a mesura que s'acaba l'interval (just el patró oposat al que provoca el reforçament en què s'observa una acceleració cap al final de l'interval). Quan s'ha utilitzat un programa de RF20, els animals reduïen les respostes a mesura que s'apropava la resposta número 20 i que, just després de rebre el càstig, els animals tornaven a respondre amb una taxa alta (Hendry i VanToller, 1964). De bell nou, trobem un patró de resposta oposat al que provoca el reforçament amb programes de RF. Allà vèiem que l'RF provocava justament una pausa després del reforçament; en el càstig, la pausa es fa abans de rebre el càstig.
-
En recordar el procediment per a estudiar els programes de càstig hem dit que els animals estaven motivats per a dur a terme la resposta. Com influeix la motivació per respondre sobre l'eficàcia del càstig? Azrin i col·laboradors (1963) van demostrar que l'èxit de castigar una conducta mantinguda amb reforçament de menjar depenia del grau de privació de menjar dels animals. Si els animals portaven moltes hores sense menjar, l'eficàcia del càstig era mínima, però si només estaven lleugerament famolencs, llavors el càstig suprimia pràcticament la conducta. Tot i que aquesta relació no ha de sorprendre ningú, té implicacions importants si volem castigar una conducta altament motivada sense haver d'utilitzar estímuls aversius molt intensos. Cal identificar el reforçador que manté la conducta i devaluar-lo. Una manera de fer-ho és dispensant-lo d'una manera no contingent a la conducta que volem castigar. Un exemple deixarà clar aquest punt.
Imaginem uns pares que volen eliminar la conducta destructiva del seu fill. Sospiten que la conducta destructiva del nen persegueix la finalitat de captar l'atenció dels pares. Llavors, la manera de devaluar el reforçador seria prestar atenció al nen en altres moments diferents de quan es porta malament.
-
Relacionat amb aquest darrer punt, s'ha observat que proporcionar conductes alternatives a la conducta castigada que proporcionin el mateix reforçador augmenta l'eficàcia del reforçador. Continuem amb l'exemple del nen que trenca objectes per a obtenir l'atenció dels pares. Si realment és l'única manera que té el nen de rebre atenció, el càstig no tindrà cap efecte, ja que en si mateix implicarà l'atenció que busca el nen. Si prestem atenció al nen per altres comportaments acceptats, com llegir, llavors li podem proporcionar atenció i interessar-nos pel que llegeix o dedicar-li un temps al dia per a jugar.
-
El darrer factor que veurem que afecta l'eficàcia del càstig fa referència al paper que té el càstig com a senyal del reforçador.
Factors que afecten l'eficàcia del càstig |
|
---|---|
Incrementen l'eficàcia |
|
Redueixen l'eficàcia |
|
-
Primer, el càstig pot provocar determinades reaccions emocionals com la por o l'empipament. Aquestes emocions sovint interfereixen en l'aprenentatge i en l'execució. Balaban, Rhodes i Neuringer (1990) van presentar una tasca de memòria a uns estudiants. En un dels grups, se'ls castigava amb una descàrrega quan cometien un error i, en l'altre, se'ls castigava amb un to. Els resultats van ser que els estudiants treballaven més lentament i cometien més errors quan se'ls castigava amb la descàrrega que quan se'ls castigava amb el to.
-
Un segon aspecte que cal tenir en compte és que el càstig pot suprimir altres conductes diferents de la que es castiga.
-
Un altre problema del càstig és que tendeix a provocar conductes agressives cap a la persona que proporciona el càstig i també cap a altres persones que pugin ser a prop.
8.Teories del condicionament instrumental
8.1.Estructura associativa del condicionament instrumental

8.1.1.Associacions E-R
8.1.2.Associacions R-C
8.1.3.Associacions E-C
8.1.4.Associacions jeràrquiques
8.2.Teories sobre la regulació de la conducta


Teories del condicionament instrumental |
|
---|---|
Basades en els mecanismes |
Basades en la motivació |
|
|
9.Generalització i discriminació
9.1.Generalització i discriminació
La discriminació és la tendència a respondre d'una manera diferencial a dos estímuls diferents.
9.2.Gradients de generalització

9.3.Discriminacions extradimensionals i intradimensionals

9.4.La transposició i el desplaçament del vèrtex


9.5.Teoria d'Spence (1936)


9.6.Teoria de la discriminació basada en processos d'atenció

9.7.Aprenentatge perceptiu


Definicions |
Generalització: tendència a respondre a un estímul nou similar a l'EC o als estímuls discriminants. Discriminació: consisteix a respondre d'una manera diferent a dos estímuls segons les seves diferències. |
Fenòmens |
|
Teories de la discriminació i generalització |
|
Teories de l'aprenentatge perceptiu |
|
10.Aprenentatge per observació
10.1.Teories de la imitació
10.1.1.La imitació com a instint

-
La categoria més simple proposada per Thorpe era la facilitació social, en què el comportament d'un individu provoca una conducta similar en un altre individu, però que la conducta ja es troba en el repertori de l'imitador.
Experiment de Wyrwicka (1978)Un exemple d'aquesta facilitació social el trobem en un treball de Wyrwicka (1978) en el qual va entrenar unes gates perquè mengessin alguns aliments poc habituals com plàtans o patates xafades i va observar que les seves cries també van començar a menjar els mateixos aliments que les mares.
-
La segona categoria d'aprenentatge per observació proposada per Thorpe és l'augment local, en el qual la conducta d'un model dirigeix l'atenció de l'aprenent cap a un determinat objecte o lloc en l'entorn. Com a resultat es té que una conducta que es podria aprendre per assaig i error s'aprèn més ràpidament.
Experiment de Warden, Fjeld i Koch (1940)Warden, Fjeld i Koch (1940) van entrenar unes mones a estirar d'una cadena per a obtenir menjar com a reforçador. A continuació, es va posar una mona sense entrenament en una caixa idèntica propera a la caixa de la mona entrenada. Els investigadors van poder constatar que la mona sense experiència observava el comportament de la que coneixia la resposta adequada i immediatament la imitava. Probablement, la mona ingènua hauria après la resposta per assaig i error, però el seu aprenentatge es va veure accelerat per l'observació de la conducta de la seva companya ensinistrada.
Aquest tipus d'aprenentatge per observació també s'ha trobat en aus (per exemple, Hogan, 1986) i, el que és més interessant, no cal que el model i l'aprenent siguin de la mateixa espècie. Bullock i Neuringer (1977) van trobar que uns coloms podien aprendre a executar una cadena de dues respostes (picotejar dues tecles en un ordre concret) si observaven la mà d'un humà que feia la seqüència correcta.
-
La tercera categoria d'aprenentatge per observació proposada per Thorpe rep el nom d'imitació autèntica i no és fàcil de distingir de la categoria anterior. Es refereix a la imitació d'un patró de conductes que és molt poc probable que aparegui en una determinada espècie i que rarament pot ser apresa per assaig i error.
Experiment de Kawai (1965)Un exemple d'imitació autèntica la trobem en un estudi de Kawai (1965) que va observar el comportament d'un grup de mones que vivien en una illa del Japó. Quan els grans de blat s'escampaven per la platja, les mones els recollien d'un en un entre els grans de sorra i se'ls menjaven. Una de les mones va descobrir que si llançava un grapat de sorra amb el blat a l'aigua, la sorra s'enfonsava i el blat surava, cosa que facilitava la tasca de separar-los. Ràpidament altres mones van començar a imitar aquest comportament.
Imitació autènticaÉs difícil trobar exemples de la imitació autèntica en altres espècies d'animals diferents dels primats, però s'han descrit casos anecdòtics que es poden entendre com una evidència d'una imitació autèntica en aus (Fisher i Hinde, 1947). El 1921, alguns habitants del sud d'Anglaterra es van adonar que alguns ocells havien començat a obtenir llet foradant les ampolles dipositades al llindar de les portes. Al llarg dels anys, aquest comportament de les aus es va estendre al llarg d'Anglaterra, Gales, Escòcia i Irlanda. A més, aquest comportament es va observar en diferents espècies d'ocells. Com que no té massa sentit pensar que tots aquests ocells van aprendre sobtadament aquest comportament per ells mateixos, devien aprendre i transmetre la conducta per mitjà de l'aprenentatge per observació.
10.1.2.La imitació com una resposta instrumental
10.1.3.La teoria de Bandura sobre l'aprenentatge per imitació
2) Colpejar el cap de la nina amb un mall.
3) Donar-li puntades de peu.
4) Llançar pilotes de goma contra la nina.
Grup |
Fase d'observació |
Fase de prova 1 |
Fase de prova 2 |
---|---|---|---|
Premi |
Conducta agressiva del model → reforçament |
Comuna als tres grups: els nens tenien accés a la nina amb la qual havia actuat el model d'una manera individual. |
Comuna als tres grups: els nens van ser reforçats per a imitar al model d'una manera individual. |
Càstig |
Conducta agressiva del model → càstig |
||
Sense conseqüència |
Conducta agressiva del model → no-conseqüència |
2) Processos de retenció. És obvi que un individu ha de retenir informació adquirida mitjançant l'observació si després vol reproduir la conducta.
3) Processos de reproducció motora. Per a poder reproduir la conducta apresa mitjançant l'observació cal que l'aprenent tingui les capacitats motores mínimes per a dur a terme la conducta. Colpejar una nina no presenta problemes per a l'aprenent ja que té prou habilitat per a donar cops. Però un expert jugador de billar ens pot mostrar pas per pas com fer una carambola a tres bandes, però si l'observador no ha manipulat mai un tac, possiblement li serà com a mínim difícil, reproduir la conducta, encara que ens en pugui fer una descripció verbal perfecta.
4) Processos de motivació i d'incentiu. Segons Bandura els tres primers processos és tot el que es necessita per a adquirir la capacitat de fer una nova conducta, però aquesta nova conducta no es reflectirà si l'aprenent no rep l'incentiu adequat. Perquè la conducta s'executi, l'individu ha de tenir l'expectativa que serà reforçada. L'experiment de Bandura (1965) descrit més amunt proporciona un exemple del paper que té l'incentiu. Els nens que van veure com es castigava el model per agredir la nina, probablement van desenvolupar l'expectativa que aquesta conducta té conseqüències desagradables i, per tant, van mostrar menys conducta agressiva que els nens dels altres grups. En canvi, quan se'ls va oferir un reforçador per a imitar la conducta del model, les seves expectatives sobre les conseqüències de la conducta van canviar i van emetre la mateixa quantitat de conducta agressiva que els nens dels altres grups.
10.2.Factors que afecten la probabilitat de la imitació
10.2.1.Característiques del model
10.2.2.Característiques de l'aprenent
10.2.3.Característiques de la situació
10.3.Influència de l'aprenentatge per observació en el desenvolupament cognitiu
Exercicis d'autoavaluació
2) Contrasteu el reforçament positiu i el negatiu (apartat 4).
3) Quins són els efectes de la demora en el reforçament i com es poden minimitzar? (apartat 5)
4) Compareu els programes de raó i d'interval (apartat 6).
5) Què ens indica la recerca amb programes concurrents i concurrents encadenats sobre la conducta d'elecció? (apartat 6)
6) Descriviu les diferents associacions que es poden inferir en el condicionament instrumental (apartat 9).
7) Compareu la teoria de Premack i les teories sobre regulació conductual (apartat 9).
8) Descriviu el gradient de generalització i els efectes que s'hi associen (apartat 10).
9) Com pot explicar la teoria d'Spence el desplaçament del màxim (apartat 10).
10) Quins mecanismes s'han proposat per a explicar l'aprenentatge perceptiu? (apartat 10)
11) Descriviu els processos implicats en l'aprenentatge per observació proposats per Bandura (apartat 11).
a) redueix l'impuls.
a) la força de la connexió estímul-estímul pot augmentar amb l'experiència.
a) És un estímul que assenyala la disponibilitat del reforçador.
a) Interval fix.
a) de càstig.
a) a l'aparició d'un estímul aversiu.
a) impedir l'aparició d'un EI apetitiu.
a) En els dos entrenaments es pretén instaurar una nova conducta.
a) El reforçament es presenta al subjecte per la primera resposta que fa un cop transcorreguda una quantitat fixa de temps des de l'últim reforçament.
a) La intensitat de les respostes.
a) RF10.
a) En l'establiment d'una nova conducta aparellant-la a un reforç positiu.
a) la taxa relativa de respostes en l'alternativa A és igual que la taxa relativa de respostes en l'alternativa B.
a) En la tecla VI 30 segons, el doble de respostes que en la tecla VI 60 segons.
a) Un problema per a la teoria.
a) un contrast de conducta.
a) Una discriminació extradimensional.
b) Incorrecte.
c) Incorrecte.
d) Correcte.
2. a) Incorrecte.
b) Incorrecte.
c) Correcte.
d) Incorrecte.
3. a) Correcte.
b) Incorrecte.
c) Incorrecte.
d) Incorrecte.
4. a) Incorrecte.
b) Correcte.
c) Incorrecte.
d) Incorrecte.
5. a) Incorrecte.
b) Incorrecte.
c) Incorrecte.
d) Correcte.
6. a) Incorrecte.
b) Incorrecte.
c) Incorrecte.
d) Correcte.
7. a) Incorrecte.
b) Incorrecte.
c) Correcte.
d) Incorrecte.
8. a) Incorrecte.
b) Correcte.
c) Incorrecte.
d) Incorrecte.
9. a) Incorrecte.
b) Incorrecte.
c) Incorrecte.
d) Correcte.
10. a) Incorrecte.
b) Correcte.
c) Incorrecte.
d) Incorrecte.
11. a) Correcte.
b) Incorrecte.
c) Incorrecte.
d) Incorrecte.
12. a) Incorrecte.
b) Incorrecte.
c) Correcte.
d) Incorrecte.
13. a) Incorrecte.
b) Incorrecte.
c) Correcte.
d) Incorrecte.
14. a) Correcte.
b) Incorrecte.
c) Incorrecte.
d) Incorrecte.
15. a) Incorrecte.
b) Correcte.
c) Incorrecte.
d) Incorrecte.
16. a) Incorrecte.
b) Incorrecte.
c) Correcte.
d) Incorrecte.
17. a) Incorrecte.
b) Incorrecte.
c) Incorrecte.
d) Correcte.
Glossari
- aprenentatge relacional m
- Concepció segons la qual la discriminació entre dos estímuls es basa en una relació entre ells.
- associació jeràrquica f
- Una associació entre un estímul i una relació resposta-conseqüència particular.
- associació R-C f
- Vegeu associació resposta-conseqüència.
- associació resposta-conseqüència f
- Una associació entre la conducta d'un individu i una conseqüència, per exemple, menjar.
sigla associació R-C - autocontrol m
- Una condició que descriu la situació en la qual un individu escull l'opció d'una recompensa gran, però demorada en lloc d'una recompensa petita i immediata.
- canvi extradimensional m
- Procediment en què varia la resposta d'elecció correcta i la dimensió de l'estímul en què difereixen les possibles eleccions.
- canvi intradimensional m
- Procediment en què varia la resposta d'elecció correcta, però es manté la dimensió de l'estímul en què difereixen les possibles eleccions.
- càstig m
- Un procediment de condicionament instrumental en què una conducta és seguida d'un estímul aversiu.
- condicionament instrumental m
- Una forma d'aprenentatge en la qual un estímul és contingent a una resposta.
- conducta maladaptada f
- Conductes innates evocades pel reforçador i que interfereixen amb la conducta instrumental.
en misbehaviour - contigüitat temporal f
- Immediatesa de la presentació del reforçador.
- contingència f
- Dependència de la presentació del reforçador de l'execució de la resposta instrumental.
- contrast negatiu m
- Una reducció de la resposta com a conseqüència d'una reducció del valor del reforçador.
- contrast positiu m
- Un increment de la resposta com a conseqüència d'un augment del valor del reforçador.
- control per l'estímul m
- El grau en què un estímul provoca la resposta.
- desplaçament del màxim m
- Un desplaçament del màxim del gradient de generalització respecte de l'E+ i en direcció
oposada a l'E–.
sin. compl. desplaçament del vèrtex - desplaçament del vèrtex m
- sin. desplaçament del màxim
- discriminació f
- Consisteix a respondre d'una manera diferent a dos estímuls segons les seves diferències.
- efecte del reforçament parcial m
- Dificultat d'extingir una resposta que ha estat reforçada parcialment.
- emmotllament m
- Un procediment per a enfortir una resposta instrumental, per mitjà de reforçar aproximacions successives a la resposta criteri final.
- entrenament d'omissió m
- Un procediment de condicionament instrumental en què la resposta és seguida de la retirada d'un estímul apetitiu.
- escapada f
- Un procediment de condicionament instrumental en què la resposta és seguida de la retirada d'un estímul aversiu.
- estímul discriminant m
- Estímul que informa de la disponibilitat del reforçador.
- evitació f
- Un procediment de condicionament instrumental en què la resposta impedeix la presentació d'un estímul aversiu.
- força de l'hàbit f
- Tendència a executar una resposta en presència d'un estímul determinat.
- generalització f
- Tendència a respondre a un estímul nou similar a l'EC o als estímuls discriminants.
- gradient de generalització m
- Relació entre la força de la resposta als estímuls de prova en funció de la seva similitud amb l'EC o amb els estímuls discriminants.
- hipòtesi del marcatge f
- Una teoria de la facilitació de l'aprenentatge, segons la qual la presentació d'una clau després d'una resposta d'elecció marca aquesta resposta en la memòria de l'animal.
- imitació f
- Reproducció d'una conducta observada en un altre individu.
- impuls m
- Un estat de l'organisme que correspon a un desequilibri biològic.
- infraigualació f
- Una taxa de resposta per al millor de dos programes de reforçament inferior a la que prediu la llei de la igualació.
- llei de la igualació f
- Un enunciat matemàtic que descriu la relació entre la taxa de resposta i la taxa de reforçament.
- maximització f
- Teoria de la igualació que afirma que la conducta de la igualació es produeix perquè l'animal pretén obtenir el màxim de reforçadors.
- millorament m
- Teoria de la igualació que afirma que la conducta de la igualació es produeix perquè l'animal escull contínuament l'opció amb la taxa de reforçament més gran en un moment determinat.
- misbehaviour f
- Vegeu conducta maladaptada.
- pausa postreforçament f
- Període posterior al reforçament en què l'individu deixa de respondre. S'observa en els programes de reforçament de raó i d'interval fixos.
- programa de reforçament d'interval fix m
- Un programa de reforçament intermitent en què el subjecte rep la recompensa per respondre
després d'un període determinat de temps.
sigla programa IF - programa de reforçament d'interval variable m
- Un programa de reforçament intermitent en què el subjecte rep la recompensa per respondre
després d'un període de temps que varia d'un reforçador a un altre.
sigla programa IV - programa de reforçament de raó fixa m
- Un programa de reforçament intermitent en què el subjecte rep la recompensa per respondre
un determinat nombre de vegades.
sigla programa RF - programa de reforçament de raó variable m
- Un programa de reforçament intermitent en què el subjecte rep la recompensa per respondre
un determinat nombre de vegades, que varia entre un reforçador i el següent.
sigla programa RV - programa de reforçament continu m
- Un programa de reforçament en què la conseqüència es presenta cada vegada que s'executa la resposta.
- programa de reforçament intermitent m
- Vegeu programa de reforçament parcial.
- programa de reforçament parcial m
- Un programa de reforçament en què la conseqüència no es presenta cada vegada que s'executa
la resposta.
sin. compl. programa de reforçament intermitent - programa IF m
- Vegeu programa de reforçament d'interval fix.
- programa IV m
- Vegeu programa de reforçament d'interval variable.
- programa RF m
- Vegeu programa de reforçament de raó fixa.
- programa RV m
- Vegeu programa de reforçament de raó variable.
- punt de complaença m
- La combinació preferida de dues activitats.
- reforçador m
- Estímul que contingent a la resposta fa que incrementi la taxa de la resposta.
- reforçador condicionat m
- Un estímul inicialment neutre que pel seu aparellament amb un reforçador primari adquireix
la propietat de reforçar una conducta.
sin. compl. reforçador secundari - reforçament negatiu m
- Un procediment del condicionament instrumental en què una resposta elimina o impedeix la presentació d'un estímul aversiu.
- reforçament positiu m
- Un procediment de condicionament instrumental en què la resposta és seguida de la presentació d'un estímul apetitiu.
- reforçador secundari m
- sin. reforçador condicionat
- sobreigualació f
- Una taxa de resposta per al millor de dos programes de reforçament superior a la que prediu la llei de la igualació.