跳转到内容

增強:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
→‎應用:​ 內容擴充
第214行: 第214行:


* [[通证经济|代幣酬賞制]] (token economy):如當病患保持良好行為就給予或交換其想要的東西<ref>{{Cite journal|title=TOKEN REINFORCEMENT: A REVIEW AND ANALYSIS|url=http://dx.doi.org/10.1901/jeab.2009.91-257|last=Hackenberg|first=Timothy D|date=2009-03|journal=Journal of the Experimental Analysis of Behavior|issue=2|doi=10.1901/jeab.2009.91-257|volume=91|pages=257–286|issn=0022-5002}}</ref>。例如戒煙者可以透過網上定期上載其沒有吸煙的證據來獲得一些代用券<ref>{{Cite journal|title=An Internet-based abstinence reinforcement treatment for cigarette smoking|url=http://dx.doi.org/10.1016/j.drugalcdep.2006.06.013|last=Dallery|first=Jesse|last2=Glenn|first2=Irene M.|date=2007-01-12|journal=Drug and Alcohol Dependence|issue=2-3|doi=10.1016/j.drugalcdep.2006.06.013|volume=86|pages=230–238|issn=0376-8716|last3=Raiff|first3=Bethany R.}}</ref>。
* [[通证经济|代幣酬賞制]] (token economy):如當病患保持良好行為就給予或交換其想要的東西<ref>{{Cite journal|title=TOKEN REINFORCEMENT: A REVIEW AND ANALYSIS|url=http://dx.doi.org/10.1901/jeab.2009.91-257|last=Hackenberg|first=Timothy D|date=2009-03|journal=Journal of the Experimental Analysis of Behavior|issue=2|doi=10.1901/jeab.2009.91-257|volume=91|pages=257–286|issn=0022-5002}}</ref>。例如戒煙者可以透過網上定期上載其沒有吸煙的證據來獲得一些代用券<ref>{{Cite journal|title=An Internet-based abstinence reinforcement treatment for cigarette smoking|url=http://dx.doi.org/10.1016/j.drugalcdep.2006.06.013|last=Dallery|first=Jesse|last2=Glenn|first2=Irene M.|date=2007-01-12|journal=Drug and Alcohol Dependence|issue=2-3|doi=10.1016/j.drugalcdep.2006.06.013|volume=86|pages=230–238|issn=0376-8716|last3=Raiff|first3=Bethany R.}}</ref>。
* {{Translink|en|Contingent contract}}:透過互給對方[[條件運算式|條件]]來解決婚姻關係問題,好像幫對方做一些事 (lists the duties) 就可以有甚麼回報或特權<ref>{{Cite book|chapter=Assessment and Treatment of Incompatible Marital Relationships|title=Compatible and Incompatible Relationships|url=http://dx.doi.org/10.1007/978-1-4612-5044-9_15|publisher=Springer New York|date=1985|location=New York, NY|isbn=9781461295389|pages=333–361|first=William C.|last=Follette|first2=Neil S.|last2=Jacobson}}</ref>,來改善夫婦間關係,也能知道對方需要甚麽<ref>{{Cite journal|title=The maintenance of treatment gains following social learning-based marital therapy|url=http://dx.doi.org/10.1016/s0005-7894(89)80053-x|last=Jacobson|first=Neil S.|date=1989|journal=Behavior Therapy|issue=3|doi=10.1016/s0005-7894(89)80053-x|volume=20|pages=325–336|issn=0005-7894}}</ref>。這也是種[[认知行为疗法|認知行為療法]] (CBT),讓到雙方討論出問題所在。
* {{Translink|en|Contingent contract}}:婚姻關係問題,透過[[條件運算式|條件]],如果幫對方做一些事就可以有甚麼回報或特權,來改善夫婦間關係
*[[自閉症]]兒童行為訓練<ref>{{Cite journal|title=Behavioral treatment and normal educational and intellectual functioning in young autistic children.|url=http://dx.doi.org/10.1037//0022-006x.55.1.3|last=Lovaas|first=O. Ivar|date=1987|journal=Journal of Consulting and Clinical Psychology|issue=1|doi=10.1037//0022-006x.55.1.3|volume=55|pages=3–9|issn=0022-006X}}</ref><ref>{{Cite web|title=Ivar Lovaas:ABA之父與自閉症治療|黃怡/時間的秘密|獨立評論|url=https://opinion.cw.com.tw/blog/profile/195/article/6491|work=獨立評論@天下|accessdate=2019-03-22|language=zh-Hant-TW}}</ref>中的[[應用行為分析]] (ABA, Applied behavior analysis),如治療師用手指著自己的口,以提示(prompt)來讓目標做更多社交溝通行為後,再以消退(fading)減少此類提示,改以簡單的碰一碰患者的面<ref>{{Citation|title=Lovaas 1987 Study|url=https://www.youtube.com/watch?time_continue=1&v=oGhIcAnBQZ4|date=2016-01-28|accessdate=2019-03-22|last=Eric Larsson}}</ref>。<br />
*[[自閉症]]兒童行為訓練<ref>{{Cite journal|title=Behavioral treatment and normal educational and intellectual functioning in young autistic children.|url=http://dx.doi.org/10.1037//0022-006x.55.1.3|last=Lovaas|first=O. Ivar|date=1987|journal=Journal of Consulting and Clinical Psychology|issue=1|doi=10.1037//0022-006x.55.1.3|volume=55|pages=3–9|issn=0022-006X}}</ref><ref>{{Cite web|title=Ivar Lovaas:ABA之父與自閉症治療|黃怡/時間的秘密|獨立評論|url=https://opinion.cw.com.tw/blog/profile/195/article/6491|work=獨立評論@天下|accessdate=2019-03-22|language=zh-Hant-TW}}</ref>中的[[應用行為分析]] (ABA, Applied behavior analysis),如治療師用手指著自己的口,以提示(prompt)來讓目標做更多社交溝通行為後,再以消退(fading)減少此類提示,改以簡單的碰一碰患者的面<ref>{{Citation|title=Lovaas 1987 Study|url=https://www.youtube.com/watch?time_continue=1&v=oGhIcAnBQZ4|date=2016-01-28|accessdate=2019-03-22|last=Eric Larsson}}</ref>。<br />



2019年3月22日 (五) 09:50的版本

增強(英語:Reinforcement),或称强化,是行为主义心理学中的一个重要概念,是关于理解和修正人的行为的一种学说。

File:Sskinner box.jpg
用來測試動物反應的Skinner box

科学研究发现,人类或动物为达到某种目的,会于所处的环境下采取特定行为;当这种行为带来的某種反應或后果对他有利时, 这种行为就会在以后重复出现,而該結果就稱為“增強物”;反之亦然,当其行为会对他带来不利时,这种行为就自然减弱或消失,个体对行为结果所产生的后续反应,就是以操作性条件反射进行的。而由于“增強物”的適時出現,增加了個體以後在相同情形下重複这种行为的機率,這表示“增強物”對於個體的反應起了強化作用。此種强化作用,即稱之為「增強」。

“增强”这一概念的提出源于美国心理学家愛德華·桑代克,后经约翰·布罗德斯·华生克拉克·L·赫爾等人的发展、修订,到新行为主义代表人物伯尔赫斯·弗雷德里克·斯金纳达到了一定的理论高度并发扬光大。他们都认为强化作用是决定人和动物所作所为的关键因素,并可以用这种“正强化”或“负强化”的办法来影响行为的后果,从而修正其行为。

理论发展

美国心理学家、教育家愛德華·桑代克是第一个提出增强理论的学者。他首创迷箱实验,将一只饿猫放在封闭但设有开门机关的箱子里,食物放在箱子外作为脱逃的奖赏。在这个情境中,猫起初在箱子内乱碰乱撞,后来碰巧触动了开门的机关,得以从箱子内逃出,吃到外面的鱼。经过不断重复试验,猫打开门所需的时间变得愈来愈短;至最后“学习”完成时,只要把猫一放进箱子里,它就会表现出正确的反应。桑代克对此的结论是,“猫并没有理智地推论出打开笼子出口与它拉动绳圈这二者之间的关系,而只是对绳圈这个刺缴形成了逐渐加强的拉绳圈反应。”

桑代克从这一实验中,确立了“刺激(stimuli)—反应(responses)”两者之间的联结。这种联结是通过学习过程建立、加强和组织起来的[1]。他以此为基础,提出了几条学习规律,包括准备律(Law of readiness)、练习律(Law of exercise)和效果律(Law of effect),其中最著名的是效果律。

桑代克于1898年发表的第一代效果律,引起了许多理论家的研究和广泛的争论,并指出了其漏洞,一些学者认为“满意”、“不舒适”等字眼是主观性的术语,不宜描述行为。在时间上迟来的结果对已属过去的事实发生反作用,这不符合正常的因果律等。

桑代克和巴甫洛夫的工作几乎是同时的,但又是各自独立发现的。俄国心理学家伊万·巴甫洛夫通过经典条件反射,发现条件刺激与带有奖赏或惩罚的无条件刺激的多次配对,也可以使个体在单独呈现条件刺激时,也能引发类似无条件反应的条件反应。例如,巴甫洛夫在研究消化现象时,观察了狗的唾液分泌。他把食物显示给狗,并测量其唾液分泌。由于狗对食物会自然产生分泌唾液的反应,这种反应是本能固有的,巴甫洛夫把这食物这种刺激称为无条件刺激(Unconditioned stimulus),简称“UCS”;而而由于食物产生唾液的反应被称为无条件反应(Unconditioned response),简称“UCR”。他发现,如果随同食物反复给一个条件刺激,即一个本来并不会自动引起唾液分泌的刺激,如铃声,狗就会逐渐“学会”在只有铃声但没有食物的情况下分泌唾液。在这种情况下,铃声就成为了条件刺激(Conditioned stimulus),简称“CS”,铃声引起的唾液分泌就是条件反应(Conditioned response),简称“CR”。在巴甫洛夫的经典条件中,重要的是引起反应的刺激,反应之后的结果是没有任何理论意义的。所以尽管巴甫洛夫和桑代克都在分析刺激与反应之间的联系,但他们的理论对形成这种联系的程序以及对学习过程的解释是完全不同的。

巴甫洛夫于1902年发表其条件反射研究结果,但他可能是首先在行為方面使用"增強"一詞的学者。巴甫洛夫在用狗做实验时,故意不给狗进食,使之保持饥饿状态,这种饥饿刺激使狗保持对实验环境的警觉。在条件刺激出现时或稍后呈现无条件刺激,这种无条件刺激的呈现起增强“学习”的作用,被巴甫洛夫称为“增强”。但他保守的使用俄語中近似的词汇,且用來指強化一個已學習但較弱的反應。他的用法與今天“選擇並強化新行為”的意義不尽相同。巴甫洛夫也使用了俄語中的“消退”(extinction,或称消弱)一字来描述类似后来斯金纳提出的负强化理论,即巴甫洛夫发现,当狗对铃声的条件作用建立以后,若使食物不再伴随铃声出现,那么狗对铃声作出的唾液分泌反应就会越来越弱,直到最后消失,这种情况即为“消退”。

增強的特性

  • 有規律地出现在生物個體進行特定行為之後。
  • 與行為具有時間空間上的連續性。
  • 與可能以其他強度進行的行為的機率的增加有關。

例如:每当你的听你的话坐下时,就给牠食物。如果狗变得在下指令時更愿意聽話坐下,表示坐下已經被附帶的食物管理所增強。

需要注意的是被增強的是行為而不是狗。提供食物作為增強物強化坐下的行為,使坐下在類似情況下的出现更快或頻率更高。增強只能在回顧中被真正的確認。一個物體、項目、食物或其他增強物之所以成為增強物,只能在行為因增強物的控管後增加表現之後。

增強的研究已经产生擁有可重複性实验结果的龐大體系。增強是行为实验分析的核心概念和過程。

增強的類型

正强化与负强化

行为的增強有2种类型:

  • 正强化,也称积极强化正向增強,指在行為反應之後增加個體所喜愛的刺激所產生的強化作用,如給予食物、金錢等。
抓癢是一種负向增強

正强化发生于一件渴求中的事或物作为一种结果而呈现,而这一结果刺激了这一渴求。

  • 例一:老鼠按下一个按钮会得到奖励,因而老鼠更频繁地按下按钮,越来越多的奖励增加了其按下按钮的次数,因而正强化了其按按钮的行为。
  • 例二:女儿收拾玩具则父亲给糖,如果女儿确实收拾玩具因而变得更勤快了,则糖是正强化物,正强化了收拾东西的行为。
  • 例三: 公司依照员工销售业绩多少进行对应奖励,业绩高则奖励多,员工因此销售更勤快、更高效,则雇主收到正强化的效用。[2]:253
  • 例四:自閉症兒童在與別人溝通時,眼睛看著別人就說:「做得好」。
  • 负强化,也称消极强化负向增強指在行為反應之後減少個體所厭惡的刺激所產生的強化作用,如關掉令人痛苦的電流。負向增強有兩種,逃脫制約出現在令人厭惡的刺激剛出現,且行為終結它時。例如抓癢或按下鬧鐘的按鈕。迴避制約出現在一個為了避免出現厭惡刺激的行為時。例如爲了避免飢餓而進食,或是為了避開塞車而改變路徑。

负强化发生于受厌恶英语aversives的事件被避免或者受厌恶英语aversives的物件被清除后,某项行为的程度反而上升。

  • 例一:父母反复唠叨叫孩子打扫卫生后,孩子为了避免前述情况的发生而打扫卫生。此处,父母的唠叨是孩子想要避免的事件,因而负强化了孩子打扫卫生的行为。
  • 例二:一个人用某品牌止痒软膏止蚊子叮咬痒,若止痒效果好,则此人更有可能继续购买使用该软膏,蚊子叮咬引起的瘙痒则是其中的负强化物,负强化了其购买行为。
  • 例三: 公司规定员工布置的业绩进度如在周五前完成则可在周六休假。周六还要上班这一结果是负强化物,是大家所不愿意见到的,因而促进了公司的提升,这一过程则为一个负强化的过程。[2]:253
行為表現頻率
增加 減少
正向 正向增強 正向懲罰(懲罰 I)
負向 負向增強 負向懲罰(懲罰 II)

辨別"正向"與"負向"是個重要的問題。舉例來說,對一個非常熱的房間而言,來自外界的氣流是正向的,因為它帶來了相對涼爽的空氣;但是它也同時是負向的,因為它帶走了原本的熱空氣。有一些增強物可以同時以正向和負向作控制,例如一個毒癮者以吸毒來增加興奮和擺脫戒毒症狀。另一個例子是進食,進食增加了愉悅感同時移除了飢餓的感覺。直到現在,許多行為心理學家以不帶對立性(Polarity)的增強和懲罰來包含所有的環境變化。

惩罚

白鴿也是常用來實驗的動物之一。實驗者可提供穀殼(Grain)作為增強物。

惩罚是動物所處環境中出現在特定的行为或反應之後,能夠減少往後行為出現的環境變化。與增強相同的是,被懲罰的是行為而不是動物本身。只有知道一個刺激對於行為出現頻率的效果時才能確知它是否為懲罰。

  • 正向懲罰 - 又稱第一型懲罰,實驗者在環境中增加令人厭惡的刺激,以對行為進行懲罰(如短暫電擊)。
  • 負向懲罰 - 又稱第二型懲罰,是將環境中的正向增強減少(如拿走食物盤)。

與增強一樣,辨認一個懲罰不經常需要提到它的正向或負向。

懲罰並非與增強相反的鏡像效應。在對實驗動物的實驗或是對孩童的研究中,懲罰是暫時性的減少先前對某行為的增強,且能夠產生其他的情緒行為(如鴿子拍動翅膀),以及生理改變(如心跳速度),並沒有明顯對等增強。

某些行為心理學家認為懲罰是一個 "初級過程" ,也就是完全獨立的學習現象,與增強有所區別。有些人認為它是負向增強的一種分類,創造任何一個造成迴避懲罰行為(甚至不作反應)的狀態可看成是一種增強。

"令人厭惡的刺激"、"懲罰物" 和 "惩罚刺激" 是同義字,懲罰能夠作為一個 "厭惡刺激" 、"任何懲罰性改變的出現" 或是 "實驗中一個特定行為被懲罰的部分" 。

代替懲罰

  1. 避免反應:改變環境令到目標不能作出反應。例如精神病人被捆綁起來,防止作出傷人的行為。
  2. 消弱 (extinction):例如在小朋友調皮研究的發現,小朋友作出行為失當是因為想得到家長的關注[3]。只要父母關心小孩 (withdraw reinforcer)就可以減少上述問題
  3. 差别性增強(Differential Reinforcement):只對個別目標行為增强[4][5][6]
    1. 不相容行为的差别性增强(DRI) - 在沒有懲罰的情況下增強特殊的不相容行為,這種方法用來减少已經频繁出現的行为,例如一個人不可能同時離開房間並在房間裡與某人打架,或獎勵小朋友安靜地坐在座位而減少其在課室走來走去或不騷擾其他同學[7]
    2. 其他行为的差别性增强(DRO) - 增強非欲消除行為之外的任何其他行為,例如想讓小朋友減少現電腦遊戲則可改為增加他温習的鼓勵。
    3. 低反应率差别性增强(DRL) - 只增強出現頻率低(較少出現)的行為,例如想讓小朋友安靜下來就獎勵小朋友由每隔2小時至每隔4小時才大聲叫囂。對應高反应率差别性增强(DRH)
    4. 交替行为的差别性增强(DRA) - 將增强物用在較為認可的行為,而不是欲消除的行為上。例如老師將更多的注意力放在坐著的學生,而不是在課堂上說話的學生(假設老師的注意力是一種增強)。
  4. 無條件增强(Noncontingent reinforcement):不用要求要先做甚麼都能得到回報[8]。例如老師每隔一回就關心一下其自閉症學生,不用學生做甚麽就有更大機會減少學生的問題[9]
  5. Time-out (parenting)英语Time-out (parenting)(Time-out):類似負向懲罰當目標出現不想要的行為,將其帶離其原本愉快環境,如另一間沒人的房間[10]

其他增強用語

  • 增强物選樣 - 將一個與先前行為無關的潛在但不熟悉的刺激用在動物身上。之後這個刺激將會更加有效的進行增強。
  • 群體增强 - 影響許多種類的管道,且與其他增強產生交互作用。
  • 滿足感 - 对於已经被增强的某些行为,刺激將不再起相同的作用。例如食物的味道對已經餵飽的對象是較弱的增強。

增强计划

  • 固定时距增强(Fixed interval schedule),例子:每月奖金制度。
  • 固定比率增强(Fixed ratio schedule),例子:按销量核算佣金收入。
  • 变动时距增强(Variable interval schedule),例子:升迁制度。
  • 变动比率增强(Variable ratio schedule),例子:按绩效考核的特别奖项或收入。

簡寫

簡號 代表
SC conditioned stimulus
Sd discriminative stimulus

只有某行為出現才提供增強物

Sr 增強物 (reinforcing stimulus)
R 反應 (response)
A:B → C A(如籠子、噪音)準備行為B,帶來後果C

增強程序

各種增強項目的不同反应行為比率,以支線標示各個特定增強物。

當動物所處環境中夠多的變因被減少或是被控制時,他們在增強後的行為型態將明顯的能夠被預測。甚至當增強的速率適應於特定方法時,非常複雜的行為也能夠被預測。增強程序是用來測定將被增強的反應(特定行為的單獨出現)的計畫。有兩種極端情況,一種是連續增強,指增強所有反應;另一種是消弱,指沒有反應被增強。

其他的程序包括:

  • 固定比率(FR) - 每固定次數反應都被增強,如每20個反應提供老鼠一個小食,或者工人每做100件門鉸就有$500。
  • 固定間隔(FI) - 從訓練開始或先前一個增強之後經過特定時間長度之後增強,假設在這段期間至少有一次反應出現,如每月的薪金。
  • 變化比率(VR) - 在不同的反應次數增強,有一個大約的平均值,例如老虎機不知道中獎機會[11]
  • 變化間隔(VI) - 在經過一段不固定的時間之後增強,有一個大約的平均值,並假設在這段期間至少有一次反應。例如查看郵箱,不知道何時會有重要的信件或垃圾郵件,因為無法預測,所以會產生一個穩定的檢查行為。

比率程序能夠比間隔程序產生更高的反應頻率。變化程序也比固定程序產生更高的反應頻率。變化比率程序產生較高的反應頻率,且對消弱有較大的抵抗力,賭博是變化比率程序最有代表性的例子。在固定比率程序中,在增強之後會有一段反應暫停時間,稱為後增強暫停,在圖表上呈階梯狀。固定間隔程序也有後增強暫停,但是在圖表上呈現的是扇型。由於在已消逝的時間並沒有增強刺激,因此對象學會了以平緩的速率反應。如果生物個體是一個固定比率程序的對象,會有一個爲獲得增強的行為的次數的瞬間增加,然後生物個體被觀察到在增強來到之前有一段周期性的暫停。這種現象被稱為比率彎曲,對照在圖形上的順序為後增強暫停、比率上升、增強。

不完全的增強程序

考慮消弱的影響,不完全的增強程序比起連續性的增強程序有較大的抵抗力,這種現象稱作不完全增強消弱效應(Partial reinforcement extinction effect、PREE)。比率程序則比間隔程序更具抵抗力[12],而變化程序也比固定程序更有抵抗力。原因如下:

  1. discrimination hypothesis:不能輕易分出該行為才會有反應(如贏錢)[13]
  2. frustration hypothesis:像失敗乃成功之母,必須持續進行某行為才能最終得到獎勵。而減少挫折的感覺變成增強賭徒繼續去賭的原因,不再太關乎有否賺錢。
  3. sequential hypothesis:一開始有大量成功的經驗(如贏錢),即使之後明顯少了成功仍繼續會
  4. response unit hypothesis:其實根本沒有不完全的增強程序,只是回應單位的分別(如1單位可以是10單位反應,也可以100單位反應)

同時幾個增強程序

併行程序(concurrent schedule)指多個增強程序同時存在,程序間有不同的反應與增強物。試想像一個人在家庭與事業之間要取得平衡,當他投放更多精力在其中一樣會有相應的正面回報(如維繫更多時間在家庭上則與家人關係更好,或專攻事業就有更多財政回報)。在Matching law英语Matching law中,當面對同時 (concurrent schedule)多個可行的選擇時的可能反應(自由意志),如實驗中白鴿要去按兩個其中一個按鈕,但按多久而帶來食物都不同[14]。這個方程就是用來評估反應的偏好。這也可以預測小孩與父母的較量[15]

影響增強程序因素

某些因子的增加和減少,能夠改變增強懲罰刺激的效果。這些因子包括對刺激的滿足感(satiation)、產生刺激的立即性(immediacy)、和行為對刺激的附帶性(contingency),以及刺激的大小(size)。

  1. 增強物的大小或數量:一般越多越容易增強某行為。一個刺激的效果也與"成本效益"有關,刺激的數量或是大小若是足夠,對行為的刺激效果較大。例如特別龐大的樂透獎金,將使人願意付出金錢和時間去購買彩券,如果獎金很少,可能不足以使人特地開車出門購買彩券。需要注意的是,在樂透的例子中除了獎金之外也存在懲罰(花費時間和金錢),行為是否表現,取決於增強和懲罰是否達到平衡。或某人給予$1000與$1去要求別人做事,正常來說前者會吸引(重賞之下必有勇夫)。這些改變效果的因子大多有生物學上的理由。生物個體的體內恆定可以用來解釋滿足感,例如生物個體需要補充類的時候,則糖的甜味會成為一個增強刺激;當生物體內的血糖濃度升高,甜味的刺激效果就會降低,甚至產生厭惡感。
  2. 附帶性:如果一個刺激並非總是伴隨在行為之後,則刺激的效果將減少;如果一個刺激確實的附帶在每一次行為之後,刺激的效果較大。例如當一位學生習慣遲到,而對於遲到的處罰是偶然性的,並非每次遲到都會處罰,則處罰的效果不如每次遲到都處罰的效果。
  3. 增強延遲:個體進行一個行為過後,刺激回饋的立即性[16],會影響刺激的效果。行為與刺激的間隔愈短,效果愈大。例如一位在公路上超速的駕駛,若在一周之後才收到罰單,那麼此罰單的效果將不如警察立即攔阻開罰單的效果。或要工作多久才會成功變得富有。
  4. 回應難度:如多容易就可以得到金錢
  5. Behavioral momentum:習慣了經常有獎勵後會較大機會做該反應。如退休後仍繼續工作[17]。或者在戒毒治療方面,戒毒人士得容易會復發再吸毒,因為舊有藥物的帶來的增強效果而令更難改變行為[18]
  6. Contingency-Shaped vs. Rule-Governed Behavior:一些已知的規則比起偶然發生的事難改變行為。例如小朋友在文法書上學習英文會比直接從外國人身上學英文難[19]。或者預先的指示會影響人們如何回應[20][21]
  7. 增強歷史:有過去經驗而對比到未來會如何 (behavioural contrast)。如預計未來會有錢而努力工作 (positive contrast),或者經常發夢未來會變成富翁而現在懶散不工作 (negative contrast)。
  8. 滿足感 - 也可稱為厭膩感。刺激的效果與動物個體對該刺激的"胃口"有關,個體對刺激的慾望愈大,刺激的效果也愈大;如果某動物個體已經對某個刺激感到滿足或是厭膩,那麼該刺激將不再有效果。例如食物對一隻已經被餵飽的狗,鼓勵的效果很小。

立即性和附帶性能夠以神經化學來解釋,當生物個體受到增強刺激,則大腦中的多巴胺通道將被活化,這些通道組成的網路"釋放短暫的多巴胺脈衝到許多樹突,因此散發增強刺激訊號到突觸後神經元[22]。造成剛被活化的的突觸對輸出訊號的感應加強,因此造成增強刺激之前的行為的出現機率增加。在統計學上顯示對行為的增強刺激成功。然而當增強刺激的立即性和附帶性減少,多巴胺對突觸的影響能力也會減少。

增強物類型與作用

  • 非制約增强物 - 有时称为初級增强物 (primary reinforcer),以天生固有 (inherited) 的增強,作為一個刺激或狀態,通常具有生物學上的理由(如食物睡眠机会)。
  • 制約增强物 - 有时称为次級增强物 (secondary reinforcer),一種需要與非制約增強物或更早成型的制約增強物(如金錢)許多次的同時出現的刺激或狀態。在古典制約中,稱為二級制約,如「稱讚」 。
  • 普通增强物 (generalized reinforcer) - 一種過去曾与其他許多增强物同時出現的制約增强物(如金钱)。

這些增強物主要用來

  1. 增加增強價值,如更渴求該獎賞
  2. 提供訊息,代表該回應是應做的,如白鴿在實驗中完成指定動後有相應顏色的小燈閃耀
  3. 標記(marking),突出該回應是意義的,例如給小朋友一個小貼紙
  4. 連結(bridging),讓回應與獎賞更易連結起來

塑型

塑型(Shaping)影響了增強的成功,增加訓練者所要求的精確的近似反應。例如爲了訓練一隻老鼠按下槓桿,可將身體轉向槓桿作為第一個步驟,並增強這個動作。在訓練過程中,對象的所增強的行為會愈來愈接近訓練者的要求[23]。譬如跑步選手最初訓練只有0.4個單位速度,第二次去到0.8個單位速度,第三次0.7,第四次有0.6,第五次0.9⋯⋯不斷訓練後最終有1個單位速度。在改變病患行為也有應用,好像一個有嚴重呼吸病的8歲兒童只肯戴上口罩只有5秒,在不斷鼓勵下,他最終戴上了40秒[24]

連鎖

連鎖將分散的幾個行為連結成一個系列(塑型只處理一個行為),每一個行為造成的結果,都是對上一個行為的增強,與對下一個行為的刺激。有許多連鎖的教導方式,如前進連鎖,從連鎖的第一個行為開始;後退連鎖,從最後一個連鎖開始;與全作業連鎖(total task chaining),將所有的行為從頭到尾教完,而不是以一系列的步驟。以打開一個被鎖的門為例,首先將鑰匙插入,然後轉動,然後門打開。完成前一個要求,能作差別性刺激物(Sd)來讓目標知道自己完成該步驟。

三者差異如下:

  • 前進連鎖 - 將首先教導對象首先插入鑰匙,直到這個動作熟練。之後對象會被要求插入鑰匙,並教導轉動鑰匙,直到轉動的動作熟練。然後教導將門打開。
  • 後退連鎖 - 訓練者先自己插入並轉動鑰匙,然後再教導對象開門。當開門動作熟練,訓練者自己插入鑰匙,並教導對象轉動鑰匙,然後對象開門。最後教導對象插入鑰匙,並由他們自己轉動和開門,第一個動作學會的時候,所有的動作都學會了。
  • 全作業連鎖 - 將所有步驟作為單一系列來教學,在每個步驟中提示對象,並在熟練的過程中同時減少提示。

爭議

增強的理論被批評為循環論證。爭論點在於這種循環定義: “增強物是造成增強效果的東西,而有增強效果的東西是增強物。”而薛菲爾德(F. D. Sheffield)建議定義改為“附帶在反應上的完成行為(consummatory behavior contingent on a response)”,但這種定義尚未被心理學廣泛使用。

历史

1920年代俄国心理学家伊万·巴甫洛夫可能是首先在行為方面使用“增強”一詞的人,但是他保守地使用俄語中近似的词语,且用这一词语來指強化一個已學習但較弱的的反應。他的这一用法與今天選擇並強化新行為的意義不同。巴甫洛夫也使用了俄語中的消弱(extinction)一词作近似於現今的使用。

在一般大眾的使用中,正向增強經常當作報償的同义词來使用,且針對人而不是行為。負向增強則經常被一般人,甚至非心理學領域的社會學者用來指懲罰。雖然與專業上的用法不同,但是斯金納在他1938年的書中如此使用该词语首开先河。在1953年,他才跟隨其他人,減少了厭惡刺激的含义的使用。

實驗工具

  • Operant conditioning chamber英语Operant conditioning chamber
    Skinner box。目標動物按了紅制後會有食物。也可以用噪音或電擊影響動物反應
  • Shuttle boxes,一個實驗箱子分成兩個房間,其中一間地面會通電,目標要學會離開 (shuttling) 原本房間來避免電擊[25][26]
  • Cumulative recorder,一種用來記錄目標學習曲線,例如老鼠每按一次槓桿 (level-pressing)或者鴿子啄向按鈕時,像地震儀般的機器上的筆會移動,從而記錄軌跡[27][28],並記錄何時提供增加物[29]

應用

  • 代幣酬賞制 (token economy):如當病患保持良好行為就給予或交換其想要的東西[30]。例如戒煙者可以透過網上定期上載其沒有吸煙的證據來獲得一些代用券[31]
  • Contingent contract英语Contingent contract:透過互給對方條件來解決婚姻關係問題,好像幫對方做一些事 (lists the duties) 就可以有甚麼回報或特權[32],來改善夫婦間關係,也能知道對方需要甚麽[33]。這也是種認知行為療法 (CBT),讓到雙方討論出問題所在。
  • 自閉症兒童行為訓練[34][35]中的應用行為分析 (ABA, Applied behavior analysis),如治療師用手指著自己的口,以提示(prompt)來讓目標做更多社交溝通行為後,再以消退(fading)減少此類提示,改以簡單的碰一碰患者的面[36]

参见

参考文獻

引用來源

  1. ^ Edward Lee Thorndike. Virginia Tech Northern Virginia Center. [2011-03-06]. (原始内容存档于2011-10-11). 
  2. ^ 2.0 2.1 Flora, Stephen. The Power of Reinforcement. Albany: State University of New York Press. 2004. 
  3. ^ Grawitch, Matt. Are We Stressing Out Our Kids?. PsycEXTRA Dataset. 2008 [2019-03-22]. 
  4. ^ Differential Reinforcement - Special Learning Article. special-learning.com. [2019-03-22] (英语). 
  5. ^ Repp, Alan C.; Deitz, Diane E. D. Mental Retardation. Handbook of Child Psychopathology. Boston, MA: Springer US. 1983: 97–122. ISBN 9781461571384. 
  6. ^ Differential reinforcement. Autism Hub and Reading Centre. [2019-03-22] (英语). 
  7. ^ Donnelly, David R.; Olczak, Paul V. The Effect of Differential Reinforcement of Incompatible Behaviors (DRI) on Pica for Cigarettes in Persons with Intellectual Disability. Behavior Modification. 1990-01, 14 (1): 81–96. ISSN 0145-4455. doi:10.1177/01454455900141006. 
  8. ^ Lalli, J S; Casey, S D; Kates, K. Noncontingent reinforcement as treatment for severe problem behavior: some procedural variations.. Journal of Applied Behavior Analysis. 1997, 30 (1): 127–137. ISSN 0021-8855. PMC PMCPMC1284026可免费查阅 请检查|pmc=值 (帮助). PMID 9103988. doi:10.1901/jaba.1997.30-127. 
  9. ^ Krasno, Anna M. Noncontingent Reinforcement (NCI). Volkmar, Fred R. (编). Encyclopedia of Autism Spectrum Disorders. New York, NY: Springer New York. 2013: 2034–2034. ISBN 9781441916983. doi:10.1007/978-1-4419-1698-3_126 (英语). 
  10. ^ Smith, Donald E. P. Is Isolation Room Time-Out a Punisher?. Behavioral Disorders. 1981-08, 6 (4): 247–256. ISSN 0198-7429. doi:10.1177/019874298100600407. 
  11. ^ Horsley, Rachel R.; Osborne, Matthew; Norman, Christine; Wells, Timothy. High-frequency gamblers show increased resistance to extinction following partial reinforcement. Behavioural Brain Research. 2012-04, 229 (2): 438–442. ISSN 0166-4328. doi:10.1016/j.bbr.2012.01.024. 
  12. ^ Mowrer, O. H.; Jones, H. Habit strength as a function of the pattern of reinforcement.. Journal of Experimental Psychology. 1945, 35 (4): 293–311. ISSN 0022-1015. doi:10.1037/h0056678. 
  13. ^ Horsley, Rachel R.; Osborne, Matthew; Norman, Christine; Wells, Timothy. High-frequency gamblers show increased resistance to extinction following partial reinforcement. Behavioural Brain Research. 2012-04, 229 (2): 438–442. ISSN 0166-4328. doi:10.1016/j.bbr.2012.01.024. 
  14. ^ Herrnstein, R. J. Relative and absolute strength of response as a function of frequency of reinforcement, 12. Journal of the Experimental Analysis of Behavior. 1961-07, 4 (3): 267–272. ISSN 0022-5002. doi:10.1901/jeab.1961.4-267. 
  15. ^ Snyder, James; Stoolmiller, Mike; Patterson, Gerald R.; Schrepferman, Lynn; Oeser, Jessica; Johnson, Kassy; Soetaert, Dana. The application of response allocation matching to understanding risk mechanisms in development: The case of young children's deviant talk and play, and risk for early-onset antisocial behavior.. The Behavior Analyst Today. 2004, 4 (4): 335–345. ISSN 1539-4352. doi:10.1037/h0100130. 
  16. ^ Haring, Marilyn J. Child Behavior Therapy: Principles, Procedures, and Empirical BasisChild Behavior Therapy: Principles, Procedures, and Empirical Basis, RossAlan O.McGraw-Hill, New York, 1981. Behavioral Disorders. 1982-11, 8 (1): 73–74. ISSN 0198-7429. doi:10.1177/019874298200800109. 
  17. ^ Nevin, John A. Response strength in multiple schedules. Journal of the Experimental Analysis of Behavior. 1974-05, 21 (3): 389–408. ISSN 0022-5002. PMC PMCPMC1333212可免费查阅 请检查|pmc=值 (帮助). PMID 16811752. doi:10.1901/jeab.1974.21-389. 
  18. ^ Podlesnik, Christopher A.; Shahan, Timothy A. Extinction, relapse, and behavioral momentum. Behavioural Processes. 2010-05, 84 (1): 400–411. ISSN 0376-6357. doi:10.1016/j.beproc.2010.02.001. 
  19. ^ Contingency-Shaped vs. Rule-Governed Behavior. Let's Learn ABA. 2017-12-09 [2019-03-22] (美国英语). 
  20. ^ Bentall, R. P.; Higson, P. J.; Lowe, C. F. Teaching Self-Instructions to Chronic Schizophrenic Patients: Efficacy and Generalization. Behavioural Psychotherapy. 1987-01, 15 (01): 58. ISSN 0141-3473. doi:10.1017/s0141347300010636. 
  21. ^ Catania, A. Charles; Matthews, Byron A.; Shimoff, Eliot. Instructed versus shaped human verbal behavior: Interactions with nonverbal responding. Journal of the Experimental Analysis of Behavior. 1982-11, 38 (3): 233–248. ISSN 0022-5002. doi:10.1901/jeab.1982.38-233. 
  22. ^ Schultz, Wolfram (1998). Predictive Reward Signal of Dopamine Neurons. The Journal of Neurophysiology, 80(1), 1-27.
  23. ^ Rachlin, Howard; Marx, Melvin H. Learning: Processes. The American Journal of Psychology. 1970-09, 83 (3): 452. ISSN 0002-9556. doi:10.2307/1420427. 
  24. ^ Hagopian, L P; Thompson, R H. Reinforcement of compliance with respiratory treatment in a child with cystic fibrosis.. Journal of Applied Behavior Analysis. 1999, 32 (2): 233–236. ISSN 0021-8855. doi:10.1901/jaba.1999.32-233. 
  25. ^ Shuttle Box. www.harvardapparatus.co.uk. [2019-03-22]. 
  26. ^ Stark, H.; Rothe, T.; Wagner, T.; Scheich, H. Learning a new behavioral strategy in the shuttle-box increases prefrontal dopamine. Neuroscience. 2004, 126 (1): 21–29. ISSN 0306-4522. PMID 15145070. doi:10.1016/j.neuroscience.2004.02.026. 
  27. ^ Todd McKerchar, Cumulative Recorder in Action, 2018-01-14 [2019-03-22] 
  28. ^ Cumulative record - Oxford Reference. www.oxfordreference.com. [2019-03-22] (英语). 
  29. ^ Lattal, Kennon A. Steps and pips in the history of the cumulative recorder.. Journal of the Experimental Analysis of Behavior. 2004-11, 82 (3): 329–355. ISSN 0022-5002. PMC PMCPMC1285015可免费查阅 请检查|pmc=值 (帮助). PMID 15693527. doi:10.1901/jeab.2004.82-329. 
  30. ^ Hackenberg, Timothy D. TOKEN REINFORCEMENT: A REVIEW AND ANALYSIS. Journal of the Experimental Analysis of Behavior. 2009-03, 91 (2): 257–286. ISSN 0022-5002. doi:10.1901/jeab.2009.91-257. 
  31. ^ Dallery, Jesse; Glenn, Irene M.; Raiff, Bethany R. An Internet-based abstinence reinforcement treatment for cigarette smoking. Drug and Alcohol Dependence. 2007-01-12, 86 (2-3): 230–238. ISSN 0376-8716. doi:10.1016/j.drugalcdep.2006.06.013. 
  32. ^ Follette, William C.; Jacobson, Neil S. Assessment and Treatment of Incompatible Marital Relationships. Compatible and Incompatible Relationships. New York, NY: Springer New York. 1985: 333–361. ISBN 9781461295389. 
  33. ^ Jacobson, Neil S. The maintenance of treatment gains following social learning-based marital therapy. Behavior Therapy. 1989, 20 (3): 325–336. ISSN 0005-7894. doi:10.1016/s0005-7894(89)80053-x. 
  34. ^ Lovaas, O. Ivar. Behavioral treatment and normal educational and intellectual functioning in young autistic children.. Journal of Consulting and Clinical Psychology. 1987, 55 (1): 3–9. ISSN 0022-006X. doi:10.1037//0022-006x.55.1.3. 
  35. ^ Ivar Lovaas:ABA之父與自閉症治療|黃怡/時間的秘密|獨立評論. 獨立評論@天下. [2019-03-22] (中文(臺灣)). 
  36. ^ Eric Larsson, Lovaas 1987 Study, 2016-01-28 [2019-03-22] 

外部連結