本頁使用了標題或全文手工轉換

增強

維基百科,自由的百科全書
前往: 導覽搜尋

增強英語Reinforcement),或稱強化,是行為主義心理學中的一個重要概念,是關於理解和修正人的行為的一種學說。

科學研究發現,人類或動物為達到某種目的,會於所處的環境下採取特定行為;當這種行為帶來的某種反應或後果對他有利時, 這種行為就會在以後重複出現,而該結果就稱為「增強物」;反之亦然,當其行為會對他帶來不利時,這種行為就自然減弱或消失,個體對行為結果所產生的後續反應,就是以操作制約進行的。而由於「增強物」的適時出現,增加了個體以後在相同情形下重複這種行為的機率,這表示「增強物」對於個體的反應起了強化作用。此種強化作用,即稱之為「增強」。

「增強」這一概念的提出源於美國心理學家愛德華·桑代克,後經約翰·布羅德斯·華生克拉克·L·赫爾等人的發展、修訂,到新行為主義代表人物伯爾赫斯·弗雷德里克·斯金納達到了一定的理論高度並發揚光大。他們都認為強化作用是決定人和動物所作所為的關鍵因素,並可以用這種「正強化」或「負強化」的辦法來影響行為的後果,從而修正其行為。

理論發展[編輯]

美國心理學家、教育家愛德華·桑代克是第一個提出增強理論的學者。他首創迷箱實驗,將一隻餓貓放在封閉但設有開門機關的箱子里,食物放在箱子外作為脫逃的獎賞。在這個情境中,貓起初在箱子內亂碰亂撞,後來碰巧觸動了開門的機關,得以從箱子內逃出,吃到外面的魚。經過不斷重複試驗,貓打開門所需的時間變得愈來愈短;至最後「學習」完成時,只要把貓一放進箱子里,它就會表現出正確的反應。桑代克對此的結論是,「貓並沒有理智地推論出打開籠子出口與它拉動繩圈這二者之間的關係,而只是對繩圈這個刺繳形成了逐漸加強的拉繩圈反應。」

桑代克從這一實驗中,確立了「刺激(stimuli)—反應(responses)」兩者之間的聯結。這種聯結是通過學習過程建立、加強和組織起來的[1]。他以此為基礎,提出了 幾條學習規律,包括準備律(Law of readiness)、練習律(Law of exercise)和效果律(Law of effect),其中最著名的是效果律。

在對同一個情境作出的若干反應中,那些伴隨著或緊接著有使動物滿意的事態發生的反應,在其他條件相等的情況下,將於這個情境更加牢固地聯結起來……那些伴隨有或緊接著有使動物不適的事態發生的反應,在其他條件相等的情況下,與這個情境的聯結則削弱下去。
——愛德華·桑代克(1911)

桑代克於1898年發表的第一代效果律,引起了許多理論家的研究和廣泛的爭論,並指出了其漏洞,一些學者認為「滿意」、「不舒適」等字眼是主觀性的術語,不宜描述行為。在時間上遲來的結果對已屬過去的事實發生反作用,這不符合正常的因果律等。

桑代克和巴甫洛夫的工作幾乎是同時的,但又是各自獨立發現的。俄國心理學家伊萬·巴甫洛夫通過經典條件反射,發現條件刺激與帶有獎賞或懲罰的無條件刺激的多次配對,也可以使個體在單獨呈現條件刺激時,也能引發類似無條件反應的條件反應。例如,巴甫洛夫在研究消化現象時,觀察了狗的唾液分泌。他把食物顯示給狗,並測量其唾液分泌。由於狗對食物會自然產生分泌唾液的反應,這種反應是本能固有的,巴甫洛夫把這食物這種刺激稱為無條件刺激(Unconditioned stimulus),簡稱「UCS」;而而由於食物產生唾液的反應被稱為無條件反應(Unconditioned response),簡稱「UCR」。他發現,如果隨同食物反覆給一個條件刺激,即一個本來並不會自動引起唾液分泌的刺激,如鈴聲,狗就會逐漸「學會」在只有鈴聲但沒有食物的情況下分泌唾液。在這種情況下,鈴聲就成為了條件刺激(Conditioned stimulus),簡稱「CS」,鈴聲引起的唾液分泌就是條件反應(Conditioned response),簡稱「CR」。在巴甫洛夫的經典條件中,重要的是引起反應的刺激,反應之後的結果是沒有任何理論意義的。所以儘管巴甫洛夫和桑代克都在分析刺激與反應之間的聯繫,但他們的理論對形成這種聯繫的程序以及對學習過程的解釋是完全不同的。

巴甫洛夫於1902年發表其條件反射研究結果,但他可能是首先在行為方面使用"增強"一詞的學者。巴甫洛夫在用狗做實驗時,故意不給狗進食,使之保持飢餓狀態,這種飢餓刺激使狗保持對實驗環境的警覺。在條件刺激出現時或稍後呈現無條件刺激,這種無條件刺激的呈現起增強「學習」的作用,被巴甫洛夫稱為「增強」。但他保守的使用俄語中近似的詞彙,且用來指強化一個已學習但較弱的反應。他的用法與今天「選擇並強化新行為」的意義不盡相同。巴甫洛夫也使用了俄語中的「消退」(extinction,或稱消弱)一字來描述類似後來斯金納提出的負強化理論,即巴甫洛夫發現,當狗對鈴聲的條件作用建立以後,若使食物不再伴隨鈴聲出現,那麼狗對鈴聲作出的唾液分泌反應就會越來越弱,直到最後消失,這種情況即為「消退」。

增強的特性[編輯]

  • 有規律地出現在生物個體進行特定行為之後。
  • 與行為具有時間空間上的連續性。
  • 與可能以其他強度進行的行為的機率的增加有關。

例如:每當你的聽你的話坐下時,就給牠食物。如果狗變得在下指令時更願意聽話坐下,表示坐下已經被附帶的食物管理所增強。

需要注意的是被增強的是行為而不是狗。提供食物作為增強物強化坐下的行為,使坐下在類似情況下的出現更快或頻率更高。增強只能在回顧中被真正的確認。一個物體、項目、食物或其他增強物之所以成為增強物,只能在行為因增強物的控管後增加表現之後。

增強的研究已經產生擁有可重複性實驗結果的龐大體系。增強是行為實驗分析的核心概念和過程。

增強的類型[編輯]

行為的增強有2種類型:

  • 正向增強 - 在行為反應之後增加個體所喜愛的刺激所產生的強化作用,如給予食物、金錢等。
抓癢是一種負向增強
  • 負向增強 - 在行為反應之後減少個體所厭惡的刺激所產生的強化作用,如關掉令人痛苦的電流。負向增強有兩種,逃脫制約出現在令人厭惡的刺激剛出現,且行為終結它時。例如抓癢或按下鬧鐘的按鈕。迴避制約出現在一個為了避免出現厭惡刺激的行為時。例如爲了避免飢餓而進食,或是為了避開塞車而改變路徑。

正向增強和負向增強都有一個共同特點,就是都要使好的行為得到強化。此外,負向增強不能根除不良行為的發生。


行為表現頻率
增加 減少
正向 正向增強 正向懲罰(懲罰 I)
負向 負向增強 負向懲罰(懲罰 II)


辨別"正向"與"負向"是個重要的問題。舉例來說,對一個非常熱的房間而言,來自外界的氣流是正向的,因為它帶來了相對涼爽的空氣;但是它也同時是負向的,因為它帶走了原本的熱空氣。有一些增強物可以同時以正向和負向作控制,例如一個毒癮者以吸毒來增加興奮和擺脫戒毒症狀。另一個例子是進食,進食增加了愉悅感同時移除了飢餓的感覺。直到現在,許多行為心理學家以不帶對立性(Polarity)的增強和懲罰來包含所有的環境變化。

懲罰[編輯]

懲罰是動物所處環境中出現在特定的行為或反應之後,能夠減少往後行為出現的環境變化。與增強相同的是,被懲罰的是行為而不是動物本身。只有知道一個刺激對於行為出現頻率的效果時才能確知它是否為懲罰。

  • 正向懲罰 - 又稱第一型懲罰,實驗者在環境中增加令人厭惡的刺激,以對行為進行懲罰(如短暫電擊)。
  • 負向懲罰 - 又稱第二型懲罰,是將環境中的正向增強減少(如拿走食物盤)。

與增強一樣,辨認一個懲罰不經常需要提到它的正向或負向。

懲罰並非與增強相反的鏡像效應。在對實驗動物的實驗或是對孩童的研究中,懲罰是暫時性的減少先前對某行為的增強,且能夠產生其他的情緒行為(如鴿子拍動翅膀),以及生理改變(如心跳速度),並沒有明顯對等增強。

某些行為心理學家認為懲罰是一個 "初級過程" ,也就是完全獨立的學習現象,與增強有所區別。有些人認為它是負向增強的一種分類,創造任何一個造成迴避懲罰行為(甚至不作反應)的狀態可看成是一種增強。

"令人厭惡的刺激"、"懲罰物" 和 "懲罰刺激" 是同義字,懲罰能夠作為一個 "厭惡刺激" 、"任何懲罰性改變的出現" 或是 "實驗中一個特定行為被懲罰的部分" 。

其他增強用語[編輯]

  • 非制約增強物 - 有時稱為初級增強物,以天生固有的增強,作為一個刺激或狀態,通常具有生物學上的理由(如食物睡眠機會)。
  • 制約增強物 - 有時稱為次級增強物,一種需要與非制約增強物或更早成型的制約增強物(如金錢)許多次的同時出現的刺激或狀態。在古典制約中,稱為二級制約,如 "稱讚" 。
  • 普通增強物 - 一種過去曾與其他許多增強物同時出現的制約增強物(如金錢)。
  • 不相容行為的差別性增強(DRI) - 在沒有懲罰的情況下增強特殊的不相容行為(例如一個人不可能同時離開房間並在房間裡與某人打架),這種方法用來減少已經頻繁出現的行為。
  • 其他行為的差別性增強(DRO) - 增強非欲消除行為之外的任何其他行為。
  • 低反應率差別性增強(DRL) - 只增強出現頻率低的行為,例如 "你必須至少每10分鐘才能跟我要一片洋芋片,否則我就啥都不給你" 。
  • 交替行為的差別性增強(DRA) - 將增強物用在較為認可的行為,而不是欲消除的行為上。例如老師將更多的注意力放在坐著的學生,而不是在課堂上說話的學生(假設老師的注意力是一種增強)。
  • 增強物選樣 - 將一個與先前行為無關的潛在但不熟悉的刺激用在動物身上。之後這個刺激將會更加有效的進行增強。
  • 群體增強 - 影響許多種類的管道,且與其他增強產生交互作用。
  • 滿足感 - 對於已經被增強的某些行為,刺激將不再起相同的作用。例如食物的味道對已經餵飽的對象是較弱的增強。

增強計劃[編輯]

  • 固定時距增強(Fixed interval schedule),例子:每月獎金制度。
  • 固定比率增強(Fixed ratio schedule),例子:按銷量核算傭金收入。
  • 變動時距增強(Variable interval schedule),例子:升遷制度。
  • 變動比率增強(Variable ratio schedule),例子:按績效考核的特別獎項或收入。

增強程序[編輯]

各種增強項目的不同反應行為比率,以支線標示各個特定增強物。

當動物所處環境中夠多的變因被減少或是被控制時,他們在增強後的行為型態將明顯的能夠被預測。甚至當增強的速率適應於特定方法時,非常複雜的行為也能夠被預測。增強程序是用來測定將被增強的反應(特定行為的單獨出現)的計畫。有兩種極端情況,一種是連續增強,指增強所有反應;另一種是消弱,指沒有反應被增強。

其他的程序包括:

  • 固定比率(FR) - 每固定次數反應都被增強。
  • 固定間隔(FI) - 從訓練開始或先前一個增強之後經過特定時間長度之後增強,假設在這段期間至少有一次反應出現。
  • 變化比率(VR) - 在不同的反應次數增強,有一個大約的平均值。
  • 變化間隔(VI) - 在經過一段不固定的時間之後增強,有一個大約的平均值,並假設在這段期間至少有一次反應。

比率程序能夠比間隔程序產生更高的反應頻率。變化程序也比固定程序產生更高的反應頻率。變化比率程序產生較高的反應頻率,且對消弱有較大的抵抗力,賭博是變化比率程序最有代表性的例子。在固定比率程序中,在增強之後會有一段反應暫停時間,稱為後增強暫停,在圖表上呈階梯狀。固定間隔程序也有後增強暫停,但是在圖表上呈現的是扇型。由於在已消逝的時間並沒有增強刺激,因此對象學會了以平緩的速率反應。如果生物個體是一個固定比率程序的對象,會有一個爲獲得增強的行為的次數的瞬間增加,然後生物個體被觀察到在增強來到之前有一段周期性的暫停。這種現象被稱為比率彎曲,對照在圖形上的順序為後增強暫停、比率上升、增強。

考慮消弱的影響,不完全的增強程序比起連續性的增強程序有較大的抵抗力,這種現象稱作不完全增強消弱效應(Partial reinforcement extinction effect、PREE)。比率程序則比間隔程序更具抵抗力,而變化程序也比固定程序更有抵抗力。

塑型[編輯]

塑型(Shaping)影響了增強的成功,增加訓練者所要求的精確的近似反應。例如爲了訓練一隻老鼠按下槓桿,可將身體轉向槓桿作為第一個步驟,並增強這個動作。在訓練過程中,對象的被增強的行為會愈來愈接近訓練者的要求。

連鎖[編輯]

連鎖將分散的行為連結成一個系列,每一個行為造成的結果,都是對上一個行為的增強,與對下一個行為的刺激。有許多連鎖的教導方式,如前進連鎖,從連鎖的第一個行為開始;後退連鎖,從最後一個連鎖開始;與全作業連鎖(total task chaining),將所有的行為從頭到尾教完,而不是以一系列的步驟。以打開一個被鎖的門為例,首先將鑰匙插入,然後轉動,然後門打開。

三者差異如下:

  • 前進連鎖 - 將首先教導對象首先插入鑰匙,直到這個動作熟練。之後對象會被要求插入鑰匙,並教導轉動鑰匙,直到轉動的動作熟練。然後教導將門打開。
  • 後退連鎖 - 訓練者先自己插入並轉動鑰匙,然後再教導對象開門。當開門動作熟練,訓練者自己插入鑰匙,並教導對象轉動鑰匙,然後對象開門。最後教導對象插入鑰匙,並由他們自己轉動和開門,第一個動作學會的時候,所有的動作都學會了。
  • 全作業連鎖 - 將所有步驟作為單一系列來教學,在每個步驟中提示對象,並在熟練的過程中同時減少提示。

爭議[編輯]

增強的理論被批評為循環論證。爭論點在於這種循環定義: "增強物是造成增強效果的東西,而有增強效果的東西是增強物" 。而薛菲爾德(F. D. Sheffield)建議定義改為"附帶在反應上的完成行為"(consummatory behavior contingent on a response),但這種定義尚未被心理學廣泛使用。

歷史[編輯]

1920年代俄國心理學家伊萬·巴甫洛夫可能是首先在行為方面使用"增強"一詞的人,但是他保守的使用俄語中近似的字,且用來指強化一個已學習但較弱的的反應。他的用法與今天選擇並強化新行為的意義不同。巴甫洛夫也使用了俄語中的消弱(extinction)一字作近似於現今的使用。

在一般大眾的使用中,正向增強經常當作報償的同意字來使用,且針對人而不是行為。負向增強則經常被一般人,甚至非心理學領域的社會學者用來指懲罰。雖然與專業上的用法不同,但是第一位這樣使用的人是斯金納,在他1938年的書中。1953年,才跟隨其他人以減少厭惡刺激的意義使用。

參考文獻[編輯]

  1. ^ Edward Lee Thorndike. Virginia Tech Northern Virginia Center. [2011-03-06]. 

外部連結[編輯]