操作制約(Operant Conditioning)

定義

  • 提出者:B. F. Skinner(1938);建立在 Edward Thorndike 效果律(Law of Effect, 1898)之上
  • 所屬理論:行為主義(Behaviorism)— 激進行為主義(Radical Behaviorism)
  • 定義:行為的頻率由其後果決定。帶來正面後果的行為會增加,帶來負面後果的行為會減少。與古典制約不同,操作制約關注的是「個體主動做出的行為」與「行為之後發生的事」之間的關係。

核心機制

四種後果類型

給予刺激(正)移除刺激(負)
增加行為(增強)正增強:給予愉快刺激負增強:移除不愉快刺激
減少行為(懲罰)正懲罰:給予不愉快刺激負懲罰:移除愉快刺激

具體例子

類型英文例子
正增強Positive Reinforcement完成工作 → 獲得獎金 → 更願意努力
負增強Negative Reinforcement吃止痛藥 → 頭痛消失 → 下次頭痛更快吃藥
正懲罰Positive Punishment遲到 → 被主管公開批評 → 不敢遲到
負懲罰Negative Punishment孩子打人 → 沒收玩具 → 攻擊行為減少

常見誤解:「負增強」不是懲罰。「負」指的是「移除」,「增強」指的是「行為增加」。移除痛苦也是一種獎勵。

增強時制(Schedules of Reinforcement)

時制英文規則行為特徵例子
固定比率Fixed Ratio (FR)每 N 次行為增強一次高頻率、增強後短暫停頓計件工資
變動比率Variable Ratio (VR)平均 N 次增強一次,但不固定高頻率、極難消退賭博、社群媒體刷新
固定時距Fixed Interval (FI)每隔固定時間增強一次時間到之前行為加速月薪(月底前加班)
變動時距Variable Interval (VI)平均間隔增強一次,但不固定穩定低頻率主管不定時巡視

關鍵發現:變動比率時制(VR)產生最高且最抗消退的行為反應率(Ferster & Skinner, 1957)。這解釋了為什麼賭博和社群媒體令人上癮。

Skinner Box 實驗

Skinner 設計操作制約箱(Skinner Box),讓動物透過壓桿獲得食物或避免電擊,系統性觀察不同增強時制下的行為模式。這套方法後來成為行為分析的標準範式。

🔍 如何觀察 / 如何實作

觀察信號:

  • 當你發現自己總是加班到很晚,回想一下:加班有沒有被主管讚賞過?如果有,那個讚賞就是正增強,你的加班行為正在被這個後果維持
  • 當你為了避免被念而提前把事情做完(即使你不想做),這是負增強在運作 — 你的行為不是被獎勵驅動,而是被「移除不愉快」驅動
  • 當你注意到孩子越哭鬧你越容易妥協,觀察一下:你的妥協行為被孩子的「停止哭鬧」(負增強)增強了,同時孩子的哭鬧行為被你的「妥協」(正增強)增強了。這是一個雙向的增強循環

實作練習:

  • 選一個你想改變的習慣(好的或壞的),用操作制約的框架分析它:這個行為之後發生了什麼?是正增強(得到好的)、負增強(移除壞的)、還是避免了懲罰?找到維持行為的後果,才能找到改變的槓桿點
  • 觀察你的工作環境中,什麼行為被增強(被讚賞、被升遷),什麼行為被懲罰(被忽視、被批評)。這些增強和懲罰的模式決定了團隊文化 — 不管公司嘴上說什麼價值觀

相關概念

  • → Phase 1.6 古典制約 古典制約是被動的刺激—反應學習,操作制約是主動的行為—後果學習
  • → Phase 1.6 間歇性增強 變動比率時制是間歇性增強的學術基礎
  • → Phase 1.6 行為塑形 透過逐步增強接近目標的行為來教導複雜行為
  • → Phase 5 操控手法 操控者有意或無意地使用增強與懲罰來控制他人行為

💭 Think About This

「你以為你是自由地做選擇,但回頭看看 — 哪些行為被獎勵了、哪些被懲罰了?你的『自由意志』可能只是後果的函數。」

References

  • Skinner, B. F. (1938). The Behavior of Organisms: An Experimental Analysis. Appleton-Century.
  • Ferster, C. B., & Skinner, B. F. (1957). Schedules of Reinforcement. Appleton-Century-Crofts.
  • Thorndike, E. L. (1898). Animal intelligence: An experimental study of the associative processes in animals. Psychological Review Monograph Supplements, 2(4), i-109.

→ 上一篇:古典制約 → 下一篇:間歇性增強 — 為什麼不穩定的回報最令人上癮

→ 回到 心理學學習筆記 Roadmap