操作制約(Operant Conditioning)
定義
- 提出者:B. F. Skinner(1938);建立在 Edward Thorndike 效果律(Law of Effect, 1898)之上
- 所屬理論:行為主義(Behaviorism)— 激進行為主義(Radical Behaviorism)
- 定義:行為的頻率由其後果決定。帶來正面後果的行為會增加,帶來負面後果的行為會減少。與古典制約不同,操作制約關注的是「個體主動做出的行為」與「行為之後發生的事」之間的關係。
核心機制
四種後果類型
| 給予刺激(正) | 移除刺激(負) | |
|---|---|---|
| 增加行為(增強) | 正增強:給予愉快刺激 | 負增強:移除不愉快刺激 |
| 減少行為(懲罰) | 正懲罰:給予不愉快刺激 | 負懲罰:移除愉快刺激 |
具體例子
| 類型 | 英文 | 例子 |
|---|---|---|
| 正增強 | Positive Reinforcement | 完成工作 → 獲得獎金 → 更願意努力 |
| 負增強 | Negative Reinforcement | 吃止痛藥 → 頭痛消失 → 下次頭痛更快吃藥 |
| 正懲罰 | Positive Punishment | 遲到 → 被主管公開批評 → 不敢遲到 |
| 負懲罰 | Negative Punishment | 孩子打人 → 沒收玩具 → 攻擊行為減少 |
常見誤解:「負增強」不是懲罰。「負」指的是「移除」,「增強」指的是「行為增加」。移除痛苦也是一種獎勵。
增強時制(Schedules of Reinforcement)
| 時制 | 英文 | 規則 | 行為特徵 | 例子 |
|---|---|---|---|---|
| 固定比率 | Fixed Ratio (FR) | 每 N 次行為增強一次 | 高頻率、增強後短暫停頓 | 計件工資 |
| 變動比率 | Variable Ratio (VR) | 平均 N 次增強一次,但不固定 | 高頻率、極難消退 | 賭博、社群媒體刷新 |
| 固定時距 | Fixed Interval (FI) | 每隔固定時間增強一次 | 時間到之前行為加速 | 月薪(月底前加班) |
| 變動時距 | Variable Interval (VI) | 平均間隔增強一次,但不固定 | 穩定低頻率 | 主管不定時巡視 |
關鍵發現:變動比率時制(VR)產生最高且最抗消退的行為反應率(Ferster & Skinner, 1957)。這解釋了為什麼賭博和社群媒體令人上癮。
Skinner Box 實驗
Skinner 設計操作制約箱(Skinner Box),讓動物透過壓桿獲得食物或避免電擊,系統性觀察不同增強時制下的行為模式。這套方法後來成為行為分析的標準範式。
🔍 如何觀察 / 如何實作
觀察信號:
- 當你發現自己總是加班到很晚,回想一下:加班有沒有被主管讚賞過?如果有,那個讚賞就是正增強,你的加班行為正在被這個後果維持
- 當你為了避免被念而提前把事情做完(即使你不想做),這是負增強在運作 — 你的行為不是被獎勵驅動,而是被「移除不愉快」驅動
- 當你注意到孩子越哭鬧你越容易妥協,觀察一下:你的妥協行為被孩子的「停止哭鬧」(負增強)增強了,同時孩子的哭鬧行為被你的「妥協」(正增強)增強了。這是一個雙向的增強循環
實作練習:
- 選一個你想改變的習慣(好的或壞的),用操作制約的框架分析它:這個行為之後發生了什麼?是正增強(得到好的)、負增強(移除壞的)、還是避免了懲罰?找到維持行為的後果,才能找到改變的槓桿點
- 觀察你的工作環境中,什麼行為被增強(被讚賞、被升遷),什麼行為被懲罰(被忽視、被批評)。這些增強和懲罰的模式決定了團隊文化 — 不管公司嘴上說什麼價值觀
相關概念
- → Phase 1.6 古典制約 古典制約是被動的刺激—反應學習,操作制約是主動的行為—後果學習
- → Phase 1.6 間歇性增強 變動比率時制是間歇性增強的學術基礎
- → Phase 1.6 行為塑形 透過逐步增強接近目標的行為來教導複雜行為
- → Phase 5 操控手法 操控者有意或無意地使用增強與懲罰來控制他人行為
💭 Think About This
「你以為你是自由地做選擇,但回頭看看 — 哪些行為被獎勵了、哪些被懲罰了?你的『自由意志』可能只是後果的函數。」
References
- Skinner, B. F. (1938). The Behavior of Organisms: An Experimental Analysis. Appleton-Century.
- Ferster, C. B., & Skinner, B. F. (1957). Schedules of Reinforcement. Appleton-Century-Crofts.
- Thorndike, E. L. (1898). Animal intelligence: An experimental study of the associative processes in animals. Psychological Review Monograph Supplements, 2(4), i-109.
→ 上一篇:古典制約 → 下一篇:間歇性增強 — 為什麼不穩定的回報最令人上癮
→ 回到 心理學學習筆記 Roadmap