間歇性增強(Intermittent Reinforcement)
定義
- 提出者:B. F. Skinner(1957)系統研究;概念源自操作制約中的增強時制理論
- 所屬理論:行為主義 — 增強時制理論(Schedules of Reinforcement)
- 定義:不是每次行為都給予增強,而是不定時、不定次地給予增強。這種不可預測的回報模式會產生極高的行為反應率,且行為極難消退。在人際關係中,間歇性增強是創造心理依賴的核心機制。
核心機制
為什麼間歇性增強比持續增強更有力
| 增強模式 | 行為特徵 | 消退速度 | 例子 |
|---|---|---|---|
| 持續增強(CRF) | 穩定但中等的反應率 | 快(一旦停止增強,行為迅速消失) | 每次投幣都出飲料的販賣機 |
| 間歇性增強(VR) | 高且不穩定的反應率 | 極慢(即使長期沒有增強,仍持續行為) | 吃角子老虎機 |
關鍵原理:不可預測性(unpredictability)啟動多巴胺系統。大腦對不確定的獎勵比確定的獎勵產生更強的多巴胺反應(Schultz et al., 1997)。這不是意志力的問題,是神經化學層面的反應。
間歇性增強在人際關係中的運作
有時溫柔體貼(增強)→ 產生希望
有時冷漠殘忍(無增強/懲罰)→ 產生焦慮
焦慮時又突然溫柔(增強)→ 如釋重負 + 更強的依賴
結果:受害者不斷「賭」對方會回到好的那一面
自戀虐待循環中的間歇性增強
| 虐待循環階段 | 間歇性增強角色 | 受害者心理狀態 |
|---|---|---|
| 理想化(Idealize) | 大量正增強:讚美、關注、承諾 | 幸福感、依賴建立 |
| 貶低(Devalue) | 增強撤除 + 間歇性懲罰 | 困惑、自我懷疑、更努力討好 |
| 拋棄(Discard) | 完全撤除增強 | 戒斷反應、極度焦慮 |
| 回吸(Hoover) | 突然恢復增強 | 如釋重負、循環重啟 |
學術觀點:Dutton & Painter(1993)指出,間歇性增強結合權力不對等(power imbalance),是創傷連結(trauma bonding)形成的兩個核心條件。受害者不是「蠢」或「願意被虐」— 他們的大腦被一套強大的行為制約機制綁住了。
間歇性增強的其他應用場景
| 場景 | 機制 | 結果 |
|---|---|---|
| 賭博 | 不定時中獎(VR 時制) | 賭癮、無法停止 |
| 社群媒體 | 不定時獲得讚/留言 | 強迫性刷新 |
| 不穩定的主管 | 有時讚賞、有時暴怒 | 員工持續焦慮但不敢離開 |
| 若即若離的伴侶 | 有時親密、有時疏遠 | 過度投入、持續追求 |
🔍 如何觀察 / 如何實作
觀察信號:
- 當主管偶爾對你特別好(請你吃飯、公開讚美),你會覺得「其實他不是壞人」,然後忘記上次被當眾羞辱的事 — 這是間歇性增強在製造希望
- 當你不斷刷社群媒體,明知大部分時候都沒什麼新東西,但偶爾看到一則很有趣的貼文就停不下來,這是變動比率增強在驅動你的行為
- 當你在一段關係中覺得「他有時候真的很好」來合理化大部分時候的冷漠或傷害,注意:正是那個「有時候」讓你無法離開
實作練習:
- 回想一段讓你難以離開的關係(人際、職場、甚至跟某個 App 的關係)。列出「好的時刻」和「不好的時刻」的比例。如果不好的時刻明顯更多,但你仍然留下來,問自己:是這段關係真的值得,還是偶爾的好讓我產生了不成比例的希望?
- 觀察你手機上使用時間最長的 App,分析它的回報模式:它是每次使用都給你滿足(持續增強),還是偶爾才出現讓你覺得「值了」的內容(間歇性增強)?如果是後者,你的使用行為正在被設計過的增強時制維持
相關概念
- → Phase 1.6 操作制約 間歇性增強是操作制約中的變動比率增強時制
- → Phase 1.6 行為消退 間歇性增強產生的行為是最難消退的
- → Phase 5 自戀虐待循環 理想化—貶低—拋棄—回吸循環的行為機制基礎
- → Phase 2 創傷連結 Dutton & Painter 模型中間歇性增強是核心要素
- → Phase 1.5 習得性無助 長期間歇性增強可能最終導致習得性無助
💭 Think About This
「如果一台販賣機有時出飲料有時不出,你會一直投幣。如果一個人有時對你好有時對你壞,你會一直留下來。機制是一樣的。」
References
- Ferster, C. B., & Skinner, B. F. (1957). Schedules of Reinforcement. Appleton-Century-Crofts.
- Dutton, D. G., & Painter, S. (1993). The battered woman syndrome: Effects of severity and intermittency of abuse. American Journal of Orthopsychiatry, 63(4), 614-622.
- Schultz, W., Dayan, P., & Montague, P. R. (1997). A neural substrate of prediction and reward. Science, 275(5306), 1593-1599.
→ 上一篇:操作制約 → 下一篇:行為消退 — 不再回應,行為就會消失嗎
→ 回到 心理學學習筆記 Roadmap