間歇性增強(Intermittent Reinforcement)

定義

  • 提出者:B. F. Skinner(1957)系統研究;概念源自操作制約中的增強時制理論
  • 所屬理論:行為主義 — 增強時制理論(Schedules of Reinforcement)
  • 定義:不是每次行為都給予增強,而是不定時、不定次地給予增強。這種不可預測的回報模式會產生極高的行為反應率,且行為極難消退。在人際關係中,間歇性增強是創造心理依賴的核心機制。

核心機制

為什麼間歇性增強比持續增強更有力

增強模式行為特徵消退速度例子
持續增強(CRF)穩定但中等的反應率快(一旦停止增強,行為迅速消失)每次投幣都出飲料的販賣機
間歇性增強(VR)高且不穩定的反應率極慢(即使長期沒有增強,仍持續行為)吃角子老虎機

關鍵原理:不可預測性(unpredictability)啟動多巴胺系統。大腦對不確定的獎勵比確定的獎勵產生更強的多巴胺反應(Schultz et al., 1997)。這不是意志力的問題,是神經化學層面的反應。

間歇性增強在人際關係中的運作

有時溫柔體貼(增強)→ 產生希望
有時冷漠殘忍(無增強/懲罰)→ 產生焦慮
焦慮時又突然溫柔(增強)→ 如釋重負 + 更強的依賴

結果:受害者不斷「賭」對方會回到好的那一面

自戀虐待循環中的間歇性增強

虐待循環階段間歇性增強角色受害者心理狀態
理想化(Idealize)大量正增強:讚美、關注、承諾幸福感、依賴建立
貶低(Devalue)增強撤除 + 間歇性懲罰困惑、自我懷疑、更努力討好
拋棄(Discard)完全撤除增強戒斷反應、極度焦慮
回吸(Hoover)突然恢復增強如釋重負、循環重啟

學術觀點:Dutton & Painter(1993)指出,間歇性增強結合權力不對等(power imbalance),是創傷連結(trauma bonding)形成的兩個核心條件。受害者不是「蠢」或「願意被虐」— 他們的大腦被一套強大的行為制約機制綁住了。

間歇性增強的其他應用場景

場景機制結果
賭博不定時中獎(VR 時制)賭癮、無法停止
社群媒體不定時獲得讚/留言強迫性刷新
不穩定的主管有時讚賞、有時暴怒員工持續焦慮但不敢離開
若即若離的伴侶有時親密、有時疏遠過度投入、持續追求

🔍 如何觀察 / 如何實作

觀察信號:

  • 當主管偶爾對你特別好(請你吃飯、公開讚美),你會覺得「其實他不是壞人」,然後忘記上次被當眾羞辱的事 — 這是間歇性增強在製造希望
  • 當你不斷刷社群媒體,明知大部分時候都沒什麼新東西,但偶爾看到一則很有趣的貼文就停不下來,這是變動比率增強在驅動你的行為
  • 當你在一段關係中覺得「他有時候真的很好」來合理化大部分時候的冷漠或傷害,注意:正是那個「有時候」讓你無法離開

實作練習:

  • 回想一段讓你難以離開的關係(人際、職場、甚至跟某個 App 的關係)。列出「好的時刻」和「不好的時刻」的比例。如果不好的時刻明顯更多,但你仍然留下來,問自己:是這段關係真的值得,還是偶爾的好讓我產生了不成比例的希望?
  • 觀察你手機上使用時間最長的 App,分析它的回報模式:它是每次使用都給你滿足(持續增強),還是偶爾才出現讓你覺得「值了」的內容(間歇性增強)?如果是後者,你的使用行為正在被設計過的增強時制維持

相關概念

  • → Phase 1.6 操作制約 間歇性增強是操作制約中的變動比率增強時制
  • → Phase 1.6 行為消退 間歇性增強產生的行為是最難消退的
  • → Phase 5 自戀虐待循環 理想化—貶低—拋棄—回吸循環的行為機制基礎
  • → Phase 2 創傷連結 Dutton & Painter 模型中間歇性增強是核心要素
  • → Phase 1.5 習得性無助 長期間歇性增強可能最終導致習得性無助

💭 Think About This

「如果一台販賣機有時出飲料有時不出,你會一直投幣。如果一個人有時對你好有時對你壞,你會一直留下來。機制是一樣的。」

References

  • Ferster, C. B., & Skinner, B. F. (1957). Schedules of Reinforcement. Appleton-Century-Crofts.
  • Dutton, D. G., & Painter, S. (1993). The battered woman syndrome: Effects of severity and intermittency of abuse. American Journal of Orthopsychiatry, 63(4), 614-622.
  • Schultz, W., Dayan, P., & Montague, P. R. (1997). A neural substrate of prediction and reward. Science, 275(5306), 1593-1599.

→ 上一篇:操作制約 → 下一篇:行為消退 — 不再回應,行為就會消失嗎

→ 回到 心理學學習筆記 Roadmap