操作制約（Operant Conditioning）

定義

提出者：B. F. Skinner（1938）；建立在 Edward Thorndike 效果律（Law of Effect, 1898）之上
所屬理論：行為主義（Behaviorism）— 激進行為主義（Radical Behaviorism）
定義：行為的頻率由其後果決定。帶來正面後果的行為會增加，帶來負面後果的行為會減少。與古典制約不同，操作制約關注的是「個體主動做出的行為」與「行為之後發生的事」之間的關係。

	給予刺激（正）	移除刺激（負）
增加行為（增強）	正增強：給予愉快刺激	負增強：移除不愉快刺激
減少行為（懲罰）	正懲罰：給予不愉快刺激	負懲罰：移除愉快刺激

常見誤解：「負增強」不是懲罰。「負」指的是「移除」，「增強」指的是「行為增加」。移除痛苦也是一種獎勵。

關鍵發現：變動比率時制（VR）產生最高且最抗消退的行為反應率（Ferster & Skinner, 1957）。這解釋了為什麼賭博和社群媒體令人上癮。

Skinner 設計操作制約箱（Skinner Box），讓動物透過壓桿獲得食物或避免電擊，系統性觀察不同增強時制下的行為模式。這套方法後來成為行為分析的標準範式。

觀察信號：

當你發現自己總是加班到很晚，回想一下：加班有沒有被主管讚賞過？如果有，那個讚賞就是正增強，你的加班行為正在被這個後果維持
當你為了避免被念而提前把事情做完（即使你不想做），這是負增強在運作 — 你的行為不是被獎勵驅動，而是被「移除不愉快」驅動
當你注意到孩子越哭鬧你越容易妥協，觀察一下：你的妥協行為被孩子的「停止哭鬧」（負增強）增強了，同時孩子的哭鬧行為被你的「妥協」（正增強）增強了。這是一個雙向的增強循環

實作練習：

選一個你想改變的習慣（好的或壞的），用操作制約的框架分析它：這個行為之後發生了什麼？是正增強（得到好的）、負增強（移除壞的）、還是避免了懲罰？找到維持行為的後果，才能找到改變的槓桿點
觀察你的工作環境中，什麼行為被增強（被讚賞、被升遷），什麼行為被懲罰（被忽視、被批評）。這些增強和懲罰的模式決定了團隊文化 — 不管公司嘴上說什麼價值觀

「你以為你是自由地做選擇，但回頭看看 — 哪些行為被獎勵了、哪些被懲罰了？你的『自由意志』可能只是後果的函數。」

Skinner, B. F. (1938). The Behavior of Organisms: An Experimental Analysis. Appleton-Century.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of Reinforcement. Appleton-Century-Crofts.
Thorndike, E. L. (1898). Animal intelligence: An experimental study of the associative processes in animals. Psychological Review Monograph Supplements, 2(4), i-109.

→ 上一篇：古典制約 → 下一篇：間歇性增強 — 為什麼不穩定的回報最令人上癮