cover

我每天早上九點起床,Discord 上已經有一份「世界新聞、台股、blog 流量」的整理報告——不是我做的,是我寫的 AI 自己跑去抓資料整理好的。這就是 Agent。

ChatGPT 跟 Agent 差在哪

你開 ChatGPT 問問題,它回答你。問完就結束。下次你再開一個視窗問,它什麼都不記得。這是一般的「對話 AI」。

Agent 不一樣。Agent 是把對話 AI 包裝成「會自己做事」的東西。你給它一個目標,它會自己拆解步驟、自己開瀏覽器、自己跑程式、過程中遇到問題自己想辦法、做完再回報結果給你。

差別大概像「會諮詢的顧問」跟「會執行的助理」。前者你問什麼答什麼,後者你給目標就交差。


我自己的三個 Agent

我這幾個月在跑一個叫 OpenClaw 的開源框架(自架的,工程師才會碰),裡面有三個 agent,每個負責不同的事:

ops agent:每天 9:00、12:00、18:00 自己跑,幫我抓世界新聞、台股動態、Google Analytics 數據,整理好發到 Discord。

content agent:每天早上 10 點和下午 4 點跑,檢查我部落格的文章排程、Notion 審核 DB、有沒有讀者留言要處理。

main agent:日常雜務——回 Discord 訊息、跑一次性的任務、管理其他 agent。

這三個加起來,每天大概幫我省 1-2 小時的「我本來要自己滑網頁、開報表、追進度」的時間。最關鍵的是它們主動跑——我起床看 Discord 就知道全部狀況,不用主動去查。


Agent 解決什麼問題?

回到「為什麼要 Agent」這個核心問題。Agent 解決三件 ChatGPT 做不到的事:

第一,多步驟任務。你叫 ChatGPT「幫我整理今天的世界新聞」,它頂多給你一份 prompt 模板叫你自己去 Google News 搜——它沒辦法真的開瀏覽器抓新聞。Agent 可以,它會自己開 Google News、讀標題、判斷重要性、整理成你要的格式。

第二,自動觸發。ChatGPT 要你主動問才有回應。Agent 可以設定「每天早上 9 點自己跑」,不需要你提醒它。對於每天/每週固定要做的事情特別有用。

第三,跨工具操作。要 ChatGPT 把資料從 Excel 搬到 Google Sheets 再寄一封信給主管?它做不到,它沒權限動你的工具。Agent 可以,因為它真的可以操作你的瀏覽器、檔案、寄信介面。

所以如果你的需求是「我希望 AI 不只給我建議,還能幫我把事情真的做完」——你要的是 agent,不是 ChatGPT。


為什麼現在才紅起來

Agent 這個概念其實不新,五年前研究圈就在玩了。但直到最近一兩年才能真的用,原因是 LLM 變強了——它現在已經聰明到「能自己判斷下一步該做什麼」。

以前的自動化都是「一條流程從頭走到尾」(IFTTT 那種 if-this-then-that),規則寫死,遇到沒預期到的狀況就斷了。Agent 不一樣,它在過程中即時判斷,遇到問題會找替代方案、會回頭重試、會跳過卡住的部分繼續做。

這也是為什麼 2024 年後突然多了一堆 agent 工具:因為基底的 LLM 終於夠用了。


但 Agent 有風險

a07 那篇講過我自己踩的坑——讓 Agent 自動投履歷,結果投到一些我根本沒印象的職缺。

這是 Agent 最大的風險:它幫你做事,但你不一定知道它做了什麼

幾個基本原則,你之後不管用哪家 agent 都該記得:

  • 重要的、不可逆的操作(寄信、付款、刪檔),最好設「人工確認」關卡
  • 給 Agent 的權限要明確劃(能讀什麼、能寫什麼、能對外做什麼)
  • 所有自動操作要有 log 可以回查
  • 從小範圍開始試,不要一上來就把整個工作流交出去

對非工程師的意義

你大概不會自己寫 agent(要工程能力),但你會用到 agent 包裝好的產品:

  • ChatGPT 的「Agent Mode」/「Operator」
  • Anthropic 的 Claude Code
  • 各種 SaaS 開始整合的「AI 助理」功能

當你看到工具標榜「AI 自動幫你完成工作」,你應該知道它背後叫做 agent,知道它能做什麼、做不到什麼、風險在哪。

不要被「全自動 AI 助理」的行銷話術騙——目前的 agent 技術還很早期,需要你密切監督才能放心用。我自己跑了快一年,還是不敢把不可逆的操作完全交給它。


系列導覽