[ai/a09] 什麼是 AI Agent？從「會聊天」到「會做事」

cover

我每天早上九點起床，Discord 上已經有一份「世界新聞、台股、blog 流量」的整理報告——不是我做的，是我寫的 AI 自己跑去抓資料整理好的。這就是 Agent。

ChatGPT 跟 Agent 差在哪

你開 ChatGPT 問問題，它回答你。問完就結束。下次你再開一個視窗問，它什麼都不記得。這是一般的「對話 AI」。

Agent 不一樣。Agent 是把對話 AI 包裝成「會自己做事」的東西。你給它一個目標，它會自己拆解步驟、自己開瀏覽器、自己跑程式、過程中遇到問題自己想辦法、做完再回報結果給你。

差別大概像「會諮詢的顧問」跟「會執行的助理」。前者你問什麼答什麼，後者你給目標就交差。

我這幾個月在跑一個叫 OpenClaw 的開源框架（自架的，工程師才會碰），裡面有三個 agent，每個負責不同的事：

ops agent：每天 9:00、12:00、18:00 自己跑，幫我抓世界新聞、台股動態、Google Analytics 數據，整理好發到 Discord。

content agent：每天早上 10 點和下午 4 點跑，檢查我部落格的文章排程、Notion 審核 DB、有沒有讀者留言要處理。

main agent：日常雜務——回 Discord 訊息、跑一次性的任務、管理其他 agent。

這三個加起來，每天大概幫我省 1-2 小時的「我本來要自己滑網頁、開報表、追進度」的時間。最關鍵的是它們主動跑——我起床看 Discord 就知道全部狀況，不用主動去查。

回到「為什麼要 Agent」這個核心問題。Agent 解決三件 ChatGPT 做不到的事：

第一，多步驟任務。你叫 ChatGPT「幫我整理今天的世界新聞」，它頂多給你一份 prompt 模板叫你自己去 Google News 搜——它沒辦法真的開瀏覽器抓新聞。Agent 可以，它會自己開 Google News、讀標題、判斷重要性、整理成你要的格式。

第二，自動觸發。ChatGPT 要你主動問才有回應。Agent 可以設定「每天早上 9 點自己跑」，不需要你提醒它。對於每天/每週固定要做的事情特別有用。

第三，跨工具操作。要 ChatGPT 把資料從 Excel 搬到 Google Sheets 再寄一封信給主管？它做不到，它沒權限動你的工具。Agent 可以，因為它真的可以操作你的瀏覽器、檔案、寄信介面。

所以如果你的需求是「我希望 AI 不只給我建議，還能幫我把事情真的做完」——你要的是 agent，不是 ChatGPT。

Agent 這個概念其實不新，五年前研究圈就在玩了。但直到最近一兩年才能真的用，原因是 LLM 變強了——它現在已經聰明到「能自己判斷下一步該做什麼」。

以前的自動化都是「一條流程從頭走到尾」（IFTTT 那種 if-this-then-that），規則寫死，遇到沒預期到的狀況就斷了。Agent 不一樣，它在過程中即時判斷，遇到問題會找替代方案、會回頭重試、會跳過卡住的部分繼續做。

這也是為什麼 2024 年後突然多了一堆 agent 工具：因為基底的 LLM 終於夠用了。

a07 那篇講過我自己踩的坑——讓 Agent 自動投履歷，結果投到一些我根本沒印象的職缺。

這是 Agent 最大的風險：它幫你做事，但你不一定知道它做了什麼。

幾個基本原則，你之後不管用哪家 agent 都該記得：

你大概不會自己寫 agent（要工程能力），但你會用到 agent 包裝好的產品：

當你看到工具標榜「AI 自動幫你完成工作」，你應該知道它背後叫做 agent，知道它能做什麼、做不到什麼、風險在哪。

不要被「全自動 AI 助理」的行銷話術騙——目前的 agent 技術還很早期，需要你密切監督才能放心用。我自己跑了快一年，還是不敢把不可逆的操作完全交給它。

上一篇	下一篇
AI 會取代我的工作嗎？比取代更可怕的是被亂用	什麼是 Skill？給 AI 一本「你的 SOP」