OpenClaw、Claude Code、OpenAI Codex 最近讓我更確定一件事:Agent 的戰場已經不是模型,而是入口
前提
排除
OpenClaw、Claude Code、OpenAI Codex 最近讓我更確定一件事:Agent 的戰場已經不是模型,而是入口
如果你最近一直看到 OpenClaw、Claude Code、OpenAI Codex、甚至 GitHub Agent HQ 這些名字,我的結論很直接:
下一階段 AI agent 的競爭,重點已經不只是「哪個模型更會寫 code」,而是「誰先卡進你已經在用的入口、工作流和治理層」。
這不是一句為了聳動而說的口號,而是我看完最近幾個產品方向之後更確定的一件事。
以前我們討論的是模型排行榜、推理能力、context window;現在更有決定性的問題變成:
- 這個 agent 是待在終端、編輯器、瀏覽器,還是直接進到 GitHub?
- 它能不能在你原本的流程裡被委派、被追蹤、被審查?
- 它能不能用你已經熟的通道跟你互動,而不是逼你學一個全新的操作入口?
如果這三個問題沒有解決,模型再強,也很容易變成 demo 很亮、採用很淺。
這篇的前提
- 你關注的是開發工作流或 AI agent 產品方向,不是單純看模型 benchmark。
- 你在意的是「接下來一年哪些產品比較可能留下來」,而不是「今天哪個 demo 最驚艷」。
- 你接受:OpenClaw、Claude Code、Codex 並不是完全同一類產品,但它們正在搶同一件事:成為你工作的預設 agent 入口。
反方條件:什麼情況下這篇不適用
- 如果你是純個人重度玩家,而且每天都願意手動切工具、改 prompt、搬 context,那模型能力本身仍然可能比入口更重要。
- 如果你的需求只是「幫我補全幾行程式」或「陪我 pair programming」,那你未必需要把事情上升到 agent platform。
- 如果你看的只是「哪個 coding agent 寫出的 patch 比較強」,那這篇的觀察角度會比你要的更偏市場與工作流。
為什麼我現在會這樣看:最近幾個訊號其實很一致
我先把時間線攤開來看,你就比較容易理解我為什麼會下這個判斷。
訊號 1:OpenAI 先把 agent 當成平台能力做出來
OpenAI 在 2025 年 3 月推出「New tools for building agents」,重點不是再發一個聊天模型,而是把 agent 所需的底層積木直接產品化:Responses API、內建 web search / file search / computer use、以及 Agents SDK,外加 tracing 和 observability。
這代表 OpenAI 想吃的,不只是「模型被呼叫」這一層,而是整個 agent orchestration stack。
它在公告裡講得很明白:agent 是「能代表使用者獨立完成任務的系統」,而真正的問題不是模型不夠強,而是開發者把能力變成 production-ready agent 很難。這個說法很重要,因為它把競爭重心從「回答得更聰明」移到「任務流程能不能被可靠地串起來」。
訊號 2:Claude Code 從 terminal 工具,往雲端委派介面擴張
Anthropic 在 2025 年 10 月推出 Claude Code on the web,核心訊號也不是「Claude 又更會寫 code 了」,而是:
- 你可以直接從瀏覽器委派 coding task
- 多個任務可以平行跑
- 每個 session 在獨立環境執行
- 可以即時追蹤進度
- 可以直接產生 PR
這其實是在改變開發者和 agent 的關係。
它不再只是「我坐在 terminal 前跟 agent 互動」,而是開始變成「我把一個工作包交出去,它在雲端跑完,我回來 review 結果」。
也就是說,Claude Code 想搶的不是單點編輯體驗,而是委派權。
訊號 3:Codex 不只做 CLI,而是把自己包成完整 agent 作業面
OpenAI 這一輪的 Codex 也很有意思。官方首頁寫得很直白:它是「Built to drive real engineering work」,能 end-to-end 完成 feature、refactor、migration。
更關鍵的是,OpenAI 沒把它只包裝成一個 terminal agent,而是一路往:
- multi-agent workflows
- built-in worktrees
- cloud environments
- automations
- the same agent everywhere you build
去擴。
這代表 Codex 想做的不是「又一個 CLI」,而是讓 agent 變成跨 app、編輯器、terminal、web 的同一個工作身份。
這跟傳統「我在這個 IDE 裡裝一個 AI 外掛」差非常多。
訊號 4:GitHub 直接把 Claude 和 Codex 吸進治理層
2026 年 2 月,GitHub 讓 Claude 和 Codex 進入 Agent HQ 公開預覽。這件事在我看來,影響甚至比單一模型更新還大。
因為 GitHub 在做的是:把不同供應商的 agent 變成 GitHub workflow 裡可被指派、可被審查、可被治理的角色。
官方說法很清楚:
- 你可以直接從 GitHub、GitHub Mobile、VS Code 開 agent session
- 可以把 issue 指派給 agent
- agent 會送 draft PR
- 討論、歷史、review 都留在 repo 裡
- 不需要額外再學一套新的 review 流程
這代表競爭開始往另一個層次移動:
誰能進到 repository-native workflow,誰就更接近組織級採用。
訊號 5:OpenClaw 把 agent 從「工具」往「日常入口」拉
最後是我覺得很多人容易低估的 OpenClaw。
OpenClaw 官方 README 對自己的定位不是 coding agent,而是:
你跑在自己裝置上的 personal AI assistant
而且它強調的不是 IDE 整合,而是它可以直接在你已經用的通道裡工作,例如:
- Telegram
- Slack
- Discord
- Google Chat
- Signal
- iMessage
- LINE
這個方向很值得注意。因為它在搶的不是「誰最會寫 patch」,而是誰是你第一個叫得到的 agent。
如果 Claude Code 和 Codex 在搶開發工作流的入口,OpenClaw 則是在搶「跨情境 personal control plane」的入口。
兩者表面上看起來不一樣,但底層邏輯其實很接近:先卡入口,再往內吃任務。
我的主張 1:入口比 benchmark 更能決定採用
很多人還在用 2024 年的視角看這一波產品,覺得核心問題是:
Claude 比 GPT 強嗎?Codex 比 Claude Code 強嗎?OpenClaw 可不可以取代 XXX?
但我覺得這個問題已經開始偏掉。
真正決定採用深度的,越來越像是:
- 你是從哪裡把 agent 叫出來?
- 你要不要搬運 context?
- 你做完之後,結果留在哪裡?
OpenClaw 的打法是「我去你已經在用的聊天通道找你」。
Claude Code 的打法是「我讓你在 terminal、IDE、web 都能委派我」。
Codex 的打法是「我把 app、editor、terminal、cloud 全部串成同一個 agent 身份」。
GitHub 的打法則更狠:「不管你用誰,我把 agent 變成 repo workflow 裡的一級公民。」
這種競爭不是傳統 SaaS 的「功能表對功能表」。
這更像是在搶:
誰是你工作流裡最少摩擦、最不需要切換上下文的那一層。
而一旦某個 agent 成為那一層,後面的模型、工具、權限、記憶、審查資料就會一起綁過去。
我的主張 2:Agent 產品的真正護城河,正在從模型轉向 runtime 和 control plane
第二個我越看越確定的觀察是:
Agent 的價值,不在它會回答,而在它能不能穩定完成一個有邊界的工作回圈。
所以你會看到最近大家都在補這些東西:
- isolated environment
- sandbox
- worktrees
- tracing
- observability
- PR generation
- validation tools
- review loop
- automations
這些東西以前很少是聊天產品的主角,現在卻變成主打。原因很簡單:
企業和團隊真正要買的,不是「一個聰明回覆」,而是「一個可以被交辦、被審查、被追責的執行單位」。
OpenAI 在 Agents SDK 強調 handoffs、guardrails、tracing。
Anthropic 在 Claude Code on the web 強調 isolated sandbox 和 secure proxy。
GitHub 在 Agent HQ 強調 policy、auditability、draft PR、同一套 review 流程。
這些都在說同一件事:
市場已經不滿足於 agent 會動,市場要的是 agent 可以放心交給它動。
這也是為什麼我會說,下一個勝負點不是純模型,而是 runtime + governance。
我的主張 3:未來一年最重要的,不是「最強單一 agent」,而是「可互換 agent + 固定工作流」
GitHub Agent HQ 讓我最在意的一點,是它把 Claude、Codex、Copilot 都放進同一個任務框架裡。
這個動作的長期意義很大,因為它暗示了一件事:
對很多團隊來說,真正要固定下來的,不是某個單一模型,而是工作流本身。
只要工作流固定了,例如:
- issue 指派
- session 日誌
- draft PR
- review comment
- audit
- repo policy
那底下跑的是 Claude、Codex,還是未來別家 agent,反而可以慢慢變成可替換層。
這對供應商來說不是好消息,因為模型會更容易被平台抽象化。
但對使用者和團隊來說,這反而是好消息,因為你不用每半年重建一次流程。
我甚至會更激進地說:
未來大多數團隊會先選 control plane,再選 agent;不是先選 agent,再勉強把流程配上去。
我願意承認的 trade-off
我不會假裝「模型已經不重要」。不是。
我承認幾件事:
- 在高難度重構、模糊需求、超長鏈推理上,模型能力差異仍然會很明顯。
- 個人開發者和小團隊,短期內仍然會先被「哪個 agent 真的比較好用」影響,而不是被治理層影響。
- OpenClaw 不是純 coding agent,所以不能用一條直線拿來和 Claude Code、Codex 做等值比較。
但即使承認這些,我還是會維持原判斷:
一旦 agent 開始從個人工具走向團隊工作流,入口、治理和 runtime 會比單純模型優勢更能累積長期優勢。
這會怎麼改變我們接下來的實際判斷?
如果你是個人開發者,我建議你不要再只問:
哪個 agent 最強?
你應該先問:
- 你最常在哪裡發起工作?
- 你想要的是「即時協作」還是「委派後回來審查」?
- 你能不能接受把歷史、權限、審查留在某個平台裡?
如果你是團隊或管理者,我會更建議你問這四題:
- 我們的 agent 工作紀錄留在哪裡?
- 誰能指派、誰能審查、誰能追蹤?
- 出錯時,我們能不能回溯它怎麼做決策?
- 如果半年後換模型,我們要不要整套流程重建?
你用這組問題去看最近的產品,就會發現畫面完全不一樣。
你不再只是看「功能多不多」,而是看它能不能成為你真正願意長期用的工作基礎設施。
最後結論
我現在對這一波產品的總結是:
OpenClaw 在證明,agent 可以先從日常通道成為你的預設入口。
Claude Code 在證明,coding agent 可以從互動式工具升級成可平行委派的執行層。
OpenAI Codex 在證明,agent 產品要往多介面、多代理、背景自動化擴張。
GitHub 在證明,真正的大戰場其實是把不同 agent 收進同一個治理與協作平面。
所以如果你問我,最近看 OpenClaw、Claude Code、OpenAI 這一串發展,我最確定的觀察是什麼?
我的答案會是:
Agent 的戰場已經不是單一模型,而是誰能成為你工作流裡最自然、最可控、最可審查的入口。
模型還是重要。
但接下來真正決定留下來的是:哪個 agent 不只會做事,還能被放心地放進真正的工作裡。
下一步怎麼做
- 如果你是個人開發者:先選一個「本地/即時協作」入口,再選一個「雲端/委派審查」入口,實際跑兩週,不要只看 demo。
- 如果你是團隊:先固定 review、audit、repo policy 這套工作流,再決定底下主要跑哪個 agent。
- 如果你在做 agent 產品:不要只拚模型效果,先想清楚你的入口、runtime、治理與可追蹤性要怎麼建立。
參考來源
-
OpenAI - New tools for building agents
https://openai.com/index/new-tools-for-building-agents(2025-03-11) -
OpenAI Developers - Codex CLI
https://developers.openai.com/codex/cli -
OpenAI - Codex
https://openai.com/codex/ -
Anthropic - Claude Code on the web
https://www.anthropic.com/news/claude-code-on-the-web(2025-10-20) -
GitHub Changelog - Claude and Codex coding agents are now in public preview
https://github.blog/changelog/2026-02-04-claude-and-codex-are-now-available-in-public-preview-on-github(2026-02-04) -
GitHub Blog - Pick your agent: Use Claude and Codex on Agent HQ
https://github.blog/news-insights/company-news/pick-your-agent-use-claude-and-codex-on-agent-hq/(2026-02-04) -
OpenClaw README
https://github.com/openclaw/openclaw