OpenClaw、Claude Code、Codex 觀察：AI Agent 的戰場已從模型轉向入口與治理

OpenClaw、Claude Code、OpenAI Codex 最近讓我更確定一件事：Agent 的戰場已經不是模型，而是入口

如果你最近一直看到 OpenClaw、Claude Code、OpenAI Codex、甚至 GitHub Agent HQ 這些名字，我的結論很直接：

下一階段 AI agent 的競爭，重點已經不只是「哪個模型更會寫 code」，而是「誰先卡進你已經在用的入口、工作流和治理層」。

這不是一句為了聳動而說的口號，而是我看完最近幾個產品方向之後更確定的一件事。
以前我們討論的是模型排行榜、推理能力、context window；現在更有決定性的問題變成：

這個 agent 是待在終端、編輯器、瀏覽器，還是直接進到 GitHub？
它能不能在你原本的流程裡被委派、被追蹤、被審查？
它能不能用你已經熟的通道跟你互動，而不是逼你學一個全新的操作入口？

如果這三個問題沒有解決，模型再強，也很容易變成 demo 很亮、採用很淺。

這篇的前提

你關注的是開發工作流或 AI agent 產品方向，不是單純看模型 benchmark。
你在意的是「接下來一年哪些產品比較可能留下來」，而不是「今天哪個 demo 最驚艷」。
你接受：OpenClaw、Claude Code、Codex 並不是完全同一類產品，但它們正在搶同一件事：成為你工作的預設 agent 入口。

反方條件：什麼情況下這篇不適用

如果你是純個人重度玩家，而且每天都願意手動切工具、改 prompt、搬 context，那模型能力本身仍然可能比入口更重要。
如果你的需求只是「幫我補全幾行程式」或「陪我 pair programming」，那你未必需要把事情上升到 agent platform。
如果你看的只是「哪個 coding agent 寫出的 patch 比較強」，那這篇的觀察角度會比你要的更偏市場與工作流。

為什麼我現在會這樣看：最近幾個訊號其實很一致

我先把時間線攤開來看，你就比較容易理解我為什麼會下這個判斷。

訊號 1：OpenAI 先把 agent 當成平台能力做出來

OpenAI 在 2025 年 3 月推出「New tools for building agents」，重點不是再發一個聊天模型，而是把 agent 所需的底層積木直接產品化：Responses API、內建 web search / file search / computer use、以及 Agents SDK，外加 tracing 和 observability。
這代表 OpenAI 想吃的，不只是「模型被呼叫」這一層，而是整個 agent orchestration stack。

它在公告裡講得很明白：agent 是「能代表使用者獨立完成任務的系統」，而真正的問題不是模型不夠強，而是開發者把能力變成 production-ready agent 很難。這個說法很重要，因為它把競爭重心從「回答得更聰明」移到「任務流程能不能被可靠地串起來」。

訊號 2：Claude Code 從 terminal 工具，往雲端委派介面擴張

Anthropic 在 2025 年 10 月推出 Claude Code on the web，核心訊號也不是「Claude 又更會寫 code 了」，而是：

你可以直接從瀏覽器委派 coding task
多個任務可以平行跑
每個 session 在獨立環境執行
可以即時追蹤進度
可以直接產生 PR

這其實是在改變開發者和 agent 的關係。
它不再只是「我坐在 terminal 前跟 agent 互動」，而是開始變成「我把一個工作包交出去，它在雲端跑完，我回來 review 結果」。

也就是說，Claude Code 想搶的不是單點編輯體驗，而是委派權。

訊號 3：Codex 不只做 CLI，而是把自己包成完整 agent 作業面

OpenAI 這一輪的 Codex 也很有意思。官方首頁寫得很直白：它是「Built to drive real engineering work」，能 end-to-end 完成 feature、refactor、migration。
更關鍵的是，OpenAI 沒把它只包裝成一個 terminal agent，而是一路往：

multi-agent workflows
built-in worktrees
cloud environments
automations
the same agent everywhere you build

去擴。

這代表 Codex 想做的不是「又一個 CLI」，而是讓 agent 變成跨 app、編輯器、terminal、web 的同一個工作身份。
這跟傳統「我在這個 IDE 裡裝一個 AI 外掛」差非常多。

訊號 4：GitHub 直接把 Claude 和 Codex 吸進治理層

2026 年 2 月，GitHub 讓 Claude 和 Codex 進入 Agent HQ 公開預覽。這件事在我看來，影響甚至比單一模型更新還大。
因為 GitHub 在做的是：把不同供應商的 agent 變成 GitHub workflow 裡可被指派、可被審查、可被治理的角色。

官方說法很清楚：

你可以直接從 GitHub、GitHub Mobile、VS Code 開 agent session
可以把 issue 指派給 agent
agent 會送 draft PR
討論、歷史、review 都留在 repo 裡
不需要額外再學一套新的 review 流程

這代表競爭開始往另一個層次移動：
誰能進到 repository-native workflow，誰就更接近組織級採用。

訊號 5：OpenClaw 把 agent 從「工具」往「日常入口」拉

最後是我覺得很多人容易低估的 OpenClaw。
OpenClaw 官方 README 對自己的定位不是 coding agent，而是：

你跑在自己裝置上的 personal AI assistant

而且它強調的不是 IDE 整合，而是它可以直接在你已經用的通道裡工作，例如：

WhatsApp
Telegram
Slack
Discord
Google Chat
Signal
iMessage
LINE

這個方向很值得注意。因為它在搶的不是「誰最會寫 patch」，而是誰是你第一個叫得到的 agent。

如果 Claude Code 和 Codex 在搶開發工作流的入口，OpenClaw 則是在搶「跨情境 personal control plane」的入口。
兩者表面上看起來不一樣，但底層邏輯其實很接近：先卡入口，再往內吃任務。

我的主張 1：入口比 benchmark 更能決定採用

很多人還在用 2024 年的視角看這一波產品，覺得核心問題是：

Claude 比 GPT 強嗎？Codex 比 Claude Code 強嗎？OpenClaw 可不可以取代 XXX？

但我覺得這個問題已經開始偏掉。
真正決定採用深度的，越來越像是：

你是從哪裡把 agent 叫出來？
你要不要搬運 context？
你做完之後，結果留在哪裡？

OpenClaw 的打法是「我去你已經在用的聊天通道找你」。
Claude Code 的打法是「我讓你在 terminal、IDE、web 都能委派我」。
Codex 的打法是「我把 app、editor、terminal、cloud 全部串成同一個 agent 身份」。
GitHub 的打法則更狠：「不管你用誰，我把 agent 變成 repo workflow 裡的一級公民。」

這種競爭不是傳統 SaaS 的「功能表對功能表」。
這更像是在搶：

誰是你工作流裡最少摩擦、最不需要切換上下文的那一層。

而一旦某個 agent 成為那一層，後面的模型、工具、權限、記憶、審查資料就會一起綁過去。

我的主張 2：Agent 產品的真正護城河，正在從模型轉向 runtime 和 control plane

第二個我越看越確定的觀察是：
Agent 的價值，不在它會回答，而在它能不能穩定完成一個有邊界的工作回圈。

所以你會看到最近大家都在補這些東西：

isolated environment
sandbox
worktrees
tracing
observability
PR generation
validation tools
review loop
automations

這些東西以前很少是聊天產品的主角，現在卻變成主打。原因很簡單：

企業和團隊真正要買的，不是「一個聰明回覆」，而是「一個可以被交辦、被審查、被追責的執行單位」。

OpenAI 在 Agents SDK 強調 handoffs、guardrails、tracing。
Anthropic 在 Claude Code on the web 強調 isolated sandbox 和 secure proxy。
GitHub 在 Agent HQ 強調 policy、auditability、draft PR、同一套 review 流程。
這些都在說同一件事：

市場已經不滿足於 agent 會動，市場要的是 agent 可以放心交給它動。

這也是為什麼我會說，下一個勝負點不是純模型，而是 runtime + governance。

我的主張 3：未來一年最重要的，不是「最強單一 agent」，而是「可互換 agent + 固定工作流」

GitHub Agent HQ 讓我最在意的一點，是它把 Claude、Codex、Copilot 都放進同一個任務框架裡。
這個動作的長期意義很大，因為它暗示了一件事：

對很多團隊來說，真正要固定下來的，不是某個單一模型，而是工作流本身。

只要工作流固定了，例如：

issue 指派
session 日誌
draft PR
review comment
audit
repo policy

那底下跑的是 Claude、Codex，還是未來別家 agent，反而可以慢慢變成可替換層。

這對供應商來說不是好消息，因為模型會更容易被平台抽象化。
但對使用者和團隊來說，這反而是好消息，因為你不用每半年重建一次流程。

我甚至會更激進地說：
未來大多數團隊會先選 control plane，再選 agent；不是先選 agent，再勉強把流程配上去。

我願意承認的 trade-off

我不會假裝「模型已經不重要」。不是。

我承認幾件事：

在高難度重構、模糊需求、超長鏈推理上，模型能力差異仍然會很明顯。
個人開發者和小團隊，短期內仍然會先被「哪個 agent 真的比較好用」影響，而不是被治理層影響。
OpenClaw 不是純 coding agent，所以不能用一條直線拿來和 Claude Code、Codex 做等值比較。

但即使承認這些，我還是會維持原判斷：
一旦 agent 開始從個人工具走向團隊工作流，入口、治理和 runtime 會比單純模型優勢更能累積長期優勢。

這會怎麼改變我們接下來的實際判斷？

如果你是個人開發者，我建議你不要再只問：

哪個 agent 最強？

你應該先問：

你最常在哪裡發起工作？
你想要的是「即時協作」還是「委派後回來審查」？
你能不能接受把歷史、權限、審查留在某個平台裡？

如果你是團隊或管理者，我會更建議你問這四題：

我們的 agent 工作紀錄留在哪裡？
誰能指派、誰能審查、誰能追蹤？
出錯時，我們能不能回溯它怎麼做決策？
如果半年後換模型，我們要不要整套流程重建？

你用這組問題去看最近的產品，就會發現畫面完全不一樣。
你不再只是看「功能多不多」，而是看它能不能成為你真正願意長期用的工作基礎設施。

最後結論

我現在對這一波產品的總結是：

OpenClaw 在證明，agent 可以先從日常通道成為你的預設入口。
Claude Code 在證明，coding agent 可以從互動式工具升級成可平行委派的執行層。
OpenAI Codex 在證明，agent 產品要往多介面、多代理、背景自動化擴張。
GitHub 在證明，真正的大戰場其實是把不同 agent 收進同一個治理與協作平面。

所以如果你問我，最近看 OpenClaw、Claude Code、OpenAI 這一串發展，我最確定的觀察是什麼？

我的答案會是：

Agent 的戰場已經不是單一模型，而是誰能成為你工作流裡最自然、最可控、最可審查的入口。

模型還是重要。
但接下來真正決定留下來的是：哪個 agent 不只會做事，還能被放心地放進真正的工作裡。

下一步怎麼做

如果你是個人開發者：先選一個「本地/即時協作」入口，再選一個「雲端/委派審查」入口，實際跑兩週，不要只看 demo。
如果你是團隊：先固定 review、audit、repo policy 這套工作流，再決定底下主要跑哪個 agent。
如果你在做 agent 產品：不要只拚模型效果，先想清楚你的入口、runtime、治理與可追蹤性要怎麼建立。

參考來源

OpenAI - New tools for building agents
https://openai.com/index/new-tools-for-building-agents（2025-03-11）
OpenAI Developers - Codex CLI
https://developers.openai.com/codex/cli
OpenAI - Codex
https://openai.com/codex/
Anthropic - Claude Code on the web
https://www.anthropic.com/news/claude-code-on-the-web（2025-10-20）
GitHub Changelog - Claude and Codex coding agents are now in public preview
https://github.blog/changelog/2026-02-04-claude-and-codex-are-now-available-in-public-preview-on-github（2026-02-04）
GitHub Blog - Pick your agent: Use Claude and Codex on Agent HQ
https://github.blog/news-insights/company-news/pick-your-agent-use-claude-and-codex-on-agent-hq/（2026-02-04）
OpenClaw README
https://github.com/openclaw/openclaw

前提

排除