← 返回全部文章
动态 · 2026年6月3日 · 8 分钟阅读

AI 编程代理现状(2026 年 6 月):Opus 4.8 到来,Google 转向闭源,钱也开始离谱

距上次更新只有两周,但这两周重排棋盘的幅度,比前一个整月还大:Anthropic 发布新的前沿模型,并把舰队级编排塞进 Claude Code;Google 的开源 CLI 时代结束;全球安装量最大的编程助手全面更换定价模型;还有两笔融资,清楚地说明这个市场相信未来会走向哪里。

30 秒版本

  • Anthropic 发布了 Claude Opus 4.8(May 28)——基础 API 价格与 4.7 相同,fast mode 便宜很多;Claude Code 获得了 dynamic workflows:可以在迁移规模上编排并行 subagent。三天后,Anthropic 在完成一轮 $65B Series H、估值 $965B 后,秘密提交 IPO 文件
  • Google 正在下线开源 Gemini CLI(I/O,May 19 宣布)。替代品 Antigravity CLI 是闭源的;Gemini CLICode Assist 将在 June 18, 2026 停止服务请求。要么迁移,要么 fork。
  • GitHub Copilot 换掉了整套定价模型(June 1 生效):所有套餐都改成基于 “AI Credits” 的按量计费,新增高端 Copilot Max 档;更少见的是,多数付费档的新注册已经暂停
  • OpenAI 的 Codex 在这个窗口没有新模型,但 Goal Moderemote computer use 正式 GA(May 21);Sites plugin preview 则说明,Codex 现在也想顺手托管你的部署。

本月发生了什么

Claude Opus 4.8,以及 Claude Code 学会调度编队

Claude Opus 4.8(May 28)是这个窗口期最重要的模型发布。真正有战略意味的是定价:基础模型保持在 $5 / $25/百万 token——和 Opus 4.7 一样——但 fast mode 降到 $10 / $50。Anthropic 称它比之前的 fast mode 便宜 3×,输出速度约快 ~2.5×。前沿能力不再是价格杠杆;速度才是。

工程师真正会感受到的,是 Claude Code 这边的变化。Dynamic workflows 让一段 session 可以编排并行 subagent:在大型迁移或审计中扇出,把发现相互对抗式验证,再合成结果,而不是让你盯着每个 worker 手动照看。它还新增了一个 maximum-effort mode(你会看到它被叫作 “ultracode”),用于那些你希望模型认真花 token 的任务。Benchmark 方面,公告更多依赖 agentic eval,并通过一个公开 harness 报告 Terminal-Bench;我们这周写了一整篇配套文章,解释为什么那个 harness 脚注比头条分数更重要。

实话评价: 真正的变化,是“把编排做成产品功能”。我们在工作流趋同那篇里梳理过的 12 套工具生态,之所以会存在,正是因为用户不得不自己搭 multi-agent pipeline。现在,其中一部分脚手架已经搬进产品里了。

Google 退役开源 Gemini CLI——Antigravity CLI 是闭源的

这个窗口期最大的战略动作:Google 在 I/O 的 May 19 宣布从 Gemini CLI 迁移到 Antigravity CLI。新的 CLI 基于 Go,与 Antigravity 2.0 桌面应用共享代理运行框架(harness),支持后台多 agent 编排,并继承 Agent Skills、Hooks、Subagents 和 Extensions(改名为 plugins)。它同时也是闭源的——而开源的 Gemini CLI 以及 Code Assist IDE 扩展,将在 June 18, 2026 停止服务 Pro、Ultra 和免费档请求。

社区立刻注意到了。不到一天,新 CLI 的 tracker 里就塞满了大家对旧工具互操作能力的诉求(排名最靠前的 issue 是 Agent Client Protocol support,这样 Zed 这类编辑器才能驱动它)。十八个月前还是旗舰开源项目的工具,现在只给一个月 sunset,转弯很急。

实话评价: 如果你的团队已经标准化到 Gemini CLI 上,按发布时间算,你只剩两周。务实选项只有两个:迁到 Antigravity CLI 并接受闭源模型,或者趁这个时间重新评估——你栈里的开源席位,现在轮到 Cline 和 OpenClaw 去争(这两个在整个窗口期都持续发版)。最不该做的是按兵不动;June 18 是硬日期。

GitHub Copilot:所有人的账单模型都变了

GitHub 把所有 Copilot 套餐迁到按用量计费(May 29 宣布,June 1 生效):每个套餐有月度 AI Credits 额度,你自己设置超额预算;code review 现在还会消耗 Actions minutes;并且新增了顶级 Copilot Max 档。最显眼的一点是:Student、Pro、Pro+ 和 Max 的新注册都已暂停,等迁移落地。June 2 后续一波更新又加了 GA 的 Copilot SDK、CLI 里的 prompt schedulingvoice input,以及预览中的云端/本地 sandbox。

实话评价: 这是这个品类里最大安装基数的产品,从固定席位费切到按量消耗;方向和 Codex(4 月切 token 计费)、Claude(滚动用量窗口)完全一致。AI 编程助手的 flat-rate 时代实际上已经结束;如果你的团队还按 seat 做预算,你的财务模型在所有主流厂商上都已经失真。

老牌工具报到

Codex(OpenAI)。 这个窗口没有新模型(GPT-5.5 早于它发布),但 changelog 很忙:Goal Mode 在 CLI 0.133.0 中 GA(May 21)——一个能跨 session 中断和预算重置保留的持久 /goal——同时 remote computer use 也正式可用:你的 Mac 锁屏后,它仍能继续驱动桌面应用,也可以从 Codex Mobile 发起。6 月带来了 Amazon Bedrock 支持(June 1)和 Sites plugin preview(June 2):在 Codex 里构建并托管站点和 dashboard。一个刺耳的小问题是:Desktop app 去掉可见 context-usage indicatorissue 赞同数很高。事情不大,但 context 可见性恰好是最不该倒退的地方。

Cursor。changelog,这个窗口有四个值得记的发布:Cursor in Jira(May 19——把 ticket 指给 @Cursor,拿回一个 PR)、3.5 的 shared canvases 和升级版 Automations(May 20)、3.6 的 auto-review run mode(May 29——allowlist 调用立即运行,可 sandbox 的调用进 sandbox,其余交给 classifier subagent;这是 approve-everything 和 YOLO 之间一个很周到的中间地带),以及面向企业多团队管理的 Organizations(June 3)。

Grok Build(xAI)。 上期刚登场的它,在 5 月下旬扩大了访问范围:beta 现在覆盖所有 SuperGrokX Premium Plus 订阅用户(发布时只开放给 $300 Heavy 档),xAI 给出的引入价是 $99/mo。在隔离 git worktree 中运行并行 sub-agent,仍然是它的招牌能力。依旧是 beta;节奏很快。

开源阵营。 Cline 持续发版(VS Code 3.85→3.87,加上逐渐成熟的 standalone CLI;新增 GPT-5.5、DeepSeek V4Gemini 3.5 Flash 路由)。OpenClaw 切了两个稳定版。Aider 很安静——自 2025 年 8 月以来没有 release,这越来越显眼。MCP spec 在这个窗口也没有里程碑(下一个 release candidate 日期在 7 月下旬)。

钱,简短说

48 小时内的两笔融资,定义了这个市场认为自己正在走向哪里。Anthropic 完成 $65B Series H,post-money 估值 $965B(May 28)——成为估值最高的 AI startup——随后在 June 1 秘密提交 draft S-1。Cognition(Devin、Windsurf)则完成了一轮据称 $1B+、估值 $26B 的融资(May 27)。不管你怎么看这些数字,资本现在定价的前提已经很清楚:产品不是聊天,而是 agent。

这个窗口期之后的格局

Agent适合入门价这个窗口
Claude Code自主 CLI + 编队编排$100/mo(Max 5×)Opus 4.8dynamic workflows、更便宜的 fast mode
Codex(OpenAI)包含在 ChatGPT$20/mo PlusGoal Mode GA、Sites preview、Bedrock
Cursor编辑器优先 + cloud agents$20/mo ProJira agentsauto-review mode、Organizations
Copilot最大安装基数metered(AI Credits全量计费模型切换、Max 档、新注册暂停
Antigravity CLIGoogle 技术栈Gemini plansJune 18 取代 Gemini CLI;闭源
Grok Build隐私敏感 / X 技术栈$99/mo intro(beta)beta 扩展到 Heavy 档之外

这对你的工具栈意味着什么

  1. 还在用 Gemini CLI?June 18 前迁走。 这不是 deprecation notice,而是 Pro/Ultra/free 请求的 shutoff date。现在就测试 Antigravity CLI,或者有意识地选一个开源 fallback。
  2. 重新算一遍 AI 支出。 Copilot 改按量,Codex 按 token,Claude 按窗口。固定 per-seat 预算已经无法描述任何主流厂商;在第一张意外账单出现之前,而不是之后,先设好 overage caps
  3. 如果你在用 Claude Max,先试新编排,再继续搭脚手架。 Dynamic workflows 会吸收一部分自定义多 agent 配置的工作。如果你确实跑并行编队:agent 越多,磁盘上的 memory 和 transcript 文件就越多——我们用 AI Memory Reader利益披露:这是我们做的)保持它们可读,也写过怎样运行长驻编队而不让记忆混在一起

本文是持续月度系列的一部分——2026 年 5 月刊在这里。上面每一条带日期的说法,都已在 2026 年 6 月 3 日对照链接中的一手来源核实(厂商 changelog、官方博客或 GitHub release);只有二手报道的地方(Cognition 融资)已明确标为据称。

相关阅读


文章独立产出 · 编辑政策

继续阅读 →