Claude Sonnet 5传将发布:多Agent组队开发,SWE-Bench 80.9%与价格腰斩
传闻Claude Sonnet 5将以多Agent协作的Claude Code Evolution改变编码方式,并在SWE-Bench取得80.9%高分,同时价格下调50%与保留百万Token上下文窗口,或推动软件研发与组织分工模式重构。
传闻Claude Sonnet 5将以多Agent协作的Claude Code Evolution改变编码方式,并在SWE-Bench取得80.9%高分,同时价格下调50%与保留百万Token上下文窗口,或推动软件研发与组织分工模式重构。
OpenAI推出Codex桌面客户端,主打项目级多任务智能体协作、线程化上下文保持与可审阅改动流程,并在形态与自动化能力上与Claude Code形成差异;目前以macOS为主且不同账号额度存在差别。
谷歌DeepMind的Genie 3以“生成即游玩”展示世界模型能力,引发游戏股大幅波动。技术突破背后仍受限于画质、记忆与推理成本,但其对游戏生产管线的重构信号,正被行业重新定价。 文章正文
OpenAI发布Codex独立桌面应用,以“Agent指挥中心”重塑AI编程:线程化多Agent协作、原生Git Worktree隔离并行、Skills与Automations扩展工作流,开发生产力与团队协作方式或将随之改写。
Agent Skills Framework用SKILL.md将代理能力模块化,通过“元数据注册—语义匹配—按需加载”降低Token成本并提升复用性,正在形成可版本化、可审计的AI能力资产体系。