OpenAI 推出 GPT-5-Codex,Codex 编程代理能力显著增强
OpenAI 最新版本的 Codex 工具现在整合了经过特别优化的 GPT-5-Codex 模型,这一升级面向真实软件工程工作进行了深度调优,可以在交互式任务与长时间独立执行任务间自由切换。GPT-5-Codex 会根据任务复杂度动态调整“思考时间”(from 几秒到最长约七小时),使得在复杂重构、调试和代码审查等任务中表现更加出色,同时在简单任务中保持响应速度。
此模型在 “agentic coding” 基准测试(SWE-bench Verified)以及大规模开源仓库重构任务上的成绩优于之前的 GPT-5 版本:在代码审查中提交的建议更少出错,但更多聚焦关键点。 GPT-5-Codex 已经在 Codex 的所有产品中上线,包括终端(terminal)、IDE 扩展、网页版本,以及 ChatGPT 中 Plus、Pro、Business、Edu 和 Enterprise 等订阅套餐用户可用。API 客户端访问尚在计划中。
GPT-5-Codex 除了写代码、加功能之外,还能在大型项目中独立运行多个小时,自动处理测试失败、迭代代码、进行重构。对于开发者而言,这意味着不用频繁人工介入,就能让 AI 在后台持续推进复杂任务。 总体目标是把 Codex 从“辅助工具”进一步升级为“协作工程师”,提升开发效率、减少错误。
在竞争格局上,OpenAI 此举被视为对 Claude Code、Anysphere Cursor、GitHub Copilot 等工具的回应,后者近年来增长迅猛,其中 Cursor 在 2025 年年初 ARR 已破 5 亿美元。
OpenAI 产品负责人表示,GPT-5-Codex 的另一个关键进步是其在代码审查环节的可靠性提升:建议中错误或无关紧要的评论减少,而“高影响力”的评论显著更多。开发者若在 IDE 或代码托管平台中使用,将能显著节省调试与审查成本。
整体来看,GPT-5-Codex 的推出代表 OpenAI 在 AI 编程辅助上迈出的重要一步,它在速度、可靠性与执行长期任务能力上的提升,有望让开发者在复杂工程中获得更强的工具支持,同时也可能推动编码工作流与团队协作方式的变革。