OpenAI 推出统一型旗舰模型 GPT-5,ChatGPT 默认升级开启新一代代理模式
OpenAI 于 2025 年 8 月 7 日推出全新旗舰 AI 模型 GPT-5,这是其首款“统一模型”,融合了 o-series 的推理能力与 GPT 系列的快速响应特性,代表 ChatGPT 从聊天工具向 “智能代理” 转型的关键跃迁。GPT-5 能在用户日常使用中主动代办事务,如自动生成应用程序、整理日程或撰写研究报告,采用实时路由技术平衡响应速度与深度思考。
GPT-5 自发布起已成为所有 ChatGPT 免费用户的新默认模型,CEO Sam Altman 表示 GPT-5 是“世界上最好的模型”,是 OpenAI 朝 AGI(通用人工智能)迈进的重要里程碑,强调其在推动 AI 超越人类经济价值工作方面的潜力。
在性能表现方面,GPT-5 在 GitHub 编程任务测试 SWE-bench Verified 得分 74.9%,略优于 Anthropic Claude Opus 4.1(74.5%)与 DeepMind Gemini 2.5 Pro(59.6%)。在复杂学科测试 Humanity’s Last Exam(HLE)中,GPT-5 Pro 使用工具的成绩为 42%,略低于 xAI 的 Grok 4 Heavy(44.4%);但在 PhD 科学题库 GPQA Diamond 上,GPT-5 Pro 以 89.4% 超越 Claude Opus 4.1(80.9%)和 Grok 4 Heavy(88.9%)。
健康问答准确率方面,GPT-5 在 HealthBench Hard Hallucinations 测试中仅出现 1.6% 的错误生成(hallucination),远优于 GPT-4o 和 o3 模型,这显现其在医疗信息处理上的可靠性提升。整体而言,GPT-5 hallucination 率降至 4.8%,相比之前 20–22% 的水平明显改善。此外,该模型在创造性表达上具有更自然、具品味的回应能力,主导搭载更诚实透明、更能辨识滥用倾向与恰当拒绝请求的安全机制。
ChatGPT 用户体验同步也有升级,新增 “Cynic”、“Robot”、“Listener”、“Nerd” 四种人格设定,让用户无需提示即可调整对话风格。同时,“Plus”订阅方案用户获得更高 GPT-5 使用限额;$200/月的 “Pro” 方案除无限访问 GPT-5,还能使用增强版本 GPT-5 Pro。组织、教育与企业用户也将默认获得 GPT-5 访问权限。
开发者方面,GPT-5 通过 OpenAI API 以三种规格上线:gpt-5、gpt-5-mini 和 gpt-5-nano,可按推理深度调节性能与速度。基础版定价为每百万输入 tokens 1.25 美元、输出 tokens 10 美元。