OpenAI 推出 o1,一款能自我事实核查的模型
OpenAI 近日宣布推出了一款名为 o1 的新型生成型人工智能模型,这款模型具备自我事实核查的能力。o1 实际上是一系列模型的总称,目前有两个版本可供使用:o1-preview 和 o1-mini,后者是专为代码生成而设计的更小型、更高效的模型。
o1 模型在 ChatGPT 客户端和 OpenAI 的 API 中均可使用,但用户需要订阅 ChatGPT Plus 或 Team 版本才能体验。企业和教育用户将在下周初获得访问权限。目前,o1 的聊天机器人体验相对基础,与前代 GPT-4o 相比,o1 还不能浏览网页或分析文件,尽管它具备图像分析功能,但这些功能尚在测试中。
o1 的一大特点是其推理能力,它能够在回应问题前进行深思熟虑,这使得它在处理需要综合多个子任务结果的任务时表现出色,例如检测律师收件箱中的私密邮件或构思产品营销策略。o1 通过强化学习进行训练,以“思考”的方式在回答问题前进行内部推理,并通过正确答案给予奖励、错误答案给予惩罚的方式来优化模型。
尽管 o1 在处理数据分析、科学和编程问题上的性能优于 GPT-4o,并且在多语言技能上有所提升,但它也存在一些缺点。例如,o1 的响应速度可能比其他模型慢,且在某些情况下可能会产生错误或虚构信息。
在价格方面,o1 模型的成本相对较高。在 API 中,o1-preview 的输入令牌价格为每 100 万个 15 美元,输出令牌为每 100 万个 60 美元,分别是 GPT-4o 的三倍和四倍。
OpenAI 计划将 o1-mini 模型提供给所有免费用户,但尚未确定发布日期。随着竞争对手可能很快推出类似模型,OpenAI 的真正挑战将在于如何广泛提供 o1 并降低其成本。同时,公司表示将尝试开发能够进行长达数小时、数天甚至数周推理的 o1 模型版本,以进一步提升其推理能力。