Elon Musk 的 xAI 发布最新旗舰产品 Grok 3
埃隆·马斯克的人工智能公司 xAI 发布了其最新的旗舰 AI 模型 Grok 3,并为 Grok iOS 和网络应用推出了新功能。Grok 是 xAI 对 OpenAI 的 GPT-4o 和谷歌的 Gemini 等模型的回应,能够分析图像并回答问题,为马斯克的社交网络 X 提供多项功能支持。Grok 3 的开发已持续数月,原本乐观预计在 2024 年发布,但未能如期。
xAI 在孟菲斯的一个大型数据中心使用约 20 万个 GPU 训练 Grok 3。马斯克在 X 上发帖称,Grok 3 的开发使用了比前代 Grok 2 多 10 倍的计算能力,并使用了包括法院案件文件在内的扩展训练集。马斯克在周一的直播展示中表示,Grok 3 的能力是 Grok 2 的 10 倍,是一个“最大化寻求真理的 AI,即使这个真理有时与政治正确相冲突”。
Grok 3 实际上是一系列模型。Grok 3 mini 是一个较小版本的模型,为了更快地回答问题,牺牲了一些准确性。并非所有 Grok 3 的模型和相关功能都已可用(一些还在测试中),但它们从周一开始陆续推出。
xAI 声称 Grok 3 在包括 AIME(评估模型在数学问题上的表现)和 GPQA(使用博士级物理、生物和化学问题评估模型)等基准测试中击败了 GPT-4o。据 xAI 称,Grok 3 的一个早期版本在 Chatbot Arena 中也取得了竞争性的成绩,这是一个众包测试,将不同的 AI 模型相互对比,并让用户投票选择他们更喜欢的回应。
Grok 3 系列中的两个模型,Grok 3 Reasoning 和 Grok 3 mini Reasoning,可以仔细“思考”问题,类似于 OpenAI 的 o3-mini 和 DeepSeek 的 R1 等“推理”模型。推理模型在给出结果前尝试自我事实检查,这有助于它们避免一些通常会困扰模型的陷阱。
xAI 声称 Grok 3 Reasoning 在包括新的数学基准 AIME 2025 在内的几个流行基准上超越了 o3-mini-high 的最佳版本。
这些推理模型可以通过 Grok 应用访问。用户可以要求 Grok 3“思考”,或者对于更复杂的问题,利用“大大脑”模式进行推理,这需要额外的计算能力。xAI 将推理模型描述为最适合数学、科学和编程问题。
马斯克表示,为了防止蒸馏——AI 模型开发者用来从其他模型中提取知识的方法——Grok 应用中一些推理模型的“思考”被遮挡了。最近,DeepSeek 被指控使用 OpenAI 的模型进行蒸馏,以创建自己的模型。
Grok 的推理模型支持 Grok 应用中的一个新功能,称为 DeepSearch,这是 xAI 对 OpenAI 的深度研究等 AI 驱动的研究工具的回应。DeepSearch 扫描互联网和 X 来分析信息,并针对问题提供摘要回应。
X 的 Premium+ 层级(每月 50 美元)的订阅者将首先获得 Grok 3 的访问权,其他功能将被一个新的计划所限制,xAI 称之为 SuperGrok。SuperGrok 的价格是每月 30 美元或每年 300 美元,它解锁了额外的推理和 DeepSearch 查询,并提供了无限的图像生成。
马斯克表示,Grok 应用将在大约一周后增加一个“语音模式”,这将为 Grok 模型提供合成语音。几周后,Grok 3 模型将通过 xAI 的企业 API 提供,同时提供 DeepSearch 功能。
xAI 计划在未来几个月内开源 Grok 2,马斯克说。“我们的一般做法是,当下一代版本完全发布后,我们将开源上一个版本。当 Grok 3 成熟稳定后,可能在几个月内,然后我们将开源 Grok 2。”
当马斯克大约两年前宣布 Grok 时,他将 AI 模型定位为前卫、未经过滤、反“觉醒”——总的来说,愿意回答其他 AI 系统不会回答的争议性问题。他兑现了部分承诺。例如,当被要求说粗俗话时,Grok 和 Grok 2 会欣然遵命,使用你不太可能从 ChatGPT 听到的丰富多彩的语言。
但 Grok 3 之前的 Grok 模型在政治主题上有所回避,不会越过某些界限。实际上,一项研究发现 Grok 在跨性别权利、多样性项目和不平等等主题上倾向于政治左派。
马斯克将这种行为归咎于 Grok 的训练数据——公共网页——并承诺将“将 Grok 更接近政治中立”。目前尚不清楚 xAI 是否实现了这一目标,以及可能的后果是什么。