马斯克的 xAI 发布了其最新旗舰模型 Grok 3
25-02-18
埃隆·马斯克的 xAI 刚刚发布了 Grok-3,被称为“地球上最聪明的 AI”——在数学、科学和编程任务上实现了最先进的性能(SoTA),并在关键基准测试中超越了 Gemini-2 Pro、Claude 3.5 Sonnet 和 GPT-4o。
其主力模型 Grok-3 正通过 Grok 应用逐步推出,而一个较小的 Grok-3 mini 版本则承诺更快的响应速度。这两个模型在 AIME‘24、GPQA 和 LiveCodeBench 基准测试中均排名第一,Grok-3 的早期版本还在 Chatbot Arena 中位居榜首。
这些模型还具有推理版本,可以像 OpenAI 的 o3-mini 和 DeepSeek R1 一样“思考”问题,并支持深入研究。Grok-3 的训练使用了比 Grok-2 多 10 倍的计算资源,基于 xAI 的 Colossus 超级计算机,配备了 200,000 张 H100 GPU(证明了扩展定律的有效性)。
Grok-3 将成立仅两年的 xAI 推到了 AI 竞赛的顶端。然而,随着 OpenAI 准备发布 GPT-4.5,随后是统一的 GPT-5,xAI 的领先地位能维持多久仍有待观察。