Elon Musk 的 xAI 发布最新旗舰产品 Grok 3

25-02-19

免费

快讯

埃隆·马斯克的人工智能公司 xAI 发布了其最新的旗舰 AI 模型 Grok 3，并为 Grok iOS 和网络应用推出了新功能。Grok 是 xAI 对 OpenAI 的 GPT-4o 和谷歌的 Gemini 等模型的回应，能够分析图像并回答问题，为马斯克的社交网络 X 提供多项功能支持。Grok 3 的开发已持续数月，原本乐观预计在 2024 年发布，但未能如期。

xAI 在孟菲斯的一个大型数据中心使用约 20 万个 GPU 训练 Grok 3。马斯克在 X 上发帖称，Grok 3 的开发使用了比前代 Grok 2 多 10 倍的计算能力，并使用了包括法院案件文件在内的扩展训练集。马斯克在周一的直播展示中表示，Grok 3 的能力是 Grok 2 的 10 倍，是一个“最大化寻求真理的 AI，即使这个真理有时与政治正确相冲突”。

Grok 3 实际上是一系列模型。Grok 3 mini 是一个较小版本的模型，为了更快地回答问题，牺牲了一些准确性。并非所有 Grok 3 的模型和相关功能都已可用（一些还在测试中），但它们从周一开始陆续推出。

xAI 声称 Grok 3 在包括 AIME（评估模型在数学问题上的表现）和 GPQA（使用博士级物理、生物和化学问题评估模型）等基准测试中击败了 GPT-4o。据 xAI 称，Grok 3 的一个早期版本在 Chatbot Arena 中也取得了竞争性的成绩，这是一个众包测试，将不同的 AI 模型相互对比，并让用户投票选择他们更喜欢的回应。

Grok 3 系列中的两个模型，Grok 3 Reasoning 和 Grok 3 mini Reasoning，可以仔细“思考”问题，类似于 OpenAI 的 o3-mini 和 DeepSeek 的 R1 等“推理”模型。推理模型在给出结果前尝试自我事实检查，这有助于它们避免一些通常会困扰模型的陷阱。

xAI 声称 Grok 3 Reasoning 在包括新的数学基准 AIME 2025 在内的几个流行基准上超越了 o3-mini-high 的最佳版本。

这些推理模型可以通过 Grok 应用访问。用户可以要求 Grok 3“思考”，或者对于更复杂的问题，利用“大大脑”模式进行推理，这需要额外的计算能力。xAI 将推理模型描述为最适合数学、科学和编程问题。

马斯克表示，为了防止蒸馏——AI 模型开发者用来从其他模型中提取知识的方法——Grok 应用中一些推理模型的“思考”被遮挡了。最近，DeepSeek 被指控使用 OpenAI 的模型进行蒸馏，以创建自己的模型。

Grok 的推理模型支持 Grok 应用中的一个新功能，称为 DeepSearch，这是 xAI 对 OpenAI 的深度研究等 AI 驱动的研究工具的回应。DeepSearch 扫描互联网和 X 来分析信息，并针对问题提供摘要回应。

X 的 Premium+ 层级（每月 50 美元）的订阅者将首先获得 Grok 3 的访问权，其他功能将被一个新的计划所限制，xAI 称之为 SuperGrok。SuperGrok 的价格是每月 30 美元或每年 300 美元，它解锁了额外的推理和 DeepSearch 查询，并提供了无限的图像生成。

马斯克表示，Grok 应用将在大约一周后增加一个“语音模式”，这将为 Grok 模型提供合成语音。几周后，Grok 3 模型将通过 xAI 的企业 API 提供，同时提供 DeepSearch 功能。

xAI 计划在未来几个月内开源 Grok 2，马斯克说。“我们的一般做法是，当下一代版本完全发布后，我们将开源上一个版本。当 Grok 3 成熟稳定后，可能在几个月内，然后我们将开源 Grok 2。”

当马斯克大约两年前宣布 Grok 时，他将 AI 模型定位为前卫、未经过滤、反“觉醒”——总的来说，愿意回答其他 AI 系统不会回答的争议性问题。他兑现了部分承诺。例如，当被要求说粗俗话时，Grok 和 Grok 2 会欣然遵命，使用你不太可能从 ChatGPT 听到的丰富多彩的语言。

但 Grok 3 之前的 Grok 模型在政治主题上有所回避，不会越过某些界限。实际上，一项研究发现 Grok 在跨性别权利、多样性项目和不平等等主题上倾向于政治左派。

马斯克将这种行为归咎于 Grok 的训练数据——公共网页——并承诺将“将 Grok 更接近政治中立”。目前尚不清楚 xAI 是否实现了这一目标，以及可能的后果是什么。

Memo Team

Signal, not noise!

Elon Musk 的 xAI 发布最新旗舰产品 Grok 3

Memo Newsletter