Gemini 3 破纪录基准分数

25-11-19

免费

快讯

Google 今日正式推出其最新大型语言模型 Gemini 3，标志着其在 AI 领域的又一重大升级。该产品不仅整合了强大的编码功能，还在多个行业基准测试中创下新高成绩。

Gemini 3 是 Google DeepMind 系列模型中新一代产品，其主要定位为多模态、深度推理与任务执行的“全能助理”。根据报道，其在 “Humanity’s Last Exam” 基准中取得 37.4 分，超过此前由 GPT‑5 Pro 所创 31.64 分的记录。此外，Gemini 3 在 LMArena 等用户满意度与人类领导榜单也取得领先。

在核心功能上，Gemini 3 的亮点包括：其新增编码应用（coding app）支持开发者与模型互动编程；增强了推理能力与多模态处理（包括文本、图像、音频、视频等）；即刻融入 Google 搜索和 Gemini 应用，实现“从第一天就内置高级模型”的部署。

Google 表示 Gemini 系列每月仅在 Gemini 应用中就有逾 6.5 亿用户，而通过 AI 概览功能参与的用户达 20 亿人次。此次升级发生在 AI 模型竞争加剧、市场关注从“基准”转向“商业应用”的背景下。

分析人士指出，Gemini 3 不只是技术升级，更被视为 Google 将其搜索、云服务、工作套件等产品线再次“AI化”的关键步骤。公司强调，尽管基准分数亮眼，但真正挑战在于将模型能力转化为可变现、规模化的业务。

Memo Team

Signal, not noise!

Gemini 3 破纪录基准分数

Memo Newsletter