Gemini 3 破纪录基准分数
25-11-19
Google 今日正式推出其最新大型语言模型 Gemini 3,标志着其在 AI 领域的又一重大升级。该产品不仅整合了强大的编码功能,还在多个行业基准测试中创下新高成绩。
Gemini 3 是 Google DeepMind 系列模型中新一代产品,其主要定位为多模态、深度推理与任务执行的“全能助理”。根据报道,其在 “Humanity’s Last Exam” 基准中取得 37.4 分,超过此前由 GPT‑5 Pro 所创 31.64 分的记录。 此外,Gemini 3 在 LMArena 等用户满意度与人类领导榜单也取得领先。
在核心功能上,Gemini 3 的亮点包括:其新增编码应用(coding app)支持开发者与模型互动编程;增强了推理能力与多模态处理(包括文本、图像、音频、视频等);即刻融入 Google 搜索和 Gemini 应用,实现“从第一天就内置高级模型”的部署。
Google 表示 Gemini 系列每月仅在 Gemini 应用中就有逾 6.5 亿用户,而通过 AI 概览功能参与的用户达 20 亿人次。 此次升级发生在 AI 模型竞争加剧、市场关注从“基准”转向“商业应用”的背景下。
分析人士指出,Gemini 3 不只是技术升级,更被视为 Google 将其搜索、云服务、工作套件等产品线再次“AI化”的关键步骤。公司强调,尽管基准分数亮眼,但真正挑战在于将模型能力转化为可变现、规模化的业务。
