登录
首页
快讯
邮件订阅
会员专属
Memo AI
联系我们

Gemini 3 破纪录基准分数

25-11-19
免费
快讯

Google 今日正式推出其最新大型语言模型 Gemini 3,标志着其在 AI 领域的又一重大升级。该产品不仅整合了强大的编码功能,还在多个行业基准测试中创下新高成绩。

Gemini 3 是 Google DeepMind 系列模型中新一代产品,其主要定位为多模态、深度推理与任务执行的“全能助理”。根据报道,其在 “Humanity’s Last Exam” 基准中取得 37.4 分,超过此前由 GPT‑5 Pro 所创 31.64 分的记录。 此外,Gemini 3 在 LMArena 等用户满意度与人类领导榜单也取得领先。

在核心功能上,Gemini 3 的亮点包括:其新增编码应用(coding app)支持开发者与模型互动编程;增强了推理能力与多模态处理(包括文本、图像、音频、视频等);即刻融入 Google 搜索和 Gemini 应用,实现“从第一天就内置高级模型”的部署。

Google 表示 Gemini 系列每月仅在 Gemini 应用中就有逾 6.5 亿用户,而通过 AI 概览功能参与的用户达 20 亿人次。 此次升级发生在 AI 模型竞争加剧、市场关注从“基准”转向“商业应用”的背景下。

分析人士指出,Gemini 3 不只是技术升级,更被视为 Google 将其搜索、云服务、工作套件等产品线再次“AI化”的关键步骤。公司强调,尽管基准分数亮眼,但真正挑战在于将模型能力转化为可变现、规模化的业务。

 

Memo Newsletter

订阅 Memo 邮件列表,过滤噪音,捕捉最具价值的创投行业信号

最顶尖的 AI 行业创业者和投资人都在看

Subscribe
头像
Memo Team
Signal, not noise!
最新快讯