Google 推出 Gemini 3 支持的 Nano Banana Pro 图像生成模型

25-11-21

免费

快讯

Google 最近正式发布了基于 Gemini 3 Pro 的图像生成与编辑模型 Nano Banana Pro（又称 Gemini 3 Pro Image）。该模型主打“工作室级别”的精细控制、文本渲染精度和对世界知识的理解能力。

Nano Banana Pro 的核心功能包括：生成清晰、准确的多语言文字（例如海报、图表中的文字），并支持本地化；支持高分辨率输出，可生成 2K 本地画面，并可无损放大到 4K。它还内建对构图控制能力，比如光线（亮度、焦点、景深）、相机角度、色彩分级等，让设计师可以精确调控画面氛围。

与此同时，该模型支持将最多 6 张高分辨参考图像 合成入一个创作，并能保持最多 5 个人物的一致性面貌。在内容理解与事实准确性方面，Nano Banana Pro 可以通过 “与 Google 搜索绑定”（grounding）来调用实时知识，使得它在生成历史图表、生物图示、地图等资讯型图片时更加准确。

为了保证源头透明性，所有 Gemini 3 Pro Image 生成或编辑的图像都会嵌入 SynthID 数字水印，以标识其为 AI 生成／编辑内容。 Google 在多个产品中推出了 Nano Banana Pro：普通用户可在 Gemini App 中使用（选择 “Create images” 并切换到 “Thinking” 模型），免费版用户有配额限制，用完后回落到标准 Nano Banana。

高级订阅用户（如 Google AI Plus／Pro／Ultra）则拥有更高配额。专业用户也能在 Google Ads 的 Asset Studio 中使用 Nano Banana Pro 来创建广告素材，还将陆续扩展到 Google Slides 和 Google Vids。对于开发者和企业，则可以通过 Gemini API（AI Studio）或在 Vertex AI 上使用该模型。

该模型定位为 Google 最强大的图像 AI 方案之一，其多语言文字渲染、设计控制力和知识 grounding 弥补了以往图像生成模型在「实用性」上的痛点。Nano Banana Pro 的推出，既体现了 Gemini 系列在技术演进上的进阶，也展示了 Google 在将 AI 模型逐步商业化、嵌入产品生态中的野心。

Memo Team

Signal, not noise!

Google 推出 Gemini 3 支持的 Nano Banana Pro 图像生成模型

Memo Newsletter