Google 推出 Gemini 3 支持的 Nano Banana Pro 图像生成模型
Google 最近正式发布了基于 Gemini 3 Pro 的图像生成与编辑模型 Nano Banana Pro(又称 Gemini 3 Pro Image)。该模型主打“工作室级别”的精细控制、文本渲染精度和对世界知识的理解能力。
Nano Banana Pro 的核心功能包括:生成清晰、准确的多语言文字(例如海报、图表中的文字),并支持本地化;支持高分辨率输出,可生成 2K 本地画面,并可无损放大到 4K。 它还内建对构图控制能力,比如光线(亮度、焦点、景深)、相机角度、色彩分级等,让设计师可以精确调控画面氛围。
与此同时,该模型支持将最多 6 张高分辨参考图像 合成入一个创作,并能保持最多 5 个人物的一致性面貌。 在内容理解与事实准确性方面,Nano Banana Pro 可以通过 “与 Google 搜索绑定”(grounding)来调用实时知识,使得它在生成历史图表、生物图示、地图等资讯型图片时更加准确。
为了保证源头透明性,所有 Gemini 3 Pro Image 生成或编辑的图像都会嵌入 SynthID 数字水印,以标识其为 AI 生成/编辑内容。 Google 在多个产品中推出了 Nano Banana Pro:普通用户可在 Gemini App 中使用(选择 “Create images” 并切换到 “Thinking” 模型),免费版用户有配额限制,用完后回落到标准 Nano Banana。
高级订阅用户(如 Google AI Plus/Pro/Ultra)则拥有更高配额。专业用户也能在 Google Ads 的 Asset Studio 中使用 Nano Banana Pro 来创建广告素材,还将陆续扩展到 Google Slides 和 Google Vids。 对于开发者和企业,则可以通过 Gemini API(AI Studio)或在 Vertex AI 上使用该模型。
该模型定位为 Google 最强大的图像 AI 方案之一,其多语言文字渲染、设计控制力和知识 grounding 弥补了以往图像生成模型在「实用性」上的痛点。Nano Banana Pro 的推出,既体现了 Gemini 系列在技术演进上的进阶,也展示了 Google 在将 AI 模型逐步商业化、嵌入产品生态中的野心。
