登录
首页
快讯
邮件订阅
会员专属
Memo AI
联系我们

Google 推 AI 翻译模型,覆盖 55 种语言

26-01-16
免费
快讯

谷歌(Google)近日发布了 TranslateGemma,这是一个基于其最新 AI 基础模型 Gemma 3 的开放式翻译模型系列,旨在为开发者和研究者提供高效、强大的机器翻译能力,推动跨语言交流与应用创新。TranslateGemma 支持 55 种语言 的文本翻译与图像内文字翻译,并已在多个开放平台(如 Kaggle、Hugging Face 和 Vertex AI)提供下载和部署选项。 

TranslateGemma 家族包含 三种不同规模的模型:4B、12B 和 27B 参数版本,分别面向不同的部署场景:其中 4B 模型专为 移动端与边缘设备 优化,适合手机等资源有限设备运行;12B 模型可在普通笔记本电脑上提供接近研究级性能;而 27B 模型则面向 云端或强算力场景,适合追求最高翻译质量的应用。 

在性能方面,TranslateGemma 展现了 出色的翻译质量与效率:技术评估显示,12B 版本在 WMT24++ 基准测试中 超越了参数量为其两倍的 Gemma 3 27B 基线模型,这意味着开发者能够用更少的计算资源获得更高保真的翻译结果,降低延迟并提升吞吐量。即使是体量最小的 4B 模型,其表现也接近更大基线模型,在移动与边缘场景拥有实际可用的高质量翻译能力。 

技术上,TranslateGemma 采用了 两阶段微调流程:首先在由人工翻译数据和 Gemma 生成的高质量合成翻译数据构成的并行语料上进行监督微调;随后通过强化学习结合先进评价指标进一步提升上下文准确度和自然度,使得模型不仅在主流语言上表现优异,在低资源语言上也有显著提升。 

TranslateGemma 继承了 Gemma 3 的 多模态能力,可以无额外调整地翻译图像中嵌入的文字,这为跨语言视觉内容理解提供了更强支持。开放策略与高效性能使得 TranslateGemma 不仅对 AI 研究与开发者有吸引力,还能助力各种翻译相关应用,包括实时翻译服务、多语言内容本地化、跨语种聊天机器人等。 

作为 开放式模型,TranslateGemma 的发布标志着谷歌在 AI 翻译领域迈出了重要一步,推动先进翻译技术向更广泛社区和应用场景普及,为打破语言障碍、促进全球互联互通提供了新的基础设施支持。 

Memo Newsletter

订阅 Memo 邮件列表,过滤噪音,捕捉最具价值的创投行业信号

最顶尖的 AI 行业创业者和投资人都在看

Subscribe
头像
Memo Team
Signal, not noise!
最新快讯