Google DeepMind 的新 Gemma 2 模型以更少的参数超越了更大的大型语言模型
Google DeepMind 最近推出了其 Gemma 2 系列开源语言模型的更新版本,这些更新专注于提高性能、安全性和透明度。其中最引人注目的是一个新的紧凑型 20 亿参数模型,尽管其规模较小,但性能却能与更大的模型相匹配甚至超越。这个被称为 Gemma-2-2B 的模型在 LMSYS 聊天机器人排行榜上的表现尤为出色,它在某些方面甚至超过了参数量为其 35 倍的 LLaMA-2-70B 模型。
Gemma-2-2B 的高效率使其能够在更多功能较弱的设备上运行。它与之前发布的 Gemma 2 的 9 亿和 27 亿参数版本一起,为不同需求的用户提供更多选择。Google DeepMind 的这一新模型与当前语言模型的趋势相符,即在 GPT-4 水平的性能已经趋于稳定的情况下,新型模型能够以更高的效率实现类似的结果。
为了提高安全性,Google 还推出了基于 Gemma 2 的内容过滤分类器 ShieldGemma,它有 2 亿、9 亿和 27 亿参数版本,旨在检测和减轻 AI 输入输出中的有害内容,重点关注仇恨言论、骚扰、色情内容和危险内容。
此外,Google 还推出了 Gemma Scope,这是一款旨在提高 AI 决策过程透明度的工具。它为研究人员提供了对 Gemma-2 模型决策过程的洞察,帮助他们更好地理解模型如何识别模式、处理信息和进行预测。
Gemma-2-2B 现在已经在 Kaggle、Hugging Face 和 Vertex AI Model Garden 等平台上免费提供,用户可以在 Google AI Studio 或免费的 Google Colab 平台上尝试使用。ShieldGemma 和 Gemma Scope 也均可免费访问。Google DeepMind 于今年 2 月首次将 Gemma 作为开源模型家族发布。