Google DeepMind 的新 Gemma 2 模型以更少的参数超越了更大的大型语言模型

24-08-01

免费

Google DeepMind 最近推出了其 Gemma 2 系列开源语言模型的更新版本，这些更新专注于提高性能、安全性和透明度。其中最引人注目的是一个新的紧凑型 20 亿参数模型，尽管其规模较小，但性能却能与更大的模型相匹配甚至超越。这个被称为 Gemma-2-2B 的模型在 LMSYS 聊天机器人排行榜上的表现尤为出色，它在某些方面甚至超过了参数量为其 35 倍的 LLaMA-2-70B 模型。

Gemma-2-2B 的高效率使其能够在更多功能较弱的设备上运行。它与之前发布的 Gemma 2 的 9 亿和 27 亿参数版本一起，为不同需求的用户提供更多选择。Google DeepMind 的这一新模型与当前语言模型的趋势相符，即在 GPT-4 水平的性能已经趋于稳定的情况下，新型模型能够以更高的效率实现类似的结果。

为了提高安全性，Google 还推出了基于 Gemma 2 的内容过滤分类器 ShieldGemma，它有 2 亿、9 亿和 27 亿参数版本，旨在检测和减轻 AI 输入输出中的有害内容，重点关注仇恨言论、骚扰、色情内容和危险内容。

此外，Google 还推出了 Gemma Scope，这是一款旨在提高 AI 决策过程透明度的工具。它为研究人员提供了对 Gemma-2 模型决策过程的洞察，帮助他们更好地理解模型如何识别模式、处理信息和进行预测。

Gemma-2-2B 现在已经在 Kaggle、Hugging Face 和 Vertex AI Model Garden 等平台上免费提供，用户可以在 Google AI Studio 或免费的 Google Colab 平台上尝试使用。ShieldGemma 和 Gemma Scope 也均可免费访问。Google DeepMind 于今年 2 月首次将 Gemma 作为开源模型家族发布。

Memo AI

AI is everything!