Gemma 是什么:Google 开源轻量级 LLM

Gemma 是 Google DeepMind 发布的开源轻量级大语言模型系列,基于 Gemini 研究技术,Gemma 2 提供 2B/9B/27B 三种规模,遵循 Apache 2.0 协议完全开放商用。

Gemma 是什么:Google 开源轻量级 LLM

如果你正在评估 AI模型训练 工具,Gemma 值得了解一下,它的核心思路是Google 开源轻量级 LLM,Gemma 2 提供 2B/9B/27B,Apache 2.0 开放商用。

速读卡片

字段 内容
产品 Gemma
定位 Google 开源轻量级 LLM,Gemma 2 提供 2B/9B/27B,Apache 2.0 开放商用
方向 AI模型训练
平台 HuggingFace, Kaggle, Google Cloud, Local
入口 https://ai.google.dev/gemma

亮点功能

  • Gemma 2 多规模预训练模型(Base):提供未经指令微调的基础预训练模型,适合研究人员在特定任务或领域进行二次微调,2B/9B/27B 三种规模覆盖从端侧部署到高性能服务器的不同算力场景。
  • Gemma 2 指令微调版(Instruct):经过指令跟随和安全对齐训练的对话版本,开箱即用于聊天助手和问答应用,无需额外微调即可获得高质量的自然语言交互能力。
  • 知识蒸馏优化的超高参数效率:Gemma 2 通过从更大规模 Gemini 模型(27B 从 Gemini 蒸馏,9B/2B 从 27B 蒸馏)获得参数效率,实现了在同参数规模中显著领先的基准测试成绩,这一「蒸馏链」策略是 Gemma 系列的核心技术创新。
  • CodeGemma(代码专用变体):专门针对代码补全、代码生成和数学推理优化的 Gemma 变体,提供 2B(代码填充)和 7B(指令版)两种规格,代码任务表现优于同规模通用 Gemma 模型。
  • PaliGemma(视觉语言多模态版):支持图像理解的多模态 Gemma 变体,可处理图文混合输入,执行图像描述、视觉问答和文档理解任务,是 Google 轻量级多模态开源模型的代表。
  • Apache 2.0 无限制商业授权:全部 Gemma 模型遵循 Apache 2.0 许可证,可在任何规模的商业产品中自由使用、修改和分发,无用户数量或收入限制,是最宽松的开源 LLM 商业许可之一。
  • Google Colab 零配置体验:Google 为 Gemma 提供官方 Colab 笔记本,用户无需本地 GPU 即可直接在浏览器中运行 Gemma,是 AI 学习者和数据科学家最低门槛的 Gemma 体验入口。

落地建议:先在低风险场景试点 Gemma,把效率、质量、成本三项指标做上线前后对比,再决定是否扩大使用范围。

版权声明:本文内容来自 Gemma 官方文档 。本平台对该内容进行了编译和整理,仅用于信息传播和学习交流之用。如有侵权,请联系我们进行处理。

用户评价

  • 加载评价中...