大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相当于OpenAI把GPT-3开源了

  来源:硅星GenAI

  几家巨头之间的大模型竞争,越来越像打牌了。你出完炸弹我出炸弹。

  这不,又一个深夜炸弹。

  2月21日,在与闭源的OpenAI打得火热的同时,Google突然加入了开源的战局。北京时间夜间Google突然宣布,开源了一个新的模型系列Gemma,这个模型使用了与它最强的Gemini同源的技术,并且在一系列的标准测试上秒杀了几款今天最热门的开源模型。

  怎么理解这个动作的重要性呢?你可以粗暴的理解为:

  这有点像现在正在训练更强大的GPT-5的OpenAI,把GPT3的低参数版给开源了。(前几天Sam Altman被问过这个问题,你们是否会在未来把GPT3开源,他没有直接回答。现在看来Google针对性很强啊。)

大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相当于OpenAI把GPT-3开源了

  (X上一张有意思的图)

  根据Google官方对Gemma的介绍,它的基本信息如下:

  Gemma是谷歌开源的一个大型语言模型,而非像Gemini那样是多模态的,它基于与Gemini相同的技术构建,但完全公开并允许商用授权。

  Gemma模型有两个主要版本,分别是Gemma 7B(70亿参数)和Gemma 2B(20亿参数)。这些模型在大规模的数据集上进行了训练,数据集包含了以英语为主的网络文档、数学数据以及代码数据,总量达到了6万亿tokens。

  Gemma模型的特点包括:

架构细节:Gemma模型具有不同的参数规模,Gemma-2B有18层,d_model为2048,而Gemma-7B有28层,d_model为3072。这些模型还具有不同的前馈隐藏维度、头数和KV头数,以及词汇量。

大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相当于OpenAI把GPT-3开源了

新技术:Gemma采用了一些新技术,如Multi-Query Attention、RoPE Embeddings、GeGLU激活函数以及Normalizer Location,这些技术有助于提高模型的性能。

评测结果:谷歌官方宣称Gemma模型在70亿参数规模的语言模型中表现最佳,甚至超过了一些参数量更大的模型。

开源情况:Gemma模型遵循一个自定义的开源协议,允许商业使用。

大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相当于OpenAI把GPT-3开源了

  发布完,Jeff Dean就对这个系列模型划了重点:

Gemma-7B模型在涵盖通用语言理解、推理、数学和编程的8项基准测试中,性能超过了广泛使用的Llama-2 7B和13B模型。它在数学/科学和编程相关任务上,通常也超过了Mistral 7B模型的性能。

大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相当于OpenAI把GPT-3开源了

Gemma-2B IT和Gemma-7B IT这两个经过指令调整的模型版本,在基于人类偏好的安全评估中,都优于Mistral-7B v0.2指令模型。特别是Gemma-7B IT模型在遵循指令方面也表现更佳。

大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相当于OpenAI把GPT-3开源了

(有意思的是,在Google晒出的成绩对比中,阿里的千问背后的模型Qwen系列表现也很亮眼)

大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相当于OpenAI把GPT-3开源了

我们也发布了一个负责任的生成性人工智能工具包(Responsible Generative AI Toolkit),它为负责任地使用像Gemma模型这样的开放模型提供了资源,包括:

关于设定安全政策、安全调整、安全分类器和模型评估的指导。

学习可解释性工具(Learning Interpretability Tool,简称LIT),用于调查Gemma的行为并解决潜在问题。

一种构建具有最小样本量的强大安全分类器的方法论。

我们发布了两个版本的模型权重:Gemma 2B和Gemma 7B。每个版本都提供了预训练和指令调整的变体。

我们为所有主要框架提供了推理和监督式微调(SFT)的工具链:通过原生Keras 3.0支持的JAX、PyTorch和TensorFlow。

提供了即用型的Colab和Kaggle笔记本,以及与流行的工具如Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM的集成,使得开始使用Gemma变得简单。

预训练和指令调整的Gemma模型可以在您的笔记本电脑、工作站或Google Cloud上运行,并且可以轻松部署在Vertex AI和Google Kubernetes Engine(GKE)上。

在多个AI硬件平台上的优化确保了行业领先的性能,包括NVIDIA GPU和Google Cloud TPUs。

使用条款允许所有规模的组织负责任地进行商业使用和分发。

  可以看到Jeff Dean和Google这次都十分强调开源模型的安全性和具体的实打实的配套设施和举措。这似乎也直至被诟病Close AI且被外界质疑安全性保障的OpenAI。

大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相当于OpenAI把GPT-3开源了

  现在,憋坏了的Google正式四面开战了。未来它将用Gemma对抗Llama,用Gemini对抗GPT。

  无论是开源还是闭源,竞争越来越焦灼了。

相关阅读

  • 什么是科创板股票

    什么是科创板股票

    科创板股票,全称为科技创新板块股票,是中国上海证券交易所设立的一个专门为科技创新型企业提供融资服务的板块。它的推出标志着中国资本市场的一个重要创新,旨在为高科技企业提供更加灵活的上市条件和更为便捷的融资渠道。科创板的诞生背景随着中国经济的转...

    2024.03.02 17:46:03作者:adminTags:科创企业中国投资者资本
  • 天风证券解读家电“以旧换新”机会:有望带来更大需求与潜力

    天风证券解读家电“以旧换新”机会:有望带来更大需求与潜力

    快讯摘要 天风证券解读家电“以旧换新”机会:有望带来更大需求与潜力证券时报e公司讯,天风证券研报认为,站在国内家电行业增量与存量并存的时点,伴随本轮家电...

    2024.03.02 17:45:03作者:adminTags:家电有望需求潜力带来
  • 太平洋健康险:送你一朵小蓝花,?让更多“罕见”被“看见”

    太平洋健康险:送你一朵小蓝花,?让更多“罕见”被“看见”

       每年二月的最后一天是国际罕见病日。今年的主题是“关注罕见、点亮生命之光,弱有所扶、践行人民至上”。2月29日,中国太保(601601)旗下太平洋(601099)健康险“小蓝花”公益项目携手上海宋庆龄基金会、上海交通大学医学院...

    2024.03.02 17:44:04作者:adminTags:罕见小蓝儿童上海公益
  • 中新股什么意思

    中新股什么意思

    中新股是什么意思?在金融市场中,中新股是一个专业术语,指的是投资者在新股发行过程中成功申购到新上市的股票。这个过程通常涉及到新公司的首次公开募股(IPO),也就是公司首次向公众投资者出售股票。中新股可以为投资者带来潜在的盈利机会,同时也是资...

    2024.03.02 17:43:02作者:adminTags:新股投资者中签申购发行
  • 黄金为什么一直跌

    黄金为什么一直跌

    近期,黄金价格的持续下跌引起了市场的广泛关注。作为传统的避险资产,黄金通常在经济不确定性增加时受到追捧,但为何会出现持续下跌的局面?本文将从宏观经济、货币政策、供需关系等多个角度进行分析。宏观经济环境的变化黄金价格与全球经济形势密切相关。当...

    2024.03.02 17:42:03作者:adminTags:黄金价格资产市场避险
  • 记者调查儿童化妆品销售乱象:学校附近小卖部把大人彩妆卖给孩子

    记者调查儿童化妆品销售乱象:学校附近小卖部把大人彩妆卖给孩子

      转自:法治日报   “玩具店里怎么在卖儿童眼影?化妆品成了儿童可以随意买到使用的‘玩具’?”这是北京市朝阳区居民李青(化名)今年过年时的疑惑。     记者近日调查发现,不少儿童在使用儿童化妆品,但一些儿童化妆品却在玩具店里销售,甚至出...

    2024.03.02 17:40:02作者:adminTags:化妆品儿童金盾眼影使用
  • 社会保障基金是什么

    社会保障基金是什么

    社会保障基金概述社会保障基金是一种由国家或地方政府设立的,旨在为社会成员提供经济保障的专项基金。它通常包括养老保险、医疗保险、失业保险、工伤保险和生育保险等。这些基金的目的是帮助个人在面临退休、疾病、失业、工伤或生育等特定情况下,能够获得一...

    2024.03.02 17:39:03作者:adminTags:基金社会保障社会投资国家
  • 什么是基金净值和估值

    什么是基金净值和估值

    在投资领域,基金净值和估值是两个非常重要的概念,它们对于理解基金的表现和价值至关重要。本文将为您详细介绍这两个概念,帮助您在投资决策中做出明智的选择。基金净值(Net Asset Value,简称NAV)是指基金每份份额的价值。它是通过计算...

    2024.03.02 17:38:03作者:adminTags:基金净值估值投资者进行

添加新评论