传媒:Gemma 2发布,降本提效延展AI生态 华金证券 2024-06-28(3页) 附下载
发布机构:华金证券发布时间:2024-06-28大小:296.7 KB页数:共3页上传日期:2024-07-01语言:中文简体

传媒:Gemma2发布,降本提效延展AI生态华金证券2024-06-28.pdf

摘要:投资要点热点事件:6月27日,Google面向全球研究人员和开发人员发布Gemma2大语言模型,目前有90亿参数(9B)和270亿参数(27B)两种大小,并将在未来几个月发布参数为26亿的Gemma2模型,更适合智能手机的人工智能应用场景。大语言模型持续迭代,降本增效有望加速AI赋能B端和C端应用和生产。Gemma2带来效率和性能的提升。目前,Gemma2共推出9B和27B两种参数,与上一代相比性能大幅度提升,但部署要求大幅度下降,只需一块NVIDIAH100TensorCoreGPU或TPU主机就能使用。架构方面:基于上一代进行了全方位改良,使用局部滑动窗口注意力和全局注意力,其中局部注意力层的滑动窗口大小设置为4096个tokens,全局注意力层的跨度设置为8192个tokens。训练数据方面:Gemma2的27B模型使用了13万亿tokens的英文数据进行训练,9B模型使用了8万亿tokens数据,这些数据包括网页文档、代码、论文和科学文章等。训练策略方面:Gemma2使用了知识蒸馏方法,通过学习大型教师模型给出的输出概率进行训练,以较小规模复制卓越性能。通过MBPP、MMLU、ARC-C、GSM8K、BBQDisambig等知名基准测试平台的综合评测,Gemma2在多项基准测试中表现出色,例如在MMLU5-shot(Gemma-2得分75.2%,显著高于Gemma-1的42.3%)、ARC-C25-shot、GSM8K5-shot等测试中,27B模型相比之前版本和其他标准模型(如Mistral和LLaMA-3等)均有显著提升。在其他数学推理、逻辑问题解决和常识问答等任务上,Gemma2同样展示了在处理复杂认知任务方面的强大效能。Gemma2在降低成本同时显著提升能效,在硬件端降低使用门槛,利好铺展AI生态。Gemma2(2.6B)有望赋能端侧AI生态。预计将在未来几个月内发布的26亿Gemma2模型将更适合智能手机的AI应用场景。相较Gemma-12.5B,Gemma-22.6B几乎在所有指标测评中实现超越,尤其在MMLU5-shot(提升9个百分点)和GSM8K5-shot(提升8.8个百分点)提升相对显著。随着Apple、Samsung等移动终端和联想、惠普等PC对端侧AI需求的逐渐提升,优质轻量模型的迭代和发展符合需求端的增长。我们看好轻量模型迭代催化对端侧AI的持续赋能。投资建议:优质模型持续迭代,降本增效,有望拓展AI生态,多元赋能千行百业发展。建议关注:腾讯控股、网易-S、美图公司、汤姆猫、昆仑万维、恺英网络、巨人网络、世纪天鸿、蓝色光标、南方传媒、天娱数科、引力传媒、捷成股份、视觉中国、华策影视、因赛集团、天下秀、上海电影、华扬联众、掌阅科技、顺网科技、中广天择、万兴科技等。风险提示:政策不确定性、AI落地不及预期、宏观环境波动风险等。

免责声明:
1.本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。
2.如发布机构认为违背了您的权益,请与我们联系,我们将对相关资料予以删除。
3.资源付费,仅为我们搜集整理和运营维护费用,感谢您的支持!

合集服务:
单个细分行业的合集获取请联系行研君:hanyanjun830

关于上传者

文档

386

粉丝

0

关注

0
相关内容
加入星球
开通VIP,可免费下载 立即开通
开通VIP
联系客服 扫一扫

扫一扫
联系在线客服

公众号

扫一扫
关注我们的公众号

在线反馈
返回顶部