浪潮信息发布 “源2.0-M32” 开源大模型,大幅提升模算效率

2024-05-29 09:37:42     来源:

5月28日,浪潮信息发布“源2.0-M32”开源大模型。“源2.0-M32”在基于“源2.0”系列大模型已有工作基础上,创新性地提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

在算法层面,源2.0-M32提出并采用了一种新型的算法结构:基于注意力机制的门控网络(Attention Router),针对MoE模型核心的专家调度策略,这种新的算法结构关注专家模型之间的协同性度量,有效解决传统门控网络下,选择两个或多个专家参与计算时关联性缺失的问题,使得专家之间协同处理数据的水平大为提升。源2.0-M32采用源2.0-2B为基础模型设计,沿用并融合局部过滤增强的注意力机制(LFA, Localized Filtering-based Attention),通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确,进而提升了模型精度。

Figure1- 基于注意力机制的门控网络(Attention Router)

在数据层面,源2.0-M32基于超过2万亿的token进行训练、覆盖万亿量级的代码、中英文书籍、百科、论文及合成数据。大幅扩展代码数据占比至47.5%,从6类最流行的代码扩充至619类,并通过对代码中英文注释的翻译,将中文代码数据量增大至1800亿token。结合高效的数据清洗流程,满足大模型训练“丰富性、全面性、高质量”的数据集需求。基于这些数据的整合和扩展,源2.0-M32在代码生成、代码理解、代码推理、数学求解等方面有着出色的表现。

在算力层面,源2.0-M32采用了流水并行的方法,综合运用流水线并行+数据并行的策略,显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。针对MOE模型的稀疏专家计算,采用合并矩阵乘法的方法,模算效率得到大幅提升。

基于在算法、数据和算力方面全面创新,源2.0-M32的性能得以大幅提升,在多个业界主流的评测任务中,展示出了较为先进的能力表现,在MATH(数学竞赛)、ARC-C(科学推理榜单上超越了拥有700亿参数的LLaMA3大模型。

Figure2 源2.0-M32业界主流评测任务表现

源2.0-M32大幅提升了模型算力效率,在实现与业界领先开源大模型性能相当的同时,显著降低了在模型训练、微调和推理所需的算力开销。在模型推理运行阶段,M32处理每token所需算力为7.4GFLOPs,而LLaMA3-70B所需算力为140GFLOPs。在模型微调训练阶段,对1万条平均长度为1024 token的样本进行全量微调,M32消耗算力约0.0026PD(PetaFLOPs/s-day),而LLaMA3消耗算力约为0.05PD。M32凭借特别优化设计的模型架构,在仅激活37亿参数的情况下,取得了和700亿参数LLaMA3相当的性能水平,而所消耗算力仅相为LLaMA3的1/19,从而实现了更高的模算效率。

浪潮信息人工智能首席科学家吴韶华表示:当前业界大模型在性能不断提升的同时,也面临着所消耗算力大幅攀升的问题,对企业落地应用大模型带来了极大的困难和挑战。源2.0-M32是浪潮信息在大模型领域持续耕耘的最新探索成果,通过在算法、数据、算力等方面的全面创新,M32不仅可以提供与业界领先开源大模型相当的性能,更可以大幅降低大模型所需算力消耗。大幅提升的模算效率将为企业开发应用生成式AI提供模型高性能、算力低门槛的高效路径。M32开源大模型配合企业大模型开发平台EPAI(Enterprise Platform of AI),将助力企业实现更快的技术迭代与高效的应用落地,为人工智能产业的发展提供坚实的底座和成长的土壤,加速产业智能化进程。

源2.0-M32将持续采用全面开源策略,全系列模型参数和代码均可免费下载使用。

代码开源链接:https://github.com/IEIT-Yuan/Yuan2.0-M32

模型下载链接:

Huggingface:

https://huggingface.co/IEITYuan/Yuan2-M32-hf

ModelScope:

https://modelscope.cn/models/YuanLLM/Yuan2-M32-hf/summary

 

标签:

猜你喜欢

深信服AICP算力平台在2024数字中国创新大赛两个赛道获奖
佳创视讯亮相深圳文博会——以数字科技推动文旅业态发展
深耕民族国粹 助力中医药创新 ——湖南中医药大学王宇红
青云科技全周期服务,引领企业信创数字化升级
ESIS-2024第二届中国电子半导体数智峰会圆满落幕,一键查看峰会精彩瞬间!
瑞健未来携高压氧舱亮相“CIHIE·健博会”!时光珠、时光梭倍受关注
《庆余年2》火爆荧屏,张若昀代言的可漾饮品,品牌影响力飙升
腾讯AI助力“甲骨文大数据回乡之愿”
弥知科技闪耀欧洲 Viva Tech 2024,AR+AI与世界对话 探索消费未来
且慢APP放大招!AI小顾更快、更准、更懂你
闫衍:政策效应释放将支撑中国经济稳中向好
公司动态 | 圆璟科技与联通支付有限公司签订权益商城合作协议
因格智能公司摘得第七届全球高层次人才创业大赛物流装备分赛桂冠
“数字中国视角下的全民数字素养”论坛在京举办,共议全民数字素养与智能化未来
抖音发布2024自然科学数据报告,过去一年77亿人次为相关内容点赞
多元化增长动能强劲,中微公司薄膜设备新品层出
自然心理疗法 创造健康福祉 ——记中国科学院心理研究所张向阳教授
校园创业新星王俊杰:从“梦想家”到“创新创业引领者”
中国联通携手格力与华为完成5G-A工业基站首商用
华尔永盛:引领智能科技,照亮智慧生活
华尔永盛KNX智能照明系统:品牌实力与创新之光的CE认证之路
新炬网络亮相XCOPS 2024,基于大模型的智能运维能力建设备受瞩目
2024 XCOPS智能运维管理人年会广州站圆满落幕
筑梦九载,再启新程 梦派科技打造新视界,开启2.0筑梦新时代
年轻人的露营新伴侣!LG StanbyME Go让露营生活更精彩
国民级IP再掀热潮!鱼耳APP×《甄嬛传》跨界联动玩出“甄学”新花样
以数字技术守护记忆,“全国科技周”腾讯聚焦阿尔茨海默病
龙翼航空亮相第八届世界无人机大会
重磅发布!龙翼航空高层消防无人机救援系统解决方案,EV660重载物流无人机等产品实力亮相第8届世界无人机大会
国潮品牌+元宇宙,网易瑶台助力上海外服打造沉浸式求职新体验