中国电信开源12B星辰大模型,携手昇腾推进大模型全栈国产化进程

2024-04-18 13:35:04     来源:

中国电信消息,近日中国电信人工智能研究院开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%其中,多轮推理、安全问题等领域提升超40%。在C-evalMMLUAGIEVAL等国际权威榜单上,排名处于国内同级别参数开源模型的前列,进一步促进大模型开源生态繁荣,助力AI产业加速高质量发展。另据悉,中国电信将于年内开源千亿级参数大模型。

中国电信人工智能研究院(TeleAI)坚持完全自研自主可控,在中国电信首席技术官、首席科学家、TeleAI院长李学龙带领下,加快研发创新,不断优化底层模型结构,解除Word Embedding与lmhead共享参数,有效提升模型稳定性和训练效果,并基于精细化的CheckPoint效果验证,进行动态的数据配比优化调整,大幅提升模型训练效果。

海量高质量数据是保证大模型效果的基础,TeleChat-12B将7B版本1.5T训练数据提升至3T,优化数据清洗、标注策略,持续构建专项任务SFT(监督微调)数据,优化数据构建规范,大大提升数据质量;同时,基于电信星辰大模型用户真实回流数据,优化奖励模型和强化学习模型,有效提升模型问答效果。

TeleAI通过彻底地开源推动大模型技术进步,同时携手华为昇腾,推动大模型全栈国产化进程。此次开源提供基础模型以及基于相应版本的对话模型、不仅支持传统的全量参数更新还支持 LoRA 等只更新部分参数的高效微调方法、支持Deepspeed微调、支持int8、int4量化。

在推动大模型全栈国产化进程,TeleChat-12B已支持昇腾AI基础软硬件:推理方面,支持Atlas 300I DUO推理卡,精度与性能表现均与业界第一梯队持平。已规划支持Atlas 800I A2推理服务器;训练方面,支持昇腾训练服务器,用户可使用昇思MindSpore和PyTorch框架进行多机多卡模型训练和微调,两个框架下模型精度与性能均有不俗表现。当前在多个项目中,已基于昇腾技术完成模型商用落地。下一步规划基于天翼云昇腾智算集群,训练多种尺寸的TeleChat模型,以AI赋能千行百业。随着电信与华为昇腾合作的不断深入,电信已经培养出一支成熟的昇腾开发者团队,为人工智能技术自主可控贡献专家力量。

加速探索创新的同时,星辰大模型也在深入推动人工智能与各行各业的融合,积极探索新兴的应用场景。星辰语义大模型已应用于行文写作、代码编程、网络故障分析以及经营分析等场景,以行文写作为例,其平均生成字数超过1500字,有效采纳率达到85.7%;在对外企事业单位客户的业务中,星辰语义大模型支持企业经营分析、政务公开咨询、民生诉求接待等场景,可覆盖95%的实际业务场景,多轮理解准确率达到90%。除传统行业应用场景,星辰大模型积极探索前沿领域应用,赋能具身智能,解决无人机编排投入多、开发量大的问题,实现无人机智能编排轻量化建设。

据悉,星辰大模型已广泛应用落地,赋能千行百业转型升级。客服大模型在全国试点上线18个服务场景,充分赋能智慧客服和数字人,在激活十亿级的日志、百亿级的网络参数等海量数据资产的基础上,进一步深化智能化运营;星辰政务大模型已落地某市民生诉求场景,为市民提供在线文本问答服务,提升政务服务能力,提高市民满意度;星辰经分大模型已落地某市经信局行业大模型,利用大模型生成能力快速草拟相关产业研究报告,简化知识检索流程,快速、精准查询所需知识内容,以便迅速、准确地掌握发展动态,支持决策过程,并追踪全球经济形势和科技创新,满足迫切的产业洞察和分析需求。

 

标签:

猜你喜欢

杨元庆:真AI PC必备五大特征,PC迎来真正个人时代
星环科技与英特尔携手举办“AI PC激发知识的力量”研讨会,共探智能PC新未来
2024抖音电商第一季度阅读报告:商城带动出版社销量同比增长209%
夸父炸串APP注册会员超110万名,数字化成效明显
真我realme徐起:中国市场我们就是要做质价比之王
思尔芯助力加速WiFi 7射频IP验证系统发布
华为云AI大模型产业应用创变营,加速培育东莞企业新质生产力
旗舰7940HX与RTX4060独显高能加持 华硕天选5 Pro百亿补贴价7998元
守护成长每一步,《蛋仔派对》护航未成年人网络安全
震撼首发!旭显未来推出全球首款真Micro LED 4K大屏
MongoDB扩大与谷歌云的合作,助推各行业客户部署和扩展新型应用
广州全面拥抱原生鸿蒙生态,多领域企业级应用率先启动开发
谷东科技发布2024首款工业AR智能眼镜,助力制造业开启空间计算时代
业界首创512GB CXL AIC内存扩展卡,江波龙革新AI与高性能计算领域内存技术
艾修堂新品智能砭石灸MS1正式亮相,创新科技赋能健康养生
解读前沿理论,赛乐瑞莱复隆,辅助机体再现年轻态
“AIGC第一股”出门问问招股持续火热 发售超额认购超13倍
万物“智”联,九方智投迈入智能合规3.0时代
华为Net Master+高清网络数字地图,加速迈向L4自智网络,跃升数字生产力
F5G-A全光品质运力网,联接无处不在的智能
政策利好、国资加持,“AIGC第一股”招股首日火爆迎超额认购
中国移动首个信创适配基地启用!信创发展开启新阶段
Net5.5G时代已到来!华为全面引入AI技术加速迈向网络智能化
与毛孩子一起撒欢,东芝联手萌生万物举办萌宠生活节
汇聚智慧力量,vivo蓝河操作系统创新赛引领行业新潮流
IDC发布2023年中国超融合市场报告:深信服位居第一
十方融海威科未来TensAI生成算法入选国家互联网信息办公室算法备案,AI应用再创新高度
腾讯会议发布腾讯天籁inside3.0,为厂商提供AI音视频算法解决方案
以科技探秘稠油开采“深水区” ——记中国石油大学(北京)教授庞占喜
​白嫖高端算力!使用潞晨云轻松驱动Open-Sora AI视频生成