自主研发,从零训练:腾讯自研混元大模型正式亮相

2023-09-09 18:34:54     来源:

9月7日,在2023腾讯全球数字生态大会上,腾讯首次公开了完全自主研发的通用大语言模型——腾讯混元大模型。得益于全链路自研技术,腾讯混元大模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。

腾讯从2021年开始,曾先后推出了千亿、万亿级参数模型。经过多年时间的持续研发投入和积累,以及在实际应用中不断地自主研发创新,腾讯目前已经完全掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。腾讯混元大模型的诞生,也是腾讯在大模型领域多年的积累和探索的成果。

据了解,混元大模型是从第一个token开始从零训练的。通过采用预训练“探真”技术、动态锯齿状注意力机制、位置编码优化、原创思维链策略等创新的大模型算法,使得大模型事实幻觉率相比主流开源大模型减少30%—50%,并让大模型能够真正像人一样识别问题陷阱,并结合实际的应用场景进行推理和决策。

此外,混元大模型还使用了自研的机器学习框架Angel,使得训练速度相比业界主流框架提升1倍,推理速度比业界主流框架提升1.3倍。

得益于在算法、学习框架等各个层面进行的一系列自研创新,混元大模型已经具备良好的可靠性和成熟度,其上下文理解、长文记忆能力和逻辑推理能力表现优秀。

在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现,特别是在中文的理科、高考题和数学等子项上表现突出。

腾讯混元大模型是一个从实践中来,到实践中去的实用级大模型。它不仅展示了腾讯在大模型领域的技术实力和创新能力,更体现了腾讯在将人工智能技术应用到实际场景中的探索和实践。通过与产业数据和场景相结合,混元大模型为解决产业痛点带来了全新的思路和方案。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

爱尔康屈光全光塑全球首发 爱尔眼科医院集团与爱尔康达成战略合作
倍思实用而美数码空间限时登陆,Baseus 倍思×王一博邀你来玩!
聊城市人民政府与华为签署战略合作协议
爱尔康屈光全光塑全球首发 华厦眼科医院集团与爱尔康达成战略合作
深信服与第一线达成战略合作:共同打造SASE“云网安”融合新范式
碳评价网快讯:高领碳信申报2023年度“中国节能协会创新奖碳中和领域企业贡献奖”
开启拎电时代 罗马仕掀起充电新浪潮
华为深度参与2023数博会,打造数字经济增长新引擎
云领齐鲁,智赋万企 2023华为云山东828 B2B企业节正式开幕
氢创科城战略合作伙伴签约仪式盛大举行
从世界计算·长沙智谷出发 向全球研发中心城市进军
十九岁胶原锤美容仪亮相IFA:感受科技美护的力量
体验“光显”精彩,洲明三大亮点打造2023世界显示产业大会火爆展位
双碳战略下 看唯一网络如何打造绿色节能数据中心
APUS与腾讯达成战略合作,携手深化产业赋能
《二手手机交易规范》标准正在制定中,闪回科技推动行业规范发展
「即时上线」新增整站发布功能 可将多个设计稿页面发布为真实 H5/网页
联想thinkplus与腾讯云深化合作,重塑智能设备全新体验
赋能供应商 正泰新能举办绿色供应链主题研讨会
金秋荟萃 | 全球首款西普尼智能金表亮相香港钟表展
擎朗智能亮相重量级国际会议:中国移动东南亚区域合作会议,服务机器人引人注目
勇攀科研高峰 潜心教育奉献
软件开源新生态中,英特尔扮演了什么样的角色?
易跑CEO胡强 | 马拉松跑步机的创新之路
该换表了!OPPO Watch 4 Pro正式开售,到手价2199元起
全空间三维GIS技术前瞻,MapGIS 10.6 Pro焕新而来
腾讯云发布智能制造WeMake 2.0,助工业企业打造孪生工厂和模型工厂
连续两年!高灯科技再次入选【2023Cloud 100 China】榜单
爱医伴“医学生随身学习智能助手” 让医学成绩提升的更快更全面
推动科技与农业需求场景深度融合,腾讯持续助力智慧农业建设