九章云极再发新论文 AI开源模型复现解锁新方法

2025-03-13 11:19:39     来源:

近日,中国人民大学STILL项目团队、北京智源研究院团队、九章云极DataCanvas联合发布了大模型慢思考推理系列研究成果:在DataCanvas Alaya NeW智算操作系统上完成初步复现类R1推理模型,并向外界完整开源了强化学习与监督微调的训练代码与训练数据。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME 2024数学推理测试中超越DeepSeek-R1的模型性能。

该研究成果发布在知名技术社区GitHub后,引发了广泛关注。

自DeepSeek-R1技术报告公布后,慢思考推理模型的复现仍然面临训练细节缺失、超参数调试复杂等共性难题,九章云极DataCanvas联合团队通过AI基础设施深度融合‌实现突破。研究开源了该模型在DataCanvas Alaya NeW智算操作系统上完成的强化学习与监督微调全过程完整训练日志、训练数据及容器化部署方案,为当前大多数的复杂推理大模型复现提供了从理论到实践的完整闭环支持。

值得关注的是,DeepSeek以及蒸馏模型在推理过程中无法调用外部代码工具。针对这一问题,该研究结果介绍了九章云极新的工具增强推理模型STILL-3-Tool-32B在AIME 2024基准测试上的领先表现。研究结果显示,该模型在AIME 2024基准测试中取得了81.70%准确率(采样),超越了DeepSeek-R1满血版,以15.56%的显著优势超越其基座训练模型,与OpenAI o3-mini持平,并超越OpenAI o1。

研究结果显示,DataCanvas Alaya NeW智算操作系统在开源工具链与基座模型适配、算法与算力协同、逻辑推理与多步决策等复杂任务框架方面表现出明显优势。业界人员表示,这一成果不仅验证了九章云极在大模型慢思考推理、强化学习训练框架方面的深厚积累,也为开源模型复现提供了新的思路和方法。

在业界看来,完整复现DeepSeek-R1模型存在较高技术门槛,但也为此带来较大研究契机。此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,九章云极凭借强大的技术储备和人才储备,通过长期深耕,系统掌握大模型慢思考推理技术。同时,九章云极注重技术的开源与产品化,致力于让普通开发者像拼乐高积木一样快速搭建出类R1性能的推理模型,实现了 "低成本高回报" 的技术跃迁。

据悉,该相关研究成果已形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,已在全球科研人员前沿成果预印版论文网站arXiv发表。

 

标签:

猜你喜欢

专属大模型构建指南:神州数码爱问学私密AI知识库深度解析
丰知:物流供应链领域的深度解析助手
三月运动正当时 用三星Galaxy Watch开启健康生活
科技驱动行业变革——吕洪森引领广告装饰行业迈向智能化未来
全球钯金创新应用大赛现已开放报名
光伏下乡激活乡村振兴“绿色引擎”,创维光伏探索“双碳”战略新路径
追觅打入高端空气净化器市场,智能化与高端化双轮驱动
第二届AIGC创新赛开启,vivo携手开发者共推AI发展
华润隆地选择华为云昇腾AI云服务,基于DeepSeek展开业务创新
中国500强矿企超半数选择钉钉,钉钉发布AI+矿业解决方案
助力科技中国战略!盖泽参编的《埋层硅外延片》GB国家标准正式实施
火花编程:让孩子在趣味中掌握未来必备技能
平均年龄不到30岁,这群年轻人在抖音把紫砂玩出新花样
三星无镉量子点显示技术获SGS认证
AI 驱动的新变革:银河麒麟智算操作系统赋能千行百业
优质香椿、春笋、春茶原产地直供,抖音电商助你实现“春菜自由”
IEC新增滤波器材料透过率标准,三安方案推动全球产业链工艺革新
信创PC排行榜揭晓 联想开天X1信创笔记本斩获第一
追觅科技官宣进军厨电领域!3月20日AWE首秀,重构厨房科技想象力
像读中文论文一样读英文论文!百度翻译发布AI论文精翻
科大讯飞与华为云战略签约,MWC25世界移动通信大会见证讯飞同传AI同传翻译新高度
纯电动汽车报价大全怎么挑?2025款上市!上汽大通MAXUS大家7值回票价!
MOVA免提式真热水洗地机 X40 Pro,解锁清洁新“净”界
杭州北冥聆心推出智能情感交互设备——探索AI陪伴新形态
MOVA 携扫地机等全系智能产品登陆AWE 2025,重塑家居市场格局
西交利物浦大学团队刷新抗量子密码领域全球纪录,后量子密码迁移实验室正式揭牌
新疆国补落地京东 首批消费者已收到国补手机等数码产品
抖音生活服务联动监管开展专项整治 济南历下区66家违规餐饮商家被“下架”
鸿蒙原生版京东等多款APP下载量破200万 下周来京东提前锁定华为新机
重磅!迈途云与华为昇腾云正式达成深度合作 ,硅基风暴助力AI开辟新篇章!