全球前二、国内第一!钉钉 AI 重大技术突破,DeepResearch 国际权威测评超越OpenAI、Claude

2025-11-12 14:40:22     来源:

近日,由钉钉团队研发的深度研究系统“Dingtalk-DeepResearch”在国际权威评测中取得突破性成绩,在DeepResearch Bench测试中以48.49分位列全球第二、国内第一,超越OpenAI、Claude等主流系统。

据悉,该系统已成功应用于制造业、供应链等复杂场景,能够在复杂异构表格、多阶段推理与多模态生成任务中保持行业领先的准确性和稳健性,帮助企业高效处理多模态数据,实现智能升级。

钉钉深度研究系统的这项进展,首次实现了国际顶级基准与实际生产落地的双重突破,标志着中国企业级AI技术迈入国际第一梯队。

让多个 AI 系统像团队协作般解决复杂问题

Dingtalk-DeepResearch 的核心是设计了一种面向真实企业场景的多智能体深度研究框架,将深度研究生成、异构表格解析与推理、多模态报告生成有效整合在同一系统中。

这一设计就像是将不同专业能力的团队成员整合到一个系统中:有的擅长分析表格数据,有的负责生成报告,有的协调工具调用。通过三层架构设计(任务导向的智能体层、核心引擎层、数据层),能够支撑对复杂任务的并行处理与多阶段推理,例如将包含多重嵌套与合并单元格的工厂生产表格,自动解析并转化为结构清晰、洞察深刻的分析报告。

在线学习与演进机制,让 AI 持续进化、越用越聪明

为应对企业场景的动态变化,该框架区别于传统静态架构,通过熵引导、记忆感知的在线学习机制使智能体能够持续演进,就像员工可通过反复实践提升技能,而无需人工干预。该机制保障系统能自动从历史交互中归纳经验,逐步适应不同企业的业务流程与用户操作风格。

例如,当用户多次修改AI输出的报告格式后,系统会自主学习并记忆用户对格式、风格及关键点的偏好,在后续生成中主动对齐用户需求。在钉钉企业级AI平台中,这种经个性化调优的偏好可以作为一种能力沉淀并共享给团队乃至整个公司,实现组织知识的复用与增效。

闭环评估与优化系统,保障企业级 AI 输出质量

为确保生成内容的准确性与可靠性,Dingtalk-DeepResearch内置了DingAutoEvaluator评估系统。该系统会对生成的每一份报告进行多维度“质量检验”,涵盖数据准确性、逻辑连贯性、工具使用规范等。一旦发现问题,系统会自动将相关案例反馈至训练流程以优化模型,形成一套从生成、评估到优化的持续改进闭环。

供应链、制造业超复杂表格处理,复杂数据"秒懂"

目前,Dingtalk-DeepResearch已在多个真实业务场景中稳定应用并创造价值。在供应链领域,系统能快速分析跨部门的复杂表格数据,为采购策略提供智能化建议;在制造业,它能将设备运行的原始数据自动转化为可视化分析报告,为故障预测与维护提供决策支持。所有核心功能均通过国际基准测试验证,确保了技术的可靠性与领先性。

钉钉 CTO 朱鸿表示,“Dingtalk-DeepResearch通过结合自适应优化和多模态推理,形成一个可灵活部署的企业级AI框架,旨在处理复杂且不断演进的真实业务任务。该技术正加速在AI搜索、AI表格、自动化工作流、Agent平台等产品中落地,让前沿AI技术更贴近实际生产需求,为企业提供真正创造价值的AI。”

 

标签:

猜你喜欢

权威认证!灵科超声波“国际领先”焊接技术服务全球巨头
见证湾区时刻,新亚胜LED屏闪耀十五运会开幕式
小水智能受邀参展2025世界互联网大会 AI智能体面向世界输出中国范本
台铃在COP30上发布全球领先的绿色低碳方案 引百余国关注
“发现式智能”获国际顶尖学者热烈响应
全球首发!箭牌携手鸿蒙智选共建智慧卫浴新生态
「她掌舵」私募成绩单:浙江浩坤昇发李佳佳夺魁,徐爽押注创新药,李蓓成流量焦点
官方指定云服务提供商!天翼云以国云之力护航十五运会盛大举行
京东双十一收官!美的空调以硬核实力稳坐销冠宝座
任拓电商大数据分析工具,赋能品牌增长
首届国际工业设计奥林匹克竞赛PROD诚邀中国高中生参与
单场1200万人次!京东11.11家电家居“比价值班间”直播比价成热点
国内新锐茶饮品牌「新叶NEAVES」近日宣布完成3000万元天使轮融资,为健康茶饮赛道再添一把火
中国科大科技商学院李春晓团队斩获国际殊荣
实力夺冠!致态获京东双11 SSD品类交易总额、总销量双料冠军
京东云携手爱诗科技助力商家双十一营销:1元就能生成5秒促销视频
“上海建工杯”建筑机器人实战应用竞赛 蔚建建筑机器人独揽抹灰、喷涂金奖
蔚建科技抹灰机器人应用项目荣获上海市“白玉兰”优质建设工程奖
鸿蒙版美团外卖全新升级!自取省时、拼单省钱,神券还能送亲友
2025年哪款Vlog相机值得期待?佳能R50V给出了“全能双修”的答案
第一财经直击2025站酷设计周:不用AI的设计师不到1%
豆包-应用生成·「一点都不技术」创作挑战赛开赛!
简知科技“简智AI大模型”成功通过备案,构建可信AI教育新生态
新浪新闻探索大会丨龚宇:AI下的影视产业
在中国,为中国 Brother第八届进博会迎收官,多元打印服务受关注
抖音生活服务“非遗好去处”江苏站收官,助力南京、扬州多城非遗消费
微算法科技(NASDAQ MLGO)采用动态层次管理和位置聚类技术,修改pBFT算法以提高私有区块链网络运行效率
解锁智慧生活新姿势!花粉们用百搭负一屏玩出专属感
天威诚信推出SSL证书智能管理
蚂蚁百宝箱支持2025乌镇峰会 “桐小乌”,一箱搞定会展数智化