最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一

2025-05-30 19:50:09     来源:

5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!

豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。

位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

图片1.png

来自SuperCLUE

报告指出,国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务,总量为1579道多轮简答题。


标签:

猜你喜欢

三星全球首款500Hz OLED电竞显示器:玄龙骑士OLED G6(G60SF)开启预约登记
5月30日晚8点京东618开启 大牌手机享国补加倍补 换新低至5折起
5月30日晚8点来京东618用“京补合约”下单 超6000元手机也能享国补
浙江国家级知识产权服务出口基地及IP服务机构再次亮相国际盛会
打造“全球一朵云”,广汽迈入出海3.0时代
网友疾呼的十项功能鸿蒙微信又实现了!你的心愿单打勾了吗?
天翼云息壤推出四大场景智能体,赋能企业制胜AI时代
微博火速上线用户期待的直播开播,用户心愿单达成!
楼层定位4.0 +马路级定位,小天才旗舰Z11打造儿童安全守护天花板
温州元宇宙创新中心前瞻:当AI数字人遇上电商,下一个增长爆点藏在这些场景里
中小微企业创新突围:一品威客破解创意与技术难题
用户心声,火速响应!鸿蒙应用焕新助阵nova 14端午畅玩
引领国产化笔记本新潮流 联想开天N8 Pro性能领先!
国产化台式机首选 联想开天M90z G1t定义高效办公新体验
纤薄背后 看三星是如何在Galaxy S25 Edge上实现突破的
华为Watch 5斩获11项权威媒体大奖,德国CHIP授予"EXCELLENT"奖
深圳英飞源掌舵人朱春辉荣登“2025中国充换电十大创新人物”榜单
匠心打磨品质,创新赋能产业未来 | 英飞源荣膺“2025中国充换电行业十大核心模块品牌”
端午假期必备:华为Pura X搭配鸿蒙应用,解锁假期更多精彩
掠夺者·圣盾7000震撼发布,搭载RTX 5090突破电竞性能新纪元!
余杭数字经济出海,NineData亮相2025年世界物联网解决方案展览会
深度对话|原力知觉:当物流机器人遇见智慧医院,如何开启百亿医疗物流新蓝海?
LG新能源荣膺产业突出贡献企业十五强 牢筑行业标杆地位
时光社TimeNexus | 解码健康营养的全链生态
肝病年轻化趋势加剧,“国货之光”倍清肝四维守护肝脏健康
六一成“大儿童”狂欢节,潮玩市场规模年增速20%
这届抖音618女装商家太野了,把直播间开到了赛里木湖
抖音精品喜剧系列短剧全数上线,喜人卡司领衔主演笑点无限
帆书APP6月好书预告,樊登对谈岳晓东:让深陷困境的孩子振作起来
京东开门红福利拉满 购ROG游戏本新品部门地区享至高2000元国补