逼近GPT-5!SuperCLUE多模态视觉评测榜,文心4.5 Turbo并列国内第一

2025-08-29 12:51:54     来源:

8月29日消息,中文多模态视觉语言模型测评基准(SuperCLUE-VLM)8月榜单正式发布百度ERNIE-4.5-Turbo-VL多模态大模型以 66.47分 的成绩并列位居国内模型第一,在真实场景任务下的领先优势明显。

本次评估覆盖Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等国内外15款多模态模型。基于中文场景特点,SuperCLUE-VLM围绕基础认知、视觉推理和视觉应三大核心维度进行评测,全面考察模型在真实任务场景下的能力。

测评结果显示,Gemini-2.5-Pro 以总分74.99分领先,OpenAI GPT-5(high) 以总分68.59分位居第二,百度ERNIE-4.5-Turbo-VL-32k-preview 以总分66.47分并列国内模型第一。有分析人士点评,文心大模型在多模态领域的多维度领先优势十分突出。ERNIE-4.5-Turbo-VL等国内其他头部模型在视觉推理、视觉应用等高阶任务上的显著进步,凸显了中国在多模态大模型领域的竞争潜力。

111.jpg

SuperCLUE-VLM多模态视觉语言基准评测总榜

据早前公开报道,6月30日百度开源文心4.5系列10款模型,其中 ERNIE-4.5-VL视觉语言模型(ERNIE-4.5-VL-28B-A3B;ERNIE-4.5-VL-424B-A47B)具备复杂的图文与视频理解能力,支持超过100种语言交互,其跨模态能力覆盖文档处理、视频管理、学习解题等核心任务场景。

作为国内最早投入大模型产研的企业,百度依托“芯片-框架-模型-应用”的全栈自研体系,持续推动文心大模型能力进化。得益于飞桨文心的联合优化,文心大模型的能力拓展和效率提升。截至目前,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。

 

标签:

猜你喜欢

最后五天!创业教父李泽湘等你拿现金奖励+百万无责资金+千万投资!
绿源多系列新国标电动自行车发布 以技术创新引领行业高质量发展
智联招聘2025上半年安全报告:AI重拳净网,事前拦截14万违规企业
产教融合!浙江省数智管理与决策技术重点实验室与钉钉签约
鲁尔物联入选“首批高质量数据集建设先行先试项目”
鸿蒙版微博已支持HDR Vivid,画面更鲜活!社交、创作体验持续完善
网易云音乐上线「AI推荐」功能 一句话定制专属歌单
中科天玑“社会认知大脑”荣获2025人工智能全景赋能典型案例
即日起来京东领海口消费券 购荣耀、OPPO、realme等大牌手机至高立减400元
创新传承,连接古今:北京光年宏宇让传统文化"活"在当下
国家数据发展研究院携手华为重磅发布《AI CITY城市智能体前瞻研究报告》
携手百度智能云 滁州打造长三角数据要素“关键节点”
卡宾再度携手伯俊,开启时尚零售数字化新篇章
中科天玑:先行“人工智能+”行动,深化MaaS生态服务建设
沙利文峰会首落中国:中关村科金斩获三大殊荣,垂类大模型引领产业数智化升级
科脉五大力之技术力:云帆OS平台AI功能破局零售数据分析,以智能驱动经营增长
抖音电商首次公开史上最严质检体系,推动珠宝玉石行业透明化发展
重磅!紫光展锐荣获2024年度上海市科技进步奖一等奖
超强性能+潮流外装 天选6 Pro携AMD 锐龙 9 9955HX助力制霸战局
字节跳动公益“江苏非遗发展共创营”:助力推广云锦、绒花等江苏非遗技艺
立讯精密:上半年营收净利双增超两成,三大板块协同打造发展韧性
微博COO王巍出席数博会 分享AI时代数据安全挑战与治理实践
内容驱动,2025第二季度宝尊生意增长提速
宝尊电商2025Q2财报:双轮驱动成效显著 调整后经营利润实现跨越式增长
9月1日vivo Y500发布 来京东先人一步下单享限量现货抢先发
从“亚健康”到“三高”:深蓝鲲鹏南极磷虾油解锁现代健康提升方案,助力亿万中国家庭迈向健康与长寿
科脉云帆以 AI 驱动创新,闪耀第七届中国智慧零售大会
华为入局冷链:以技术底座重塑行业生态新范式
广汽x华为云:重构车机算力,重塑座舱体验车云一体
亮相2025数字医学与健康大会,华为智启医疗健康新篇章