中文多模态理解榜单发布腾讯混元国内第一

2024-08-06 09:26:12 来源：

多模态理解是大模型理解复杂现实世界的关键能力之一。

8月2日，中文多模态大模型SuperCLUE-V基准8月榜单发布，腾讯混元大模型凭借其在多模态理解方面的卓越表现，在众多参评模型中脱颖而出，斩获国内大模型排名第一，稳居卓越领导者象限。

多模态理解，俗称“图生文”，要求模型能准确识别图像元素，理解它们的关系，并生成自然语言描述。这既考验图像识别的精确度，也体现了对场景的全面理解、对细节的深度洞察，考验模型对复杂现实世界的理解力。

本次测评涵盖了国内外最具代表性的12个多模态理解大模型，包含4个海外模型和8个国内代表性多模态模型，评估内容包含基础能力和应用能力两大方向，以开放式问题对多模态大模型进行评估。腾讯混元大模型在多模态基础能力和应用能力方面，获得总分 71.95 的高分，显示出在技术和应用层的综合优势。

据SuperCLUE官方介绍，评估标准涵盖了理解准确性、回应相关性和推理深度等维度，打分规则结合了自动化定量评分与专家复核，以确保评估的科学性和公正性。

评测结果显示，国内大模型在多模态理解的基础能力方面，已经逼近海外顶尖模型，其中腾讯混元大模型总成绩仅略低于GPT-4o，表现好于CLaude3.5-Sonnet和Gemini-1.5-Pro，显示国产模型在基础能力上的快速迭代。而在应用能力维度上，腾讯混元大模型凭借对中文语境的深刻理解，以及在通用、常识、图像等多领域的综合能力，展现出实际应用的巨大潜力。

依托腾讯混元大模型的技术底座，AI 原生应用腾讯元宝在发布之初，就具备多模态理解能力，无论是文档截图、人像风景、收银小票，还是任意一张随手拍的照片，元宝都能基于图中内容给出自己的理解和分析。

腾讯公司副总裁蒋杰此前表示，对于腾讯混元大模型来说，多模态是一道“必答题”，目前混元大模型正在积极部署从多模态到全模态的技术，用户将很快可在腾讯元宝 App、腾讯内部业务及场景中体验，同时会通过腾讯云向外部应用开放。

目前，腾讯混元大模型已扩展至万亿级参数规模，在国内率先采用混合专家模型（MoE）结构，依托腾讯大语言模型的能力，多模态理解能力不断提升，达到国内领先水平。

标签：

相关阅读

PGYTECH全新发布相机背带Air（复古款）& 腕带Air—原创快拆生态互联

中文多模态理解榜单发布腾讯混元国内第一

蓝瀚互动Airline惊喜起航ChinaJoy，让每位玩家体验绝佳出海航线，飞跃全球！

智谱x邮储银行应用入选2024年全球数字经济大会人工智能大模型场景应用典型案例

这场大会即将在京召开！华为云邀您共探云如何加速应用鸿蒙化

天猫精灵高端新品「哇哦闺蜜机」发售，随时随地开启影院级视听体验

天猫精灵IN糖6正式亮相，重新定义百元级智能音箱

华为岳坤：提升系统安全，加速原生创新，奋进智能时代

生日带“8”的老板有福啦！爱采购《你好！厂长》第七期首映礼重磅官宣！

顶峰相见，OPENAIGC开发者大赛8.17上海决赛开启！

猜你喜欢

青云科技受邀光合组织领导人大会分享 AI 创新成果，与海光展开深度合作

麻辣红包创始人刘大：从露宿公园到中国餐饮味道背后的男人

“中国智造”领航！安凯客车闪耀巴黎

Dataphin V4.2重大升级：上线敏捷版，打通数据资产管理和消费，开启数据价值放大新篇章

人与AI能真正成为朋友吗？Soul App为行业提供可行方向参考

更醒目、更大胆带你看懂三星Galaxy Z Flip6的工艺设计

有问题问小艺，请查收这份夏日美好生活攻略

钉钉发布“AI迎新百事通”，智能化助力高校开学季

三星Galaxy Z Fold6：AI加持、性能跃升刷新移动体验上限

至高享1000元换新补贴即刻出发用三星Galaxy系列旗舰手机记录出游美好瞬间

云原生领域首个国标发布！深信服全程参与编写

世界集成电路协会（WICA）发布2023年全球半导体市场自由度国别报告

恒益传承勇担责任 “恒友汇”卢波深耕乡土农情绘就“绿水青山”

冬奥首金得主杨扬：短视频时代，塔尖之外的退役运动员获得了更多机会

deepinV23与Intel Ultra宣布适配，最适合AIPC的操作系统来啦~

WPS宣布推出基于deepinV23的个人版

联云世纪携手GMI Cloud：打造亚太至全球AI算力服务新引擎

聚合全球物流，快递100发力国际/港澳台寄递业务

科技赋能的观赛新高度：三星Neo QLED 8K系列解锁巴黎奥运的视听盛宴

华为商城“她之选”甄选七夕好礼：为她送上专属心意

紫光闪存 UNIS SSD S2系列固态硬盘即将登陆紫光闪存京东自营旗舰店

华为家庭绿电观穹系列新品上市，重塑宅邸用电方式

ALPD激光放映技术“掘金”中东市场

新型计算赋能数智社会，携手GCC引领产业未来

333 万、重庆三峡银行《财务共享平台项目》：致远互联（中）

163 万、信创 OA 大单：致远互联（中）

基础医学教育“智慧教学+X”模式实践出成果

顺丰供应链×极智嘉：革新冷链物流，3小时快速履约，锁住新鲜！

中移金科电子保证平台发挥数据要素积极作用，推动采购生态转型升级

英威皓齿携手清华阳光口腔，引领AI隐形正畸技术新高度

热点图片

要闻

提品质扩产能！网易天成宠粮工厂正式启动
2024年8月3日，网易严选专业宠物品牌网易天成宣布与山东帅克集团合作，成立网易天成宠
一条视频卖出千支电笔，抖音电商同行者王建省分享创业经历
7月24日，抖音电商寻找同行者在北京举办新收入·新消费主题分享会。拥有超过800万粉丝
餐饮商家上分时刻，「抖音超燃夺金夜」喊你组队突围
引言巴黎时间，四年一战。是运动员上场的夺金赛场，也是众多行业商家的生意赛场。赛事
“玉禾田杯”梦享佳俱乐部夏季掼蛋联赛圆满收官
伴随着巴黎奥运会力与美的角逐，历经一个多月的航行后，梦享佳携手玉禾田打造的团队复
瑞莱智慧与赣州智研院达成战略合作
7月31日，瑞莱智慧与赣州市智能产业创新研究院签署战略合作协议，双方将发挥各自在人
AI中国时刻、AI智能解说……揭秘这届奥运会背后的AI科技观赛力量
2024年巴黎奥运会激战正酣，当来自各国各地区的运动员们在赛场上奋力拼搏时，以人工智
12载技术革新，依图科技大模型驱动智慧城市新纪元
在人工智能的蓬勃发展时代,依图科技以其深厚的技术底蕴和创新精神,成为了行业的领航者
建好城市生命线系统提升城市韧性和承载力
7月28日凌晨，长沙市城市生命线管理系统内涝预警模块开始预警：凌晨4时，金星北路某街
助力高原旅游发展，倍益康氧饱饱共享便携式制氧机发布会在拉萨重磅召开
2024年8月3日，倍益康氧饱饱共享便携式制氧机项目发布会在西藏拉萨举行。众多业界精英
中关科技满绣文化产业基金平台成立推动非遗文化产业化发展
2024年8月2日，中关科技满绣文化产业基金平台揭牌仪式在中国民协满绣文化研究与传承基