中文多模态理解榜单发布 腾讯混元国内第一

2024-08-06 09:26:12     来源:

多模态理解是大模型理解复杂现实世界的关键能力之一。

8月2日,中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元大模型凭借其在多模态理解方面的卓越表现,在众多参评模型中脱颖而出,斩获国内大模型排名第一,稳居卓越领导者象限。

多模态理解,俗称“图生文”,要求模型能准确识别图像元素,理解它们的关系,并生成自然语言描述。这既考验图像识别的精确度,也体现了对场景的全面理解、对细节的深度洞察,考验模型对复杂现实世界的理解力。

本次测评涵盖了国内外最具代表性的12个多模态理解大模型,包含4个海外模型和8个国内代表性多模态模型,评估内容包含基础能力和应用能力两大方向,以开放式问题对多模态大模型进行评估。腾讯混元大模型在多模态基础能力和应用能力方面,获得总分 71.95 的高分,显示出在技术和应用层的综合优势。

据SuperCLUE官方介绍,评估标准涵盖了理解准确性、回应相关性和推理深度等维度,打分规则结合了自动化定量评分与专家复核,以确保评估的科学性和公正性。

评测结果显示,国内大模型在多模态理解的基础能力方面,已经逼近海外顶尖模型,其中腾讯混元大模型总成绩仅略低于GPT-4o,表现好于CLaude3.5-Sonnet和Gemini-1.5-Pro,显示国产模型在基础能力上的快速迭代。而在应用能力维度上,腾讯混元大模型凭借对中文语境的深刻理解,以及在通用、常识、图像等多领域的综合能力,展现出实际应用的巨大潜力。

依托腾讯混元大模型的技术底座,AI 原生应用腾讯元宝在发布之初,就具备多模态理解能力,无论是文档截图、人像风景、收银小票,还是任意一张随手拍的照片,元宝都能基于图中内容给出自己的理解和分析。

腾讯公司副总裁蒋杰此前表示,对于腾讯混元大模型来说,多模态是一道“必答题”,目前混元大模型正在积极部署从多模态到全模态的技术,用户将很快可在腾讯元宝 App、腾讯内部业务及场景中体验,同时会通过腾讯云向外部应用开放。

目前,腾讯混元大模型已扩展至万亿级参数规模,在国内率先采用混合专家模型(MoE)结构,依托腾讯大语言模型的能力,多模态理解能力不断提升,达到国内领先水平。

 

标签:

猜你喜欢

青云科技受邀光合组织领导人大会分享 AI 创新成果,与海光展开深度合作
麻辣红包创始人刘大:从露宿公园到中国餐饮味道背后的男人
“中国智造”领航!安凯客车闪耀巴黎
Dataphin V4.2重大升级:上线敏捷版,打通数据资产管理和消费,开启数据价值放大新篇章
人与AI能真正成为朋友吗?Soul App为行业提供可行方向参考
更醒目、更大胆 带你看懂三星Galaxy Z Flip6的工艺设计
有问题问小艺,请查收这份夏日美好生活攻略
钉钉发布“AI迎新百事通”,智能化助力高校开学季
三星Galaxy Z Fold6:AI加持、性能跃升 刷新移动体验上限
至高享1000元换新补贴 即刻出发用三星Galaxy系列旗舰手机记录出游美好瞬间
云原生领域首个国标发布!深信服全程参与编写
世界集成电路协会(WICA)发布2023年全球半导体市场自由度国别报告
恒益传承 勇担责任 “恒友汇”卢波深耕乡土农情 绘就“绿水青山”
冬奥首金得主杨扬:短视频时代,塔尖之外的退役运动员获得了更多机会
deepinV23与Intel Ultra宣布适配,最适合AIPC的操作系统来啦~
WPS宣布推出基于deepinV23的个人版
联云世纪携手GMI Cloud:打造亚太至全球AI算力服务新引擎
聚合全球物流,快递100发力国际/港澳台寄递业务
科技赋能的观赛新高度:三星Neo QLED 8K系列解锁巴黎奥运的视听盛宴
华为商城“她之选”甄选七夕好礼:为她送上专属心意
​紫光闪存 UNIS SSD S2系列固态硬盘即将登陆紫光闪存京东自营旗舰店
华为家庭绿电观穹系列新品上市,重塑宅邸用电方式
ALPD激光放映技术“掘金”中东市场
新型计算赋能数智社会,携手GCC引领产业未来
333 万、重庆三峡银行《财务共享平台项目》:致远互联(中)
163 万、信创 OA 大单:致远互联(中)
基础医学教育“智慧教学+X”模式实践出成果
顺丰供应链×极智嘉:革新冷链物流,3小时快速履约,锁住新鲜!
中移金科电子保证平台 发挥数据要素积极作用,推动采购生态转型升级
英威皓齿携手清华阳光口腔,引领AI隐形正畸技术新高度