智源评测:大模型打擂台,多模态图文理解腾讯混元国内第一

2024-12-31 15:28:47     来源:

2024 年以来,大模型测评领域也有新变化,为了避免“刷榜”,大模型测评机构推出“角斗场”(Arena)模式,采用随机选择模型“打擂台”的形式,面向用户开放,通过直接的提问命令和打分累计进行排名,以衡量模型能力,有效反应模型在真实应用场景中的表现。

图:智源FlagEval大模型角斗场多模态模型测评界面

在最新公布的FlagEval大模型角斗场榜单上,腾讯混元多模态图文理解大模型凭借出色的表现,位列国内大模型第一,并且在两个榜单上均与GPT4o 以及 claude 等模型同列第一梯队。

智源研究院发布的FlagEval大模型角斗场榜单

FlagEval大模型角斗场由北京智源研究院推出,接入了全球主流的大模型,并对这些模型进行长期的观察和测评。

腾讯混元是国内首个基于MoE架构的多模态大模型。在架构、训练方法和数据处理方面进行了创新和深度优化,支持任意长宽比及最高 7K 分辨率图片的理解。与大部分多模态模型主要在开源基准测试中进行调优不同,腾讯混元多模态模型更加注重模型的通用性、实用性和可靠性,具备丰富的多模态场景理解能力。

应用方面,腾讯混元多模态理解模型面向通用场景和海量应用进行了优化,积累了数千万相关问答语料,涵盖图片基础理解、内容创作、推理分析、知识问答、OCR 文档解析、学科答题等众多场景,可以完成描述图片内容、将图片转换成文本表格、解释一段代码、分析账单、做数学题等任务。这些能力已经在腾讯元宝APP 上线,并可以通过腾讯云的API调用,除了这次纳入评测的Hunyuan-vision模型,还包括上个月新发布的旗舰多模态理解模型Hunyuan-turbo-vision,具有更强大的能力。

作为实用级大模型,腾讯混元多模态理解模型目前已经在腾讯的业务场景中取得广泛应用,其中包括QQ、QQ浏览器、腾讯文档、腾讯游戏、腾讯广告、微信读书、微信小程序等。例如,在QQ说说里,可以实现自动为照片配文,在QQ浏览器里,可以通过输入照片,让AI自动识别图片并答题,在小程序教育平台中,可以通过根据图片自动写程序,提升开发效率。

此外,在腾讯广告场景中,腾讯混元大模型强大的内容理解能力,为广告个性化推荐、广告定位及效果预测提供了有力的支持,提升广告精准度和用户浏览体验。

QQ说说AI配文

QQ浏览器AI解题答疑

小程序教育平台-看图写小程序

多模态理解模型能够同时处理和理解多种模态信息,实现更全面、更深入的语义理解,它通过整合不同模态的信息,提高了AI在复杂任务中的表现,也为人工智能领域带来了新的机遇。未来,随着模型能力的不断升级,腾讯混元多模态理解模型也将推出更多大模型图片搜索、图片审核以及视频理解等多个领域的深度应用。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

德施曼智能锁斩获四项行业权威大奖!
智象多模态生成大模型3.0发布 离幻觉更远与离落地更近
凯迪仕斩获“至尊金勾”等4项重磅大奖,参编2024年度智能锁行业白皮书
持续探索,砥砺前行:王继刚先生的医疗器械行业之路
践行“人工智能+ ”行动 | 传神语联“持续实时学习”大模型斩获殊荣
直播电商卷到头了?有人找到打开2025的“新钥匙”
湖南首家试点 新五丰启用上交所股东大会提醒服务
微博推出付费社群“V+圈子”—— 打造释放生产力的多元共创模式
新壹科技:2024创新技术释放视频生产力 重塑视频创作生态
万兴科技旗下亿图脑图MindMaster鸿蒙版亮相华为系列活动 斩获双料大奖
升级数智化工作门户,看蓝凌10大客户案例
2024亚洲数字艺术展开幕
TTI AI座舱荣获“2024年度汽车智能座舱解决方案”奖项
第二季AI ARTIST发现计划成功举办
鸿蒙原生版WPS移动版再获更新,支持转换PDF和文档云同步,快去更新
精益求精,威能官方服务护航用户采暖体验
启明星辰工业无人机安全解决方案,全面筑牢低空经济安全防线
创维光伏阳光球场引领绿色未来之“光”!乡村振兴再加速!
NimbleTrack | 与用户体验共鸣,引领行业迈入智能全无线扫描时代
大模型时代的中厂:只有本地化,才能把大模型价值最大化
思看科技 X 清华大学精密仪器系三维测量课程研讨活动圆满举办
2024年脑启社区首届类脑智能创新大赛圆满举办
2024工业文化发展大会在广东中山开幕
麦学爆火,年轻人在Soul上不再掩饰“爱错”的羞耻感
精英云集 巅峰对决 | 鲲鹏应用创新大赛2024全国总决赛成功举办
技术综合评估第一!华为领跑中国函数计算市场
19.9元鼠标出现29.1元差价 网友比价发现京东比抖音更便宜
跨年来京东3C数码采销直播间 整点抢百万红包雨
首张!openGauss获国家工业信息安全发展研究中心颁发证书
AI国家队真实力!科大讯飞多方言多语种技术助力虚拟数字人登上央视首届“科晚”