智谱AI持续领跑国产大模型，GLM-4在司南OpenCompass 2.0评测中稳居国内第一

近期，大模型开源开放评测体系司南（OpenCompass 2.0）公布了2024年4月大语言模型最新评测榜单，智谱AI的GLM-4继续保持国产大模型第一的领先身位。

大模型开源开放评测体系司南（OpenCompass 2.0）由上海人工智能实验室发布。其月度榜单从基础能力和综合能力的设计出发，构建了一套高质量的中英文双语评测基准体系，对主流开源模型和商业API模型进行了全面评测分析。评测榜单涉及的大语言模型和多模态大模型超过150个，更有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。

在4月客观评测榜单中，OpenCompass基于语言、知识、推理、数学、代码、智能体六个维度构建了15000余道高质量中英文双语问题，并引入OpenCompass团队首创的循环评估 (Circular Evalution) 策略，系统性分析了国内外大模型的客观性能。其中，GLM-4位列第四名，仅次于GPT-4-Turbo系列与Claude3-Opus，成为国内大模型客观评测月度总榜第一名。在语言维度方面，GLM-4分数达到57.7分表现突出，超过GPT-4-Turbo系列与Claude3-Opus。在知识维度上，GLM-4得到68.9分，超过第二名的GPT-4-Turbo-1106，与第三名Claude3-Opus不相上下。

值得一提的是，GLM-4此前便长期占据OpenCompass 2.0榜单前列，并多次在权威榜单与全球顶级大模型一较高下。清华《SuperBench大模型综合能力评测报告》显示，GLM-4在语义理解等方面的能力表现超过了GPT-4-Turbo等国际一流模型，在代码、智能体等方面，排名国内第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准中，GLM-4斩获一项A+及多项A级评价，在国内大模型中排名第一。

据了解，GLM-4是由智谱AI于今年1月推出的新一代基座大模型。GLM-4整体性能逼近GPT-4，它可以支持更长的上下文，具备更强的多模态能力。同时，它的推理速度更快，支持更高的并发，大大降低推理成本。依托GLM-4 All Tools能力，GLM-4智能体能够实现自主根据用户意图，自动理解、规划复杂指令，自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。

开发者可以通过智谱AI大模型开放平台bigmodel.cn接入GLM-4模型开放API，便捷高效地体验GLM-4的强大能力。

标签：

猜你喜欢

AIGC技术先锋、大模型应用创新，容联云再获两项认可

中国移动为文旅行业高质量发展注入新质生产力

康迈在ACT Expo推出最新货运效率解决方案

摆脱繁琐一省到底，快递100独家冠名第七届企业行政峰会

拓维信息28周年 | 在数智大时代书写“AI+鸿蒙”发展新篇章

中国移动“心级服务龙行龘龘“ 520西湖呈现好服务

5.22易能时代划时代新品发布会，为你揭晓超快充新时代

守住安全底线，构建坚实屏障，闪电指L60Max坚持打造“更快更安全”开锁体验

吉猫临智能门锁M30Pro：全面融入静脉解锁技术，让生活更加简单、更加便捷！

兼顾个性与百搭三星Galaxy Buds让你和夏日撞个满怀

惠民行动进行时，西北这家运营商打响服务金字招牌！

迪安诊断携肿瘤“防-筛-诊-治-康”整体解决方案亮相中国县域卫生发展论坛

2024中国高校计算机大赛智能交互创新赛启动，关注创新技术承担社会责任

以数智助力医药创新！太美医疗科技出席第四届上海数字创新大会

广东移动牵头成立“人工智能+”产业联盟发布生态合作计划

游戏本轻薄本全数上阵天猫开门红购ROG爆款笔电享7重优惠

华为云助力河北数字化转型：构建安全的数据环境

架构设计与业务稳定性仍是第一要务，那除此之外呢？

All in AI催生新动能，华为云开天aPaaS展望智慧城市新趋势

瑞声科技WLG产能成倍提升，玻塑混合镜头市场发展再加速

小牛电动开启618大促：爆款车型最高直降1400元，3款新品陆续发售

薪火相传守望国产GIS 吴信才教授铜像揭幕

2024第十二届高校GIS论坛全面启动！谋“新”重“质”，融合共生

广州理工学院荣获“鲁班杯”数字孪生创新应用大赛全国总决赛一等奖

首位定下中国太空船票的青年企业家诞生，正佳集团CEO谢萌引领商业综合体太空新潮流

全球厂商之最，华为17篇论文入选国际数据库顶会ICDE 2024

美的电饭煲超级工厂，探秘五星好米饭的“智造”之路

产教融合聚英才|华为ICT大赛2023-2024江西省赛颁奖典礼暨华为ICT人才联盟双选会圆满举办

警惕这些网络钓鱼陷阱！（附网络钓鱼趋势报告全文）

热点图片

要闻

宏碁超车布局AIPC新变革，搭载Window11和高通骁龙X的下一代AIPC抢先上架！
今日，微软举行Windows 11 AI发布会，会上微软展示Windows11系统集成的全新AI软件，
京东“618”购物盛典闪耀来袭！博奥真Bioagen引领抗衰新风尚
近年来,为了让更多用户重新找回简单、快乐的消费体验,各大线上平台均已作出改变。以京
来到合肥怎么拍最有特色的打卡照
合肥市，别名庐州，是中国安徽省的省会，是一座拥有丰富历史底蕴的城市。虽然合肥不是
实战攻防季：主动猎捕，让0day漏洞无处遁形
2024实战攻防演练即将开启,网络安全形势日益复杂,攻击方的攻击手段不断升级,0day漏洞
苏州博物馆的文创“显眼包”从抖音电商“火”进日常生活
2024春节假期，苏州市姑苏区平江历史文化街区里挂起了各色彩灯，迎接前来赶集的八方游
华为云助力天津滨海新区中小企业数字化转型开启数字化转型新篇章
5月20日，天津滨海新区中小企业数字化转型发展论坛暨智能测控装备制造行业数转阶段性
好用不伤电池｜星云家用充电桩充满安全感
在新能源汽车成为出行新趋势的当下,充电安全成为车主们关注的焦点。福建星云电子股份
鸿蒙生态，原生应用星河璀璨！
5月20日,来自全国600家科技企业的高管在鸿蒙生态万象新原生应用合作交流会上聚集一
芒果TV 宣布完成鸿蒙原生应用Beta版，打造AI时代智能影音新体验
芒果TV近日与华为共同举办鸿蒙全面合作签约仪式，宣布芒果TV完成鸿蒙原生应用Beta版开
京东618盛宴启幕，博奥真御力维携大促福利惊喜来袭
随着夏日脚步的临近,电商界的年度盛事——京东618全球年中购物节于2024年5月20日晚8点

智谱AI持续领跑国产大模型，GLM-4在司南OpenCompass 2.0评测中稳居国内第一

相关阅读

猜你喜欢

热点图片

要闻