MedBench最新榜单出炉!润达医疗联合华为揽获评测双冠

2025-05-06 21:55:03     来源:

5月6日,医疗大模型评测MedBench发布新版评测榜单,润达医疗与华为基于华为云盘古大模型创新研发的润医医疗大模型以92.9分在自测榜单中拔得头筹,在专业评测榜单中以85.2分荣膺桂冠。润医医疗大模型在医学语言理解、医学安全和伦理等核心测评维度中表现突出。

最新版MedBench榜单(2025年2月版)

MedBench作为中文医疗大模型权威评测,由上海人工智能实验室、上海市数字医学创新中心联合多家机构打造,已成为全球医疗AI领域重要参照标准之一。目前,已累计评测全球387个医疗大模型,从医学语言理解、生成、知识问答、复杂推理及医疗安全伦理五大维度,提供客观科学的能评估。

润医医疗大模型能够一举斩获双料第一,甚至在自测榜单中,医学语言理解、医疗安全和伦理维度分别斩获122.1、103.1高分,及在专业评测榜中,医学语言理解维度斩获119.7高分,充分佐证了润达医疗在医疗大模型研发领域深厚的技术积累与强大的创新硬实力。此外,在医学复杂推理等高阶复杂医疗场景中,模型也取得了领先的效果,凸显了模型运用医学知识进行复杂分析和严谨推理的能力,将在医学辅助诊疗、提升医疗效率和准确率等方面发挥重要作用。

多维能力突出 重构人机协同范式

润医医疗大模型在华为云盘古大模型L0层的基础上,训练使用了千亿级高质量的中英文医学文献、医学指南、书籍,及千万量级医疗健康档案和知识图谱等数据,融合高质量通用数据,构成了润医医疗大模型底座。

从技术特来看,380亿高参数量赋予模型强大的学能力,使其能够精准捕捉医疗数据中的复杂模式与内在关系,显著提升语言理解和生成能力,足以胜任各类复杂医疗任务。而支持32k序列长度,则确保模型具备卓越的长文本处理能力,能够充分理解上下文语义,极大增强对复杂医疗文本的分析解读效能,可在多轮对话、复杂病例分析等应用场景中优势明显。作为大模型训练的核心要素,海量高质量数据为模型提供了丰富且准确的知识来源,可有效提升模型泛化能力,使其在各类实际医疗场景中能够做出更精准的判断与决策。

基于模型底座,润达医疗还创新研发了循证推理引擎,通过构建“动态权重分配、证据链追溯与不确定量化”的“三位一体”临床决策系统。其中,动态权重分配确保了模型可实时聚焦关键医学信息;证据链追溯则通过知识图谱,能够验证推理路径;不确定量化则对模糊信息进行概率评估。三项创新机制的协同运作,有效将模型幻觉率严格控制了在医疗级安全阈值内。不仅如此,润达医疗还打造具有双向进化机制的可信AI大脑,在服务医生的过程中持续学临床反馈,反向优化自身推理路径,重构人机协同范式,让AI成为医生智慧的延伸,更精准地满足医生和患者的知识需求,真正成为医疗场景中可靠的智能助手。

得益于多项核心创新技术的有力支撑,润医医疗大模型在MedBench评测的多个维度中均展现卓越能,尤其是语言理解与医疗安全和伦理维度。在医学语言理解上,动态权重分配、证据链追溯与不确定量化机制协同,可精准捕捉文本关键信息与逻辑。而在医疗安全与伦理维度,“循证推理+可信AI”架构深度剖析复杂场景,严格审查伦理风险,为医疗质效提升与合规安全筑牢双重保障。

真实场景验证 赋能医疗质效革新

从技术突破到民生福祉,润达医疗基于大模型和数据治理的智慧医疗解决方案,贯穿“防-治-管”全流程,提供覆盖疾病预防、诊断治疗、患者管理的全生命周期服务,已在智慧检验、病情分析、病历生成与质控、区域健康管理等多维度真实医疗场景中完成实践验证,成功实现智慧诊疗全场景落地应用。

基于润医医疗大模型,润达医疗与美年健康共同孵化的国内首款AI私人健康管理师“健康小美”,截至今年3月底,其智能主检应用已在美年健康109家体检中心上线应用,且审核并生成超39万份体检报告,重点指标精准率90%+。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

孚知流入围全国八强,斩获微软开发者挑战赛「最佳智能交互奖」
超30万元汽车大奖!懂车帝第二届车友杯高尔夫公开赛5月24日开赛
AGON爱攻即将发布全新CS2深度定制电竞显示器
时尚圈2025都在追的风!竟然是宏碁非凡Go Air“超轻”风
IBM翟峰:2025年是AI智能体规模应用的"拐点时刻”
惊喜首发,Veekos 60配列键盘新选择
第四空间户外空调S2 Pro:科技赋能,悄然拓展全球商业版图
高士推出箱包配饰解决方案,革新箱包手袋行业制造工艺
突破速度极限,定义未来视界丨深视智能实时传输系列高速相机震撼上市!
壹指快付:深耕本地生活数字化,赋能实体经济新未来
金税四期下商户的破局之道——壹指快付以数字化方案助力合规经营
数字化转型赋能线下消费新生态:壹指快付助力实体门店破局增长
平衡针灸创新技术深入解析
深耕人工智能技术 创新驱动发展 ——记吉林大学人工智能学院宋轩教授
数贸会九月启幕:“杭州六小龙”组团出海 输出中国数字方案
2024云计算市场排名出炉,AI驱动市场集中度提升
1个客服服务2000个群?用好AI智能营销工具,以技术减少线索浪费、提升成交服务效率!
央视《新闻直播间》栏目报道致景科技用AI技术赋能纺织服装产业链
“抖音足球少年行”县域邀请赛在北京大兴举行,48支球队参赛
Cellerator口服干细胞获高净值人群热捧 抗衰新纪元引发行业关注
打破陆地界限!“飞行摩托”国内首秀
印章管控数智合规,动码印章AI智能印章赋能第八届数字中国建设峰会
每日互动与中国电信携手共进 以生态合力加速AI技术普惠 | 2025数字中国
解码PCIM :从德国到亚洲,PCIM Asia上海,260+企业展示功率器件最新突破
技嘉科技横扫 2025 iF 与红点设计大奖,展现全产品线研发实力
解码Z世代AI使用场景:Soul发布用户行为研究报告
中兴通讯亮相数字中国峰会 以算力普惠赋能AI普及落地
闲置屋顶=光伏存折?“阳老金”给你算笔养老钱
同款中兴路由器抖音售价超出京东70元 下单前还需多比价
WAW微博游戏动漫展盛绽顺义,ACG驱动区域文旅竞争力跃升