浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

2025-08-08 11:20:03     来源:

8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计向上扩展支持64路本土GPU芯片。元脑SD200可实现单机内运行超万亿参数大模型,并支持多个领先大模型机内同时运行及多智能体实时协作与按需调用,目前已率先实现商用。在实际评测中,元脑SD200运行DeepSeek R1和Kimi K2等全参模型的64卡整机推理性能实现超线性扩展。

当前,混合专家模型(MoE)的高效架构正在驱动大模型参数规模持续扩展,国内外前沿大模型的参数量快速突破万亿规模,这给算力系统架构提出新的挑战。一方面,模型参数量增加和序列长度增加带来的键值缓存(KV cache)激增,需要智能计算系统具有超大显存空间承载,依靠单芯片或节点的性能提升已难以为继;且其推理过程作为通信敏感型计算,对分布式计算通信延时要求极高,需要构建更大向上扩展(Scale up)高速互连域。另一方面,智能体AI开启多模型协作的新范式,其推理过程需要生成比传统模型多近百倍的数据词元(token),导致计算量激增。

元脑SD200超节点AI服务器是浪潮信息面向万亿参数大模型AI时代而设计,创新研发多主机低延迟内存语义通信架构,基于开放总线交换技术构建,在单机内实现了64路GPU芯片的高速统一互连,成功解决万亿大模型对超大显存空间和超低通信延时的核心需求。在开放架构之上,元脑SD200通过智能总线管理和开放的预填充-解码(Prefill-Decoder)分离推理框架实现软硬件深度协同,智能化管理复杂AI计算任务。

- 在架构层面,元脑SD200基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连;通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可以提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。同时,依托百纳秒级超低延迟链路,构建64卡大高速互连域统一原生内存语义通信,实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。

- 在系统层面,根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分。对于全规约、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。

元脑SD200超节点AI服务器通过软硬协同系统创新,成功向上扩展突破芯片性能边界,在大模型场景中展示出优异的性能表现。结合优化的PD分离框架,SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。

当前,开源模型的飞跃式进步正在加速智能时代的到来,推动研发范式从封闭走向开放协作。同时,随着大模型参数量的持续提升,对算力基础设施的建设提出了更高要求。浪潮信息通过开放系统架构创新,为开源大模型的规模化落地和应用创新提供关键支撑。

 

标签:

猜你喜欢

中国移动:5G客户近6亿 AI直接收入高速增长
零安装割草时代,库犸Mammotion发布三目视觉割草机器人
齐鲁晚报评懂车帝科普节目:辅助驾驶夸大宣传不利于行业长远发展
巅峰品质守护极限征程 昆仑山矿泉水助力2025草原天路越野跑
Halo自然光环39周年: 以"39年FDA无召回",守护毛孩子的宠食安全
精准时钟,驱动未来 ----澜起科技发布多款高性能时钟芯片
环卫工变成智能体?中环云控打造全球首个环卫具身智能体
C-Life数智运动:AI体感游戏运动,潮玩运动体验再突破
嘉楠科技公布2025年7月比特币产量及挖矿业务更新
张予曦空降!揭幕联想moto razr 60冰钻限定版礼盒,七夕送礼新选择
两款地舒单抗注射液通过严苛审查,迈威生物借势哥伦比亚拓展拉美
传神语联携手湖北中医药高地,共启AI中医药发展新纪元
为什么家长都选小天才?小天才电话手表“楼层定位”技术全解读
从环卫驿站到特教机构 京东“城市冰岛计划”百台空调为西安送去清凉
“中国UWB芯片引领者”王俊峰率宇都通讯锚定汽车电子新蓝海
重磅!中国人形机器人产业“百强榜”全景发布
科技赋能边防训练:DPVR E4 企业版引领军事模拟新范式
华为谷云波:构建超低时延算力光网,以光强算,激发商业新增长
专访V蜜幸福创始人张心媛:在偏见与空白中,寻找被忽视的“她需求”
中国长寿科技点亮世博:瑞健未来Rlab走进日本大阪·关西世博会
打造最具影响力Rust赛事第三届vivo蓝河操作系统创新赛正式启动
中山智造扬帆!华为云城市峰会2025暨华为(中山)产业AI促进中心启动仪式即将起航
Soul打造“莫比乌斯”数字文创,重构数字社交表达
新品迭出,高端占比突破29%,鼎阳科技产品升级步入收获期
“聚势同行 智联未来”华为坤灵SOHO渠道招募会·天津站圆满举行
智能荐图+动图照片,鸿蒙版微博这些宝藏功能,让体验飞起!
立秋吃什么?抖音团购红烧肉、肘子量同比增长103%和48%
万物皆互联 细述恒生活“双螺旋”进化那5年
OKKI AiReach上线1个月:平均每个外贸商家多了1325个潜在客户
登录快,扫码更快!美团鸿蒙5专属体验让你轻松快人一步