运营商重磅首发!大规模专家并行推理集群实现3倍吞吐

2025-03-26 15:49:52     来源:

近日,移动云成功部署基于国产算力的 “大规模专家并行”推理集群,在移动云MaaS平台,COCA推理系统上线,实现DeepSeek MoE大模型跨节点高效集群推理。该方案突破性实现单卡吞吐提升3倍,Decode时延降低50%,推动人工智能技术革新。

当下,人工智能产业正处于迅猛发展的黄金时期。大模型MoE结构不断迭代,从少量大专家向大量小专家演进,这种转变犹如从"全能型教授"转向"专科医生团队",让每个专家更专注于特定领域,从而显著提升模型的整体效果。然而,要让大模型真正普及开来,性能是绕不开的关键因素。在这样的背景下,大规模专家并行技术凭借其更大的吞吐能力和更低的时延,成为推理系统的重要发展方向。

强强联合,释放算力极致性能

移动云与华为强强联合,在软件技术和并行策略等多个维度展开深度创新,充分释放昇腾AI算力底座的极致性能。双方聚焦跨节点专家并行部署难题,将DeepSeek V3/R1大模型的288个专家巧妙分布到不同的卡上,实现权重占用减少75% 。同时,通过优化AlltoAll通信,效率提升了35%。在此基础上,叠加专家热点均衡算法,成功保障实例内负载均衡。

平台升级,推理服务高效稳定

移动云MaaS平台基于大规模专家并行方案构建大规模、高可靠、高性能的推理引擎能力体系,通过优化P&D算力分配提升资源利用率,采用拓扑感知调度提升跨节点通信效率,并依托多级容灾机制实现故障快速隔离与恢复,实现移动云MaaS服务在AI推理性能倍增的同时保障业务连续性,最终以更优成本效益为客户提供高效稳定的推理服务。

推理优化,COCA推理吞吐极致发挥

这一大规模专家并行推理集群中,COCA推理系统为大云磐石超节点和智算裸金属集群提供了强大的赋能支持。移动云借助定制化的优化算法和智能调度策略,将昇腾硬件的并行计算能力发挥到极致,大幅提升整体推理吞吐。更值得一提的是,在多个关键技术层面,移动云深入挖掘国产硬件的潜力,为国产算力的崛起贡献了坚实力量。

此次移动云大规模专家并行推理集群的成功部署,对于推动我国在AI底层架构和国产化技术协同领域的自主创新,具有重要意义。未来,移动云将为行业数字化转型提供关键技术支撑,助力千行百业在智能化浪潮中加速前行。

 

标签:

猜你喜欢

IDC:腾讯云持续领跑中国传媒行业视频云市场,解决方案、基础设施双项领先
传神语联发布深度思考大模型-T1:根原创铸基,任度双脑开启AI深度思考新高度
智能交互再升级 语聊视界正式登陆三星Galaxy S25系列
2025年KIC中国创业大赛&韩国创新企业路演K-Demo Day在京成功举办
国内首个!2025 AI“巨”场·中国AI创造力大展即将启幕
新壹科技发布MoE架构金融解决方案:AI风控合规效能提升超60%
至近路径,至大航道:华为云发布六大协同,助力中企出海亚太
桥田自动换模解决方案:更高效,更安全,更智能!
管家婆iShop「MYI—AI数智天团」发布:重构ERP人机协作范式,开启AI智能管理新纪元
中国首款AI CRM深度拆解丨6大Agent场景一文吃透
杭州铭师堂助力高考复习备考,漓江之畔绽放教育智慧
4K花园支持产业伙伴完成F1大赛毫米波直播创新试点
明惠电子:从传统到智能,AI质检为电子束焊接按上“智能眼”
树根互联根灵工业大模型发布,工业智能赛道领军者实力出圈
国产替代加速:本土AED企业占据九成市场份额
全面升级!顺丰大件重新定义行业时效标准
华为云发布“云上丝路·AI上华为云”出海计划 为伙伴出海保驾护航
IROS 2025将于杭州举办,开启中国机器人发展与国际交流新契机
从“浅尝”到“深爱”,华为云Stack打通政企应用DeepSeek最后一公里
5G-A场馆包极速加持观赛新体验!体育馆现场视频照片轻松发布
布局全球谋发展 华宝国际赢战国际市场
再摘iF桂冠!工业设计顶级奖项“全满贯选手”——普渡机器人,持续闪耀商用清洁赛道
产学研深度融合 无限极携手各界共启"十四五"国家科研项目
心言集团创始人任永亮受邀出席创业黑马营,分享泛心理行业AI化实践与思考
抖音电商助力国货品牌线上转型,小镇奶奶一年卖出珍珠120万单
Q4营利均超预期 金山云增长前景受大行看好
如何规避公共网络风险?DeepSeek首推WiFi万能钥匙!
古安泰X5系列孔探仪亮相2025广州MRO展引关注
多场景多模态全能,平板笔记本ROG幻X 2025 128GB版本上新预约中
vTrus SSL证书阿里云三月智慧采购季首购4折倒计时!