华为存储携手中科弘云发布AI推理加速方案破解长序列推理难题

2025-12-23 18:18:07     来源:

2025 年 12 月 23 日,华为数据存储与中科弘云在上海练秋湖联合举办发布仪式,正式推出 AI推理加速联合解决方案。该方案以华为 OceanStor A 系列存储为数据底座,深度结合中科弘云 HyperCN 智算互联网云服务平台,通过软硬件协同创新,有效提升算力资源利用率、优化长序列推理体验,为 AI推理应用的规模化落地提供坚实支撑。

当前,AI产业发展重心已从模型训练转向推理应用,随着大模型应用场景不断拓展,Token调用量呈爆发式增长,长序列推理面临 “推不动、推得慢、推得贵”三大核心问题。同时,算力平台需适配多元存储、异构算力以及不同AI框架,叠加算力孤岛化、成本黑盒化、开发碎片化与迁移协同等复杂痛点,进一步制约了AI应用发展。

为破解上述困境,华为数据存储与中科弘云发挥双方技术优势,强强联合推出AI推理加速联合解决方案。该方案深度融合华为OceanStor A系列存储产品、华为UCM推理记忆数据管理技术以及中科弘云HyperCN平台能力,通过KV Cache多级缓存管理、秒级算力调度、分钟级大模型推理部署及全流程AI工具链,把智能算力精准输送至业务一线,为企业业务赋能。该联合方案的核心优势如下:

l 异构管理:支持平台、计算与存储的协同联动,适配英伟达、华为昇腾、寒武纪等多元AI算力,兼容MindSpore/vLLM/SGLang等主流框架,并通过Kubernetes与华为OceanStor A系列存储实现无缝对接。

l 算力调度:对算力资源进行细粒度切分与池化处理,按需灵活调度,实现资源利用率最大化;具备集群作业调度、运维监控、故障恢复等功能,支持分钟级任务恢复与系统健康监测。

l 推理加速:依托UCM将KV Cache持久化至华为OceanStor A系列存储,实现推理记忆全量保存,减少重复计算;融合Prefix Cache、GSA稀疏加速等算法,有效降低首Token时延(TTFT),让长序列推理吞吐与体验得到倍数级提升。

l 端到端AI工具链:覆盖数据管理标注、算法开发、大小模型训练推理、智能体开发全流程,支持传统机器学习与深度学习开发,实现AI资产的统一建设与集中管理。

经过实测,在智能问答场景中,该方案实现TTFT降低57.5%,且序列长度越长,TTFT降低效果越显著;在长文档推理场景中,结合GSA稀疏加速算法,当序列长度为39K时,并发能力提升86%,推理吞吐提升36%,大幅提升推理效率与体验。

目前,该联合方案已在能源电力、智能制造、国家实验室等关键行业启动试点应用。未来,华为将与中科弘云持续深化战略合作,聚焦技术创新与产业需求融合,助力更多企业加速数智化转型步伐。

中科弘云是由中科计算技术西部研究院孵化的国家高新技术企业,业界领先的企业级智算云平台软件和服务提供商,北京市AIGC产业链算力层“专精特新”企业。中科弘云拥有涵盖异构算力调度、全流程算法开发工具链和企业级智能体平台的全栈智算云平台解决方案,已服务制造、能源、电力、交通等关键行业的上百家头部客户。

 

标签:

猜你喜欢

“投资成都”盖碗茶走进深圳 锦江区牛市口街道瞄准新质生产力精准招商
双星闪耀妈妈网2025母婴品牌口碑榜,Mama&Kids以专业守护母婴肌肤健康
共探企业法律服务新未来!云砺(票易通)罗兰出席胡润智榜·法商融合私享会
驰芯半导体获权威认证,跻身汽车安全最高等级
人力数字化转型必看:8大人力资源管理系统核心差异对比
天津市发展改革委党组书记、主任戴永康到身边云调研服务 推动经济持续向好
南沙区托育综合服务中心正式揭牌 “暖南托育,育见未来”生育友好行动同步启动
江苏龙瑞君峰亮相抖音电商滋补健康年终峰会,携客户产品精准对接达人资源
协同创新筑生态 跨界融合启新程 —— 中国汽车芯片联盟 2025 全体成员大会在沪圆满举办
大模型技术+场景深耕的双轮驱动,银河通用机器人成中国具身第一
墨迹天气会员服务升级:从精准服务到温暖陪伴的年终回馈
来京东先人一步预约小米17 Ultra 0.01元锁定5年1次电池保
惊喜节日礼 三星Galaxy Buds3系列为你点亮圣诞季
紫光展锐5G SoC T9300上市,影音游戏全面升级
三瑞智能即将上会:深耕动力系统领域,无人机领域技术与规模领先行业
鸿蒙主题月活动启幕:喜马拉雅、天天跳绳助阵,智慧生活“6”起来
中国移动灵犀机器狗刷屏星光大赏,亲情网获艺人称赞
汽车之家荣膺“年度品牌价值奖”:以生态赋能重塑汽车消费价值
AI驱动数字基建:管家婆iShop赋能中小微企业重构经营逻辑
星光同行,回响不息!腾讯视频2025星光大赏圆满落幕
声网×珞博智能斩获 OFweek 2025物联网行业优秀成功应用案例奖
MicroLED微显示迈入2.5微米时代,轻量化AR眼镜迎来“高清显示”新革命
电竞旗舰最“夯”散热!荣耀WIN首发东风散热引擎
基石智算上线 DeepSeek-V3.2,性能比肩 GPT-5 青云AI算力云上线 DeepSeek-V3.2,性能比肩 GPT-5
智趣相伴 听我想听!QQ音乐20周年之际推出全新20.0版本
解码数智飞轮,重塑行业价值:“莫莫下午茶”华为练秋湖站引领AI转型深度对话
岁末焕新正当时!京东家居馆超级品类日每满200元减30元
山东省生物医药企业数智化转型交流会圆满召开,共探数智化发展新机遇
麒麟软件获评“国家级制造业单项冠军企业”
从"引导"到"治疗",正雅推动科学早矫,助力儿童微笑成长