华为云AI-Native智算存储,加速AI推理应用

2024-09-20 20:48:59     来源:

9月20日,在华为全联接大会2024期间,华为云成功举办AI Native Cloud主题论坛。华为云在论坛上解读业界首家以内存池为中心的大模型推理存储架构,以及AI-Native智算存储如何使能模型加载快、对话问答快和查询检索快,邀请行业领袖分享AI推理技术及华为云基础设施在游戏、影视制作、办公软件等领域的应用成果。

EMS助力大语言模型降时延、提吞吐

显存有限是业界公认的影响大模型训练和推理效率的一个难点,也就是业界所说的内存墙难题。“华为云首创EMS弹内存存储服务,在NPU显存和持久化存储两层间增加弹内存存储层。基于Memory Pooling专利技术,通过显存扩展、算力卸载、以存代算三大创新打破内存墙。”华为云首席产品官方国伟在《AI Native Cloud: 全新为AI负载和应用设计的云基础设施》主题演讲中指出。

华为云首席产品官 方国伟

EMS弹内存存储服务为AI推理应用带来3大价值

 以存代算,缓存和复用历史KV计算结果,首Token时延降低 80%;

 算力卸载,KV计算卸载至CPU+EMS,吞吐量提升100%;

 显存扩展,无需堆砌NPU,NPU算力节省50%。

AI推理应用已在各行各业开花结果。作为中国首个游戏人工智能实验室,网易伏羲每年都会在游戏AI领域推出新的玩法。今年,网易伏羲推出了全球首创的游戏Copilot AI队友,为玩家带来丝滑的多模态游戏交互体验。其中,为了实现乎真人的问答效果,时延成了一大挑战。“我们与华为云联合创新,在伏羲的多轮对话和公共前缀场景使用EMS内存存储进行体验优化,测试结论显示了4大优化:更大的容量,有了EMS,算力卡可以搭配TB级的虚拟显存;更高的吞吐,测试结果显示,QPS请求数提升了40%;更低的时延,EMS使能首字节时延降低84%;更高的效率,P95时延降低了32%。真正地做到了以存强算,让Copilot AI队友可以实现如真人般的流畅对话。”网易伏羲语音技术负责人莫名在《AI x 游戏,可实时语音交互的游戏队友》主题演讲中表示。

网易伏羲语音技术负责人 莫名

日国产3A游戏爆火,让大家看到了国内CG(计算机图形学)动画技术的日新月异。作为国内头部的电影视效公司,墨境天合创新地将大语言模型及图像模型应用到视效制作中。“在剧本拆解、镜头规划场景中,墨境天合使用AI辅助加速传统人工工作内容,显著提升了视效制作效率。在剧本拆解应用中,将剧本内容作为同样的文本多次输入,受显存限制,每一轮与LLM的交互均需重新计算,越问越慢,且剧本内容越长,对时延的影响越大。我们与华为云存储进行了联合创新测试,结果显示:使用EMS后首字节时延降低了75%,吞吐量增加了22%,大大提高了剧本拆解和镜头规划工具应用的效率。”墨境天合AI算法工程师负责人李晨阳在主题演讲《AI x视效制作,探索人工智能在影视制作中的应用与突破》中表示。

墨境天合AI算法工程师负责人 李晨阳

OBS知识湖存储使能海量数据高效检索

大语言模型与企业业务场景结合的过程中,RAG(检索增强生成技术)是目前最成熟也是应用最普遍的关键技术。在将RAG应用到生产环境中时,如何高效的处理企业海量规模的非结构化数据,仍然面临诸多工程上的挑战。方国伟表示:“华为云基于OBS服务构建了实现语义向量化的知识湖存储,简化客户针对海量数据实现RAG方案的难度。基于读、写、算分离把千亿级规模场景下数据的读能从百毫秒级降到10毫秒以内。同时,我们把对能要求高、访问频繁的索引层放在内存,并结合超高价比的对象存储来实现持久化。通过高低结合,不仅能更高,整个成本做得更优,实现50%的成本降低。”

华为云首席产品官 方国伟

WPS AI是金山办公旗下基于大语言模型的人工智能办公助手,锚定AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三个战略方向发展。如果把大模型比做发动机,那么企业知识就是燃料。为了更好地搭建企业知识与大模型之间的桥梁,金山办公提出了AI Docs智能文档库解决方案,使能全程闭环的可控智能。“今天的企业AI知识库,仍然面临众多的技术挑战。其中如何支持千亿规模的文档量级、在大并发请求的同时保持高效检索、消减数据幻觉是数据存储面临的挑战。为了解决传统向量数据库明显的读写能和成本问题。AI Docs目前在和华为云OBS知识湖存储进行共创,探索能够支持更大规模的文档量级、检索更精准、速度更快的使用体验,给企业AI提供更好的赋能。”金山办公助理裁朱熠锷在《AI x办公,WPS AI 高效智慧办公助力企业提效》主题演讲中指出。

金山办公助理裁 朱熠锷

全面智能化时代已然来临,每个行业、每个企业都有自己的探索。华为云存储正积极响应推理模型崛起的变革,通过不断创新为千行万业提供安全可靠、稳定高效的云存储产品与解决方案,携手客户、伙伴,共赢数智未来。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

华为云Stack解读国家政务云参考架构,助力全球政府云上跃迁
技嘉X870/X870E系列主板新品曝光: AORUS MASTER超级雕焕新启航
微软张祺 | 在 AI 技术的“觉醒年代”,微软再次定义生产力工具
通过华为云全联接大会2024,看数字人应用的无限可能
华为Mate XT三折叠新机上市,携手闪回科技推出以旧换新福利
钉钉会议、斑马智行合作升级,商务座舱变身智能会议室
袋鼠云亮相2024云栖大会,带来Data+AI数智化产品与方案
“税务风险检测”如何选择?9款税务体检产品综合测评
乐视与腾讯云宣布达成战略合作,开启双方在云计算领域的深度合作
华为云解决方案工作台,使能企业解决方案一站式高效管理
南京市建邺区与华为云签约,加速AI大模型技术产业化进程
华为云赋能中山制造业数字化转型
华为云加速企业数智跃迁,以卓越成就卓越
ST盛屯:碳排放管理初见成效 探索ESG高质量发展
华为云石冀琳:全面上云,企业数智跃迁才能走得更远、更稳、更快
华为(深圳)全球具身智能产业创新中心正式启动
药融云品牌升级:摩熵数科,开启数据赋能生命科学新征程!
全国科普日 |“地壳一号”:探索地球深处的奥秘
华为发布智联集成行业解决方案,助力客户打造行业领先的目标网络
中国电信榆林分公司携多项“新成果”亮相第十八届榆林国际煤炭暨高端能源化工产业博览会
奇墨ITQM亮相2024云栖大会,荣获阿里云产品生态伙伴成长进步奖
香港大学与华为签署战略合作协议 共推ICT基础设施联合创新及样板点打造多领域合作
公信力为基,透明化为翼,微博与公益机构共创公益传播新范式
加速园区进入智能时代,华为云推动园区数智升级打造下一代智慧园区
猛玛传奇C1无线图传为直播而生,唯快不破
西门子Xcelerator首次亮相云栖大会
摩尔线程荣获国家级专精特新“小巨人”企业称号
明月如约,共期美好——以苏轼《水调歌头》续千年雅趣
华为携手伙伴发布“城市安全大模型解决方案”——共筑城市安全大模型,助力城市安全发展
华为云黄瑾:五大关键能力打造业界领先的汽车云基础设施,加速产业升级