随着智能制造的持续推进,AI与制造场景的深度融合,网络技术作为支撑企业数字化进程的“底座”,重要性和使能性也日渐凸显。企业对于网络的需求正从“单环节支持”转向“价值链共振”,场景包括AI模型的数据传输、跨地域的协同研发、业务流程的在线监控、生产资源的统一调度等。
以前用户推进网络建设,重点放在高速度、低延时。而在数字化浪潮下,如今用户更多的是追求网络的交互体验、适应变化、安全防护能力。在华为数据通信产品线副总裁赵志鹏看来,面对生成式AI技术的迅猛发展以及各种应用如火如荼的展开,搭建智能的网络基础架构,不仅仅是加快企业数字化转型的补充手段,更是突破激烈市场竞争的核心引擎。在这种趋势下,华为结合自身30年的IP网络实践,推出了面向智能时代的星河AI网络解决方案。通过创新引入大数据、智能技术和新一代协议,星河AI网络可以满足企业对于广域网络、园区网络、数据中心网络及网络安全不同场景的差异化诉求,确保各种系统及应用的高性能联接、高业务体验、高可靠安全,成为企业创新发展、培育新质生产力的“源动力”。
图 华为数据通信产品线副总裁赵志鹏
洞见未来,行业先行者的网络布局与致胜之道
在中国有句老话:“要想富,先修路。”同样在数字世界中,只有为数据交互构建一个智能化的网络基础架构,才能释放其巨大的价值。赵志鹏介绍AI技术应用已经成为企业创新发展的新阵地,以自然语言处理、图文自动生成、知识问答交互为代表的AI大模型应用层出不穷。
需要注意的是,在AI大模型开发与应用热潮背后,其暴露出的痛点也不容忽视。赵志鹏表示面对AI应用中的GPU集群使用、工具跨区域协同和多任务并行处理等要求,如何把海量数据高效传送到算力中心,充分释放算力潜能,并且快速的将算力输送给一线用户,成为了AI大模型应用落地和价值提升的关键。
以科大讯飞的星火认知大模型为例,其具有文本生成、语言理解、知识问答等7大核心能力,在新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》中位列榜首。但AI大模型在训练过程中参数规模巨大,百亿和千亿级别犹如“家常便饭”,因此需要通过基于全局的网络智能调度,才能更好的完成训练任务。另一方面,算力规模的快速变化也带来了严重的负载冲突,要想充分释放算力,网络的高吞吐率必不可少。最后,AI大模型训练过程复杂,从数据采集、管理到模型训练、优化,是一个长期的过程,网络中的任何一个微小错误都可能导致巨大的损失,高可靠的网络保障也成为了大模型调优的基础。
在“大规模、高吞吐、可靠性”的网络诉求下,科大讯飞最终决定携手华为,采用星河AI网络推进星火认知大模型的建设。首先,星河AI网络采用双层组网技术,最大可支持150万卡的互联,可以轻松完成超大规模组网,即使面对万亿参数的大规模训练也不在话下;其次,基于华为独创的全局负载均衡NSLB算法,可以使网络吞吐得到大幅度提高,让AI大模型训练效率提升超10%;最后,依托华为提供的独家网络数字地图,可以使计算网络运维一体化,通信异常一键诊断,训中排障效率提升90%。
可以看到,通过“以网强算”和“以智赋能”的双轮驱动策略,华为星河AI网络在加速AI普及应用的同时,催生出了更多的网络服务新模式。用户在构建超大规模集群,满足自身算力需求的同时,还可以按需扩缩,获得可靠的网络质量,使关键应用得到最佳网络优化,无惧网络拥塞风险。
知行合一,为用户带来全价值链的能力跃迁
“星河AI网络并不针对单一产品,而是一系列方案产品甚至是一种理念。”赵志鹏强调对于制造企业用户而言,打通数据传输的壁垒,释放数据的价值,真正做到数据驱动,才是网络建设的关键。从内部数据交互的角度,制造企业需要构建研发设计、生产管理、售后服务的产品全生命周期数据集成;从外部数据共享的角度,需要打通供应链管理、物料采购与规划等,保持与上下游的联动,同时还需要注意数据安全风险。在赵志鹏看来,只有深耕所在的细分领域,才能准确把握网络应用需求,为企业创造价值。
例如在企业研发阶段,设计人员可以基于网络实现协同研发,同时高效的获取算力支持,进而缩短产品研发周期,增强市场竞争力。例如上海大众就通过华为智能无损网络,完成了应用精准识别并进行智能流量控制,用于加速自身CAE仿真等关键研发任务,使新车研发周期从54个月压缩至40个月。
在产品生产过程中,面对消费市场的个性化、多元化需求,企业的多品种、小批量柔性化生产能力正变得尤为重要。立景创新联合华为打造了高品质无线生产网络,实现了无尘车间全无线部署,达到变产线、不变网络的效果,使其产线调整到启动新生产时间从15~30天,压缩至2~3天,极大地缩短了停产断网时间。
面对制造企业的信息孤岛问题,华为提供了工业级数采网关、TSN万兆交换机,实现了企业IT&OT的网络融合,使MES、ERP、PLM等各信息系统的数据互联互通,为上层智能决策和AI应用提供支撑。例如美的厨卫电器工厂,通过智能网络调度算法,使物料的准确抓取提升至0.3mm,放置准确率达99%以上,多工位协同自动化水平从30%提升到50%以上。
“制造企业推进网络建设只是一种手段,并不是目的。其本质是基于ICT技术提升生产效率和产品智力,实现降本增效。”赵志鹏介绍在帮助制造企业提升企业竞争力和效益方面,华为星河AI网络正在从最初的单点探索应用转向生产全生命周期的渗透,通过支持端到端的网络应用,为制造企业应用创新带来更多可能。
四大场景,凸显多元化和差异化技术优势
推进智能制造是一项复杂的系统工程,企业网络建设同样不能一蹴而就。“网络的建设难点在于它融入了多项技术、多种学科。”很多企业目前网络建设实际效果并不理想,就是没有因地制宜,没有将自身需求与实际场景进行匹配。对此,华为的星河AI网络划分了数据中心网络、广域网络、园区网络和网络安全四大场景,通过技术创新精确匹配客户的需求。
数据中心网络的首要任务是高效算力释放,赵志鹏介绍在从云时代到AI时代的演进过程中,用户的关注点正逐渐从CPU转向GPU,特别是复杂AI模型下的GPU集群应用,数据与业务的紧耦合也导致用户对于网络丢包等问题格外敏感。对此,华为星河AI网络通过全局负载均衡NSLB算法、iReliable算法以及创新的数字地图运维能力,提高网络性能的同时兼顾可靠性,使用户充分释放算力,做到管理无忧、业务永续、持续演进。
广域网络承载着对算力的弹性调度使命,华为星河AI网络基于智能流量管理、灵活弹性带宽和可承诺的SLA,使数据流能够更好、更快、更平衡的流转。通过融入自适应路径选择算法等,使网络拥有低时延选路,应用级可视等能力,并且SPFC精准流控技术还可以支持远距离、高吞吐的无损网络传输。
针对园区网络的用户体验优化核心诉求,华为星河AI网络通过全场景Wi-Fi 7的全无线网络使用户无线体验升级;针对企业中重要的办公应用和用户,能动态识别重要应用进行网络保护,让万人同时开会不卡顿;为了简化运维,星河AI网络创新推出了园区数字地图,使网络运维效率大幅度提升。
为了应对网络安全风险,保障用户数据安全,华为星河AI网络构建了“云-网-边-端”的立体防护策略。在云侧,借助8000多个推理规则和25个安全算法模型,能够实现秒级威胁处置;在网侧,通过独家EVPN动态隧道建立技术,实现16HUB大规模灵活组网,在30%丢包情况下,仍能保证业务流畅体验;在边侧, SASE智能安全网关内置4大AI安全专用引擎,威胁检出率超过99.95%;在端侧,华为基于业界首创威胁溯源图引擎,进行动态行为分析,使终端的勒索病毒能够精准检出。
图 参观华为星河AI网络四大场景应用实践
可以看到,华为通过浩瀚联接的网络闭环,覆盖了数据中心、园区网、广域网以及与之相伴的网络安全所有业务场景。通过端到端的打通,华为星河AI网络展示了客户需求与场景创新的精准定位,化解了不同场景下用户的网络应用“痛点”,切实解决了网络“用不好、不好用”的问题。
持续创新,搭好智算时代的网络“数字底座”
如同星河联接无数繁星,组成浩瀚宇宙,星河AI网络正在充分释放企业用户的数字化潜能,加速行业智能化转型升级。目前,在全球财富500强企业中,华为数据通信服务的客户已达到267,此外还包括全球TOP100银行中的50多个,QS大学排行(QS World University Rankings)100所中的32个,100多个国家政务骨干网以及全球TOP20大型油田项目。
面对制造企业网络建设“深水区”,华为正在积极进行智能化技术和ICT能力创新,强化网络基石,实现用户效率、创新与价值的兼容并蓄。
可以预见的是,在国内智能制造和培育新质生产力的要求下,通往AI的大门已经打开。在赵志鹏看来,星河AI网络以高运力释放AI时代的高算力,成为企业数智化变革的“数字底座”,成为华为数据通信赋能企业数字未来的“新里程碑”。