在网络运维领域,故障处理一直是重中之重。随着新基建快速发展,通信网络中两大核心部分——“大脑”算力网和“骨骼”传输网,正变得日益庞大复杂,这让传统运维模式面临巨大挑战。
算力网由于融合了多项前沿技术,采用分层解构部署,传统故障处理需要经历多达十八个环节,涉及多团队跨专业协作,既高风险又高成本。传输网同样面临定位难题。由于其体量庞大、架构复杂、技术含量高,在网络“深海”中找到故障点犹如捞针,传统模式下,仅单点故障定位就需要平均30分钟,成为运维工作的瓶颈。
今年,中国移动北京公司(北京移动)创新融合九天基座大模型与知识图谱小模型,打造了“AI+智能运维系统”,彻底改变了这一局面。针对算力网,系统通过多个智能体协同,将原有流程简化为四个核心环节:业务感知、根因定位、决策调度和处置闭环。从感知异常开始,系统就能进行故障预判,基于知识图谱实现跨专业告警定位,再通过大模型生成处置方案,最后调度机器人执行操作。整个过程实现了“三分钟感知,五分钟定位,五分钟抢通”的高效运维。
在传输网方面,“AI+智能运维系统”破局,构建了全新的运维模式,从“人找故障”到“故障自愈”。其中“智能诊断思维链”将故障定位时间压缩至10分钟内;“批量路由引擎”能在15分钟内恢复全部受损路由;独有的“一键还原”功能可在故障解除后自动恢复最优路由。这些创新让传输路由还原效率提升95%,排障团队从十人精简至两人。
据北京移动项目负责人介绍,该系统已整合多个支撑系统和运维团队。全网推广后,算力网故障处置效率将提升79%,传输网业务抢通时间缩短90%,每年可节省约300人天的人力成本,实现了网络运维全周期闭环升级,是运维工作极简化和智能化路径中的关键里程碑。
