11月16日,在2023中国政企运维峰会华为云Stack运维分论坛上,华为混合云运维总监支新辉发表主题演讲“政企云运维的挑战与实践——混合云双循环运维新范式”。
支新辉在演讲中表示:“政企客户从业务上云迈向深度用云,基于混合云的业务创新正在持续加速。在政企加速云化转型的同时,混合云技术栈的快速增长给政企云运维带来了巨大挑战。华为构建了运维双循环体系,基于大小循环机制将华为积累多年的混合云运维经验数字化,再将数字化的运维经验结合运维数据,通过智能化转换为通用的运维能力,并将通用运维能力以服务化的方式持续赋能政企客户,帮助政企客户快速构筑混合云运维能力。”
华为混合云运维总监 新辉
政企云运维面临的挑战
随着云计算技术的不断发展,混合云已成为政府和大中型企业实现数字化转型的首选。
自十四五规划中提出推进产业数字化转型,实施“上云用数赋智”行动以来,混合云作为政企数字化转型的重要基座,持续牵引着各行各业核心业务向云上迁移。同时,随着混合云自身技术的不断发展,大数据、PaaS、AI等高阶云服务应用规模持续增长,政府和企业基于混合云技术孵化的业务创新也在持续加速。
混合云的应用已从初期的尝试和摸索阶段转入了大规模深度使用阶段,承载在混合云上的业务也从外围业务扩展到了核心业务。随着业务规模扩展、承载业务重要性的不断提升,客户对业务连续性和高可用要求更加苛刻。混合云运维是保障混合云稳定性的最直接、最有效的手段。
随着政企客户对云的应用不断深入,应用创新推动混合云服务加速扩展,混合云已经承载了包括:IaaS、容器、PaaS、安全、大数据、IoT、AI等十多个子类共100多种云服务。混合云所包含的云服务种类已与公有云云服务持平,这意味着混合云技术栈相比传统数据中心出现了大幅度增长。混合云技术栈的增长会导致政企原有运维人员能力出现缺口,并难以快速补齐;同时,云服务的深度使用导致应用与云服务关系日益复杂,耦合度大幅增加。
除了混合云技术栈增长带来的挑战,应用和云软件版本迭代的加速也增加了运维的难度。变更频率增加不但使运维风险加大,也引入新的运维工作量。政企运维团队将面临故障快速恢复难、平稳变更难、风险预防难和流程管控难四大挑战。当政企运维团队面临的困难无法解决时,往往会将问题传递给云服务商,导致云服务商也会面临政企客户相同的运维挑战。
相对政企运维团队,云服务商运维团队具备更加充足的运维专家和领域专家,在多年的政企混合云运维支撑过程中积累了丰富的运维经验。“能否开发一套有效的体系或运作机制将云服务商的运维能力快速赋能给政企客户,帮助政企客户快速构建混合云运维的完整能力“是一个富有挑战性的命题。
混合云运维双循环实践
基于上述背景,华为规划并构建混合云运维双循环运维体系。运维双循环是云服务商基于自身的运维经验积累、专业人才储备、以及AIOPS优势,通过“经验数字化,数字智能化,智能服务化”方式将自身运维能力以工具、脚本、算法和其他专业服务的形式,持续赋能政企客户的运维体系。
运维双循环中的小循环是政企客户在混合云场景下实现自主运维闭环的使能平台,小循环的使能平台依托于大循环的持续赋能,实现政企本地的事件处理闭环、问题管理闭环、变更管控闭环和风险预防闭环。小循环使能平台需要具备两方面关键能力:混合云全领域运维工具能力和持续注入的开放扩展能力。
大循环是云服务商以混合云本地运维为运维对象,以数字化、自动化、智能化为驱动,以全球混合云运维经验和数据为语料,依托云服务商的运维专家和研发专家,快速孵化通用运维能力,持续提升混合云自主运维能力的系统性运维平台。
大循环孵化出运维能力后,通过将孵化的运维能力注入到运维工具中或以专业服务的形式将运维能力赋能给政企客户,迅速提升政企客户运维能力。
当前,华为混合云运维双循环体系已经初步建成。在双循环体系的驱动下,运维能力在大小循环的协同和流转过程中不断构建和累积,实现了与政企客户混合运维的高效协同;政企客户可以共享华为专家资源、工具能力和运维经验,实现运维人才即需即用、运维工具为我所用、运维经验常用常新。混合云双循环运维体系已经支撑了全球2000多家政企客户的运维工作,并不断将知识、经验、技术转化为可以落地的运维能力,点点滴滴赋能到政企混合云运维团队。未来,在AI助力下,双循环体系运转会更加高效,运维双循环体系必将在数字化时代展现出更大的活力。