2023年9月2日,由平台工程技术社区与数澈软件Seal联合举办的⌈AIGC时代下的平台工程⌋——2023平台工程技术大会在北京圆满收官。本届大会共设置了11场主题演讲。大会吸引了近300名平台工程爱好者现场参会,超过3000名观众在线上直播平台观看了本届大会。
平台工程技术大会现场
来自数澈软件Seal、万物新生集团、Thoughtworks、滴滴出行、哔哩哔哩、安易科技、小米集团、博云科技、享道出行、蚂蚁集团等十余家知名企业的技术负责人出席了本届大会,并围绕平台工程、研发效能、DevOps、AIGC等话题带来精彩的分享,为参会的平台工程爱好者带来多元化的技术视角。
大会联合主办方数澈软件Seal的联合创始人及CEO 秦小康表示:“希望通过平台工程技术大会传递持续创新的精神和文化,为参会者带来全球化的技术视野,共享科技创新之美。”
开源+AI,助力 DevOps 持续进化
数澈软件Seal 联合创始人及CTO梁胜以今年谷歌云计算大会(Google Cloud Next 23)的参会经历为切入点,提出了这一观点:AI技术正以不可逆转的趋势快速发展,并给研发领域带来重大冲击。因此在全新的技术语境下,DevOps工程师必须积极利用AI技术减轻自身工作量。
然而,AI并不是100% 可靠的,因此在 DevOps 领域需要通过平台工程为AI提供护栏(Guardrail),进而提升 AI 的可靠性并进一步提高开发效率。
数澈软件Seal 联合创始人及CTO 梁胜
梁胜认为:“开源由于其不受国界限制的特点,能够为AI和云计算带来真正的机会。开源可以帮助中国企业在全球范围内推广云计算和AI技术,并成为全球技术的引领者。”
因此,数澈软件Seal 推出了100%开源的新一代应用管理平台 Walrus,通过将云原生的能力和最佳实践扩展到非容器化环境,并支持任意应用形态统一编排部署,降低使用基础设施的复杂度,为研发和运维团队提供易用、一致的应用管理和部署体验,进而构建无缝协作的软件交付流程。
数澈软件Seal 联合创始人及COO 江鹏
在 Demo环节,数澈软件Seal 联合创始人及COO江鹏演示了在Walrus上借助其服务模板的特性快速部署Meta 开源大模型 Llama 2 和 Stable Diffusion,并引入了Seal AI助手 Appilot(预计本月中下旬开源,敬请期待),通过输入自然语言,借助AI大模型的推理能力实现资源调度、服务查询、应用部署等任务,很大程度上降低了运维工作的难度和复杂度,帮助提升应用开发效率。
平台工程的落地探索
在本届大会上,来自 Thoughtworks、万物新生、哔哩哔哩、滴滴出行、享道出行的企业技术负责人分别分享了他们在平台工程落地的探索和思考。
万物新生集团技术工程部负责人 贾胜謇
万物新生集团旗下拥有爱回收、拍机堂、拍拍、AHS Device、爱分类等业务板块,这些业务的稳定运行离不开底层技术的支持。早在11年前,万物新生就开始了云上的实践,并于2018年拥抱了Kubernetes。
随着越来越多工程师的加入,工程效率面临挑战。经统计,每年大约有10万次的部署变更、需要管理3000多个云上资源,这对工程师来说是一个非常大的挑战。
因此,万物新生集团构建了统一的内部工程平台,同时在组织建设上也进行了革新。通过建立技术委员会和技术工程部,帮助平台工程落地。
Thoughtworks EMPC软件工程业务负责人 钟健鑫
Thoughtworks 作为一家全球性的软件及咨询公司,在平台工程领域早有积累。Thoughtworks 软件工程业务负责人钟健鑫提到,平台工程的重要使命是降低开发团队的认知复杂度。
另外,钟健鑫还关注到平台工程引入AIGC能力时可实现性和背后的原理,“只有把复杂的工程流程很好地分解成结构化任务,并且这些任务已经存在现有的工具可以解决,才能充分释放AI的能力,来帮助企业解决问题。”
哔哩哔哩基础架构部资深工程师 袁帅
B站已经成为国内主流视频平台,每天有上亿名用户在上面观看、发布视频,因此对业务稳定性要求很高。哔哩哔哩基础架构部资深工程师袁帅介绍了B站平台工程的探索历程,他提到:“在云原生技术浪潮下,研发团队承担着越来越重的认知负担,在各种繁重的琐事中,B站形成了平台工程的理念。”
他总结道:“在推进平台工程的过程中,我们最常犯的两个错误是不关注团队之间的互动和缺乏平台负责人的概念强化。”因此组织内部应该营造运维和研发互相尊重的氛围,以及要从平台用户那里获取可靠的反馈,进而不断迭代平台建设。
滴滴出行质量中台负责人 孔帅康
滴滴出行平台为司乘提供良好体验的同时满足广大群众的出行需求,因此后端服务的可靠性和可用性至关重要。在面临DevOps流程割裂、自动化程度参差不齐、工具链呈烟囱式演进、缺失客观数据度量的情况时,滴滴通过统一前端架构、管控平面来降低工程成本,引入需求交付可视化、代码门禁机制、持续集成自动化、稳定性防控等多套工具,解决了关键痛点,提升质量效能。
享道出行工程研发部高级经理 张磊
平台工程的落地是一个非常复杂的过程,其具体实现之一是工程平台。享道出行工程研发部高级经理张磊在分享中提到:“平台工程可以进一步推进DevOps,它以一种理论的形式来指导开发实践,以解决复杂性的问题。”未来,工程平台应该具备服务化的能力、产品化思维,提升平台的易用性,来增加平台工程的价值。最终,企业变革软件开发流程。
平台工程工具链建设
平台工程的落地离不开可观测平台、CI/CD、配置管理等工具的配合使用。
小米中国区研发效能负责人 张志勇
在大会上,小米中国区研发效能负责人张志勇介绍了云原生应用观测平台Hera,它以应用为核心,集指标监控、链路追踪、日志、告警于一身。张志勇提到,Hera 的建设主要围绕解决3大痛点——问题发现难、故障定位难、修复周期长。通过Hera提供的面向SLA设置告警,metrics、tracing、logging联动,运行时弹性保障等特性,全面提升告警准确率、及时察觉系统异常。
蚂蚁集团工程师 徐鹏飞
Kubernetes 和 Terraform 是开源界的事实标准,几乎有80%以上的企业会在基础设施领域应用它们。但是,蚂蚁集团工程徐鹏飞认为,在Kubernetes领域仍然缺乏在客户端轻量的配置组合和校验工具。因此,KCL应运而生。其最基础的功能是,允许用户使用已有的编程元素来抽象自己的模型。
展望未来
平台工程技术大会上各大企业技术负责人带来的精彩分享,充分显示了当前平台工程领域汇聚了各行各业的创新力量,而这仅仅只是开始。未来,平台工程技术社区将会继续联合其他企业,为大家带来更多的平台工程技术分享,营造平等、开放、互助的社区氛围。