随着国内云计算应用规模的增长,云计算的技术与商业逻辑也发生着变化。尤其在AIGC推动的新一波人工智能(AI)发展浪潮之下,智能算力已成为数字经济时代的关键生产力,是全社会数字化、智能化转型的重要基石。作为国内“第一家混合云上市公司”,成立于2012年的本土云计算厂商青云科技(qingcloud.com),陪伴了中国企业数字化转型的十年。
“青云从2013年开始开放公有云服务,现在我们迎来了第三波较大的市场机会,那就是AI。”青云科技总裁林源在近日举行的“青云科技AI算力发布会”上表示,针对未来AI应用大爆发的时代,青云希望通过其即将推出的“AI算力调度平台”和“AI算力云服务”,抓住和把握这一“比过去10年更大的市场需求和机会”。
云服务变迁与算力需求爆发
林源谈到,在青云科技成立的11年时间里,一共经历了三次较大的市场机会:第一波是数字化的机会;第二波是信创国产化替代的机会;第三波则是AI市场机会,而且AI将会带来一波长达10年以上的巨大市场需求和机会。未来整个AIGC投入占企业IT投入的占比,无疑会越来越高,由此对于底层算力的要求也会越来越高。
中国工程院院士郑纬民曾预计,到2025年,我国AI算力总量将超过1800EFlops,AI算力占总算力比重超过85%。可以说,算力已经进入到了智算时代。
“过去十年是以CPU为主驱动的应用革新时代,如今,GPU的采购量已经超过CPU。未来则是一个以GPU为核心的时代。”林源指出,青云科技在这样一个时期要支撑的将以云原生和AI的应用为主,也包括传统应用。因为数字化转型是一个漫长的过程,青云在未来10年支撑的应用会变得更加复杂,应用对于底层算力的要求既有CPU也有GPU。同时,客户既有成本敏感的业务,也有延迟敏感的业务,业态会更加丰富,对于技术和对于平台的挑战也越来越多。
面对新的市场需求,青云科技深入理解云对算力赋予的新价值——打破大规模通用算力、HPC算力、GPU算力的边界,延伸算力从中心到边缘与端侧的分布,明确了算力资源的统一调度、统一管理、统一运营,将发挥至关重要的作用。“AI算力调度平台”则是这家公司对此给出的答案。
AI算力调度平台能力已得到验证
众所周知,智算中心投资巨大,能否盈利取决于运营效率与平台能力。而相比于投资与建设,运营智算中心更加专业和复杂。同时,由于数据的隐私性和属地性,智算中心建设分散,运营能力参差不齐。而支持业务的多样性,决定了智算中心要面对极其复杂和现实的技术问题。
结合青云的自身实践,青云科技产品经理苗慧将智算中心所面临的难点总结为五个方面,多元资源统一调度管理、高速网络瓶颈、环境搭建复杂、多业务整合瓶颈、缺乏运营服务。
面对AI基础设施的管理和运营,青云给出的答案是“AI算力调度平台”。在青云的产品定义里,AI算力调度平台是智算中心运营者的关键工具,可以帮其建立从建设运营的闭环。
实际上,这并非青云提出的一个纯“概念性”的东西,而是已经在国家超算济南中心取得成功实践的产品。三年前,青云开始服务国家超算济南中心,这是一个多元计算中心,同时也是一个异构算力中心,其中包括HPC超算、传统云计算(以CPU为主)、智算(以GPU为主),而且还存在国产化GPU产品的兼容。在这个建设方案里,几乎所有产业链上的厂商都在,但整个算力调度平台是由青云独家供应的。如今,国家超算济南中心已经成功运营并实现盈利。
在苗慧看来,国家超算济南中心成功实践的背后,是因为青云“AI算力调度平台”具备多区域业务资源整合、分布式调度与管理、AI训练平台、算法开发支持、灵活调度、混合组网、模型仓库(MaaS)、高速并行存储、容量推理服务平台等九大关键能力,可以做到“像管理本地资源一样管理AI基础设施”;同时,在芯片国产替代、智简运营运维和生态构建方面,青云也在持续迭代,具备了完整的平台能力。“青云经过公有云积累的大量产品实践和运维运营经验,形成了成熟的产品力,才会跟合作伙伴合作,让他们使用。”
以生态同盟方式联营AI算力云
除了AI算力调度平台外,青云还提出了“AI算力云服务”。林源解释说,这是一个以青云为主、对外运营的AI算力的服务,并且青云会以生态的方式一起联营AI算力云。“传统云服务的10年,很多服务商喜欢大包大揽,从底层的IDC-硬件-软件-PaaS都自建、自投、自营,这是传统模式。而现实有两点挑战:一是自己干得越多,研发费用越高,成本越重。二是在AI时代,做好每一层的成本都比过去10年更高。”
“我们有一个大胆的设想,在AI领域一定会出现巨头,但这个巨头不应该是一家独立的公司,它应该是一个小的生态,因为要做的事情真的太多了。因此,青云AI算力云服务的定位是一个开放的生态同盟。青云集结这些志同道合的合作伙伴,通过同盟的方式一起运营AI算力云服务。”他强调,在AI算力云当中,“首先,客户需要完整的解决方案,所以生态是必须的。第二,每位参与者都是专业的、彼此需要的,所以彼此之间应该要开放。第三,大家是志同道合、长期共赢的同盟。”
在他看来,在上一个时代,青云做这个事情可能并不容易。但是现在的时代经济背景之下,以及每个层次都要投入巨大且专业的现状之下,大家都有彼此合作的需求。每一个新时代到来的时候,大家都在同一起跑线,而且新的时代可能需要一些新的合作模式和新的玩法。
“青云希望通过一个开放的、成熟的、可运营的AI算力调度平台,通过自营、合营乃至支撑第三方运营的方式,与生态同盟一起贡献我们的AI Cloud。青云不是什么都做,只做自己最擅长的AI算力调度平台,这与原来的云调度平台、IaaS一脉相承,这也恰恰是青云差异化的价值,同时也是其他企业所需要的。”林源还强调,不少AI应用的行业模型调优才刚刚开始,“现在训练都是裸金属,很简单粗暴。未来一定不是这种方式,而会是云化的、池化的。所以这才刚刚开始,AI Cloud一定是未来支撑这种应用最主流的方式。”