当国内外云厂商纷纷在卷大模型,有一家企业却因中立定位赢得市场,以自身优势助力大模型行业发展,这家企业就是金山云。
大模型战火硝烟背后的“冷思考”
在过去一年多时间里,公有云大厂在全球范围内掀起了大模型应用开发潮,从最初的卷参数、卷文本长度,到之后的卷场景、卷应用、卷价格,似乎没给中小云厂商留有发展空间。面对激烈的市场竞争环境,以金山云为代表的云服务商,展现出了非凡的应变能力与战略远见。
▲金山云高级副总裁刘涛
“我们将严守中立定位,做大模型的助力者。” 金山云高级副总裁刘涛,在媒体采访中强调,选择这样一条路,是机缘巧合,也是深思熟虑的结果。
放眼市场,尽管大模型公司数量很多,中国已是百模大战,但未来很可能会变成十模,基础模型公司会越来越少。大浪淘沙过后,剩下来的将是一批优秀的大模型及AI应用公司,这些公司在大模型训练、智能算力等方面拥有广泛需求。此种背景下,金山云“大模型助力者”的定位,为其全力拥抱AI新机遇带来了优势。
事实上,金山云不仅有了对行业趋势的深刻洞察,还对自身实力进行了精准匹配。从2022年开始,金山云开始调整策略。一方面,凭借中立服务提供商的定位,金山云获取诸多客户信任,并在服务客户过程中积累了大量服务经验,逐渐获得独特的竞争优势;另一方面,通过技术壁垒的不断突破,为大模型及AI应用公司提供多元化服务,从而在高手林立的市场竞争中开辟出一条差异化发展之路。
事实证明,金山云当初的选择是正确的。尽管受大环境影响,公司业绩增速趋于平缓,但随着金山云市场策略的快速调整,前沿技术创新和客户口碑建设取得了显著成果。从今年上半年开始,金山云迎来业绩实现了逆势飞扬,其二季度财报显示,季度内营收达到18.9亿元,连续三个季度环比提升。其中人工智能收入增长至3.26亿元,占公有云收入的26%,环比翻倍。
智算服务不断增强的底气与根基
面对人工智能带来的智算发展浪潮,金山云积极投身于行业建设,围绕算力、平台、数据和模型,筑牢大模型发展所需要的技术底座。
在核心的算力支撑方面,金山云既有面向企业级的性能保障型云服务器X8,也有面向通用场景的第九代云服务器高效型SE9。同时,金山云还打造了较为完备的智能计算集群,能满足客户在智算场景的需求。其中,第九代云服务器高效型SE9是针对客户对效能和价格的双重需要而发布的,搭载英特尔®至强®6能效核处理器,最大套餐规格256核512G,全面支持企业级服务,客户可在享受效能的同时,收获更优质的产品和服务体验。
刘涛认为,提供算力服务不只是买卖机器的一个过程,其实是多种能力构成的一个“组合拳”。
首先,要能够满足客户庞大、复杂的算力需求,需要在算力部署上具备工程化的服务能力。
为了确保网络的稳定性,金山云从网路规划开始入手,重点解决集群和架构之间的互联互通问题。从成本优化和资源解耦的角度看,每家企业都不想被一家供应商的服务绑定。所以,金山云从一开始就采用RoCE融合以太网的方式部署网络,并提供可视化的运营。
金山云自研的RoCE网络监控平台提供集群端侧和网侧的基础信息与指标、网络故障感知和告警、主动排障能力;在GPU自动化运维插件方面,通过整合资源管理、硬件监控和Kubernetes调度能力,实现秒级故障感知、分钟级完成故障自愈动作,这又从运维层面为客户提供了便捷。
其次,拥有强大的大数据处理与数据存储能力。企业要训练大模型,就会涉及数据清洗、转换等数据处理问题。金山云整合星曜裸金属服务器EPC、大数据平台KMR和对象存储KS3推出了针对该场景的数据清洗解决方案,满足预训练数据集、微调数据集生成对于数据清洗的需求。数据清洗完,下一步就是数据存储。金山云对象存储KS3极速型最高可提供1Tbps/PB的兑付带宽,相较基于机械硬盘(HDD)的对象存储性能提升了上百倍,能为AIGC、存算分离、动漫渲染和高性能计算等场景提供强有力的存储解决方案。而从数据处理能力侧来看,金山云提供的是平台化服务能力。从数据的管理、清洗,到标注,金山云瀚海平台能够帮助用户更好地处理和利用数据,从而提高模型训练效果。
其三,在大模型开发和部署上,能够提供满足用户所有需求的一站式MaaS解决方案。金山云能够提供从底层IaaS供应,到中间PaaS能力,再到上层模型训练的全方位服务,满足客户的各种AI需求。同时,还能针对客户具体需求,提供定制化的AI解决方案,快速响应市场变化。
写在最后:
不难发现,金山云的智算服务在不断升级,尤其在大模型训练和算力服务方面,展现出强大的技术支撑实力和快速响应市场变化的能力。通过聚焦大客户、提升工程能力、优化技术等策略的调整,公司不仅提供了高效、稳定、全面的AI解决方案,更实现了整体业务的快速增长。从最早在公有云领域的同质化竞争中奋力追赶,到现在大模型助力者的华丽转身,是天时地利人和,也是“工匠精神”的精雕细琢与持续深耕,让金山云不断攻克市场与技术难题,彻底打破服务边界,为客户创造出更大价值。