腾讯郑亚峰：打造大模型时代的网络“高速公路”

随着大模型相关应用的加速落地,整个行业对算力革命的需求日益迫切。然而,提升算力并非仅靠堆砌GPU就能实现,网络基础设施在其中起着关键作用。近期,腾讯云副总裁郑亚峰深入探讨了大模型时代腾讯在高性能计算网络方面的布局。

当前,大模型参数量动辄达到万亿级别,背后是庞大数量的GPU,这些GPU需要通过算力集群协同完成计算任务。郑亚峰指出,在GPU集群之间的数据交换与通信都依赖网络承接。如果网络带宽不足,延时过长,将导致算力边际递减,反而增加大模型训练的时间成本。因此,具有大带宽、高利用率且信息无损的高性能网络对于当前算力提升至关重要。

郑亚峰以“高速公路”为比喻,形象地描述了业内对计算网络的期待。他强调,在大模型时代,“无拥塞”尤为关键,因为网络堵塞不仅降低大模型训练效率,还可能导致算力损失。为解决这一问题,腾讯云在高性能RDMA网络和网络协议方面进行了深入研究。

首先是腾讯自研的星脉RDMA网络。RDMA是一种高性能、低延迟的网络通信技术,主要应用于数据中心高性能计算。它允许计算节点之间直接通过GPU进行数据传输,无需操作系统内核和CPU参与。这种数据传输方法显著提高吞吐量并降低延迟,使计算节点间通信更高效。

其次是腾讯自研的网络协议TiTa。网络协议是计算节点间传输数据的规则和标准,关注数据传输的控制方式。在大模型训练中,传统网络协议由于固有设计和性能限制,难以满足无损、超大带宽的要求,甚至需要优化数据的“交通规则”。

郑亚峰表示,腾讯云通过自研TiTa协议,颠覆了传统网络“交通规则”,实现了数据交换的无拥塞、低时延,使星脉网络可在90%负载下实现0丢包。TiTa协议内嵌拥塞控制算法,实时监控网络状态并进行通信优化,使数据传输更流畅且延迟降低。

此外,郑亚峰还介绍了星脉网络所搭载的自研白盒交换机以及端到端全栈网络运营系统。这些技术进一步提高了星脉网络的高可用性,缩短了大模型训练系统的部署时间,保证了基础配置的准确性,并显著降低了系统故障排查和自愈的时间。

同时,为了让这条高速公路更宽阔,星脉网络基于腾讯云新一代算力集群HCC,可支持最大10万卡的超大计算规模,满足业务所需。

“为大模型而生的星脉网络,能让算力利用率更高,从而进一步释放AI潜能。与此同时,星脉网络也将继续升级迭代,帮助各行各业加速大模型技术的升级和应用落地。”郑亚峰总结道。

根据实测,星脉实现了AI大模型通信性能的10倍提升、GPU利用率提升40%、通信时延降低40%。日前,腾讯云发布的新一代HCC高性能计算集群,正是基于星脉高性能网络打造,算力性能较前代提升3倍,为AI大模型训练构筑了可靠的高性能网络底座。(文邵文珊)

标签：

猜你喜欢

美的鲲禹磁悬浮离心式空压机亮相2023上海国际压缩机展

支持30W增强模式+HDMI输出 ROG 65W充电扩展坞正式开售

探索未来创新人才培养：北京市基础教育数字化发展联盟成立

思看科技激光三维扫描仪KSCAN-Magic全新升级！

场域经营如何优化，加速大促生意爆发？｜巨量云图双11大促通关宝典 Vol.4

双十一RTX 4060游戏本首推华硕天选4锐龙版 7499元福利价

100G全光网点亮教育数字化转型路：河南财经政法大学校园网升级实践

“关心一下”AI中医进社区送温暖

1024程序员节，技术大咖共赴英雄会

“华为手机遥遥领先，华为服务专业温度”

高压氧舱能缓解“悲秋综合征”？Rlab时光珠或可助力舒缓情绪

逆转时间摆脱压力焦虑，Rlab云浮号或成健康时代新型“黑科技”

云浮号教你如何应对压力烦恼，智能漂浮舱成为新型缓压“黑科技”

被誉为激光投影仪发源地的坚果投影，其力作坚果N1 Ultra表现如何？

益生好为何能够拔得头筹？留住时间助力抗衰之路

职场风向变了！“讯飞写作＋X计划”为千行百业提供内容生产利器

探索科技边界金山云第三届“黑马大赛”圆满举行

搭上惠农网“快车” 这三位新农人成为当地致富“头雁”

百家爆款公开课近日举办，揭秘剧情短视频爆款密码

360Hz+2K硬核配置，蚂蚁电竞 ANT27VQ MAX 疾速液晶电竞显示器真香！

奥运冠军林丹等达播团助力双十一，Cleer登顶抖音影音电器热销榜Top1

VR让世界更精彩，润建股份亮相2023世界VR产业大会！

51offer第六届互联网留学行业峰会圆满落幕！

华为高品质万兆医疗园区解决方案，助力浙江省中医院加速信息化、数字化

揭榜团队最高可获得3000万元研究经费支持

共谋高水平创新高质量发展 2023中国生物技术创新大会在成都高新区开幕

生物医药园区竞争力排行榜发布 2023中国生物技术创新大会将在成都高新区举行

TencentAVS3编码器MSU大赛取得佳绩，国标编码助力腾讯视频更优画质体验

10月28日！华为即将亮相2023全国中小企业数字化转型大会

昊海生科口周年轻化学术研讨会暨泰州施尔美“苏中”医师培训班成功举办

热点图片

要闻

重磅来袭！国产自主全域安防智能感知AIoT平台，引领智慧社会新纪元
在数字化、智能化席卷全球的时代，你是否担心我们的公共安全问题？你是否期待有一个全
AIGC弊大于利？中传文化产业管理学院在讯飞AIGC写作论坛上给出答案
据中国传媒大学文化产业管理学院消息，第六届世界声博会暨2023科大讯飞全球1024开发者
宇视科技亮相2023CPSE安博会，快来打卡总裁都在用的“宇视写真”！
10月25日,第十九届中国国际社会公共安全博览会在深圳福田会展中心举办。宇视科技(univ
新浪党委、新浪工会赴新疆莎车县捐资助学助力乡村孩子梦想启航
2023年10月24日,新浪党委、新浪集团工会、新浪工会志愿者俱乐部联合新浪扬帆公益基金
信安数据闪耀2023DAMA中国数据管理峰会，斩获多项殊荣！
2023年10月20—21日，国际数据管理协会（DAMA）在北京举办了 2023DAMA中国数据管理峰
IDC报告:宁畅液冷服务器市占率双双第一
近日,国际数据公司(IDC)最新发布了《中国半年度液冷服务器市场(2023上半年)跟踪》报告
绿色站点智赢未来 | 第七届全球ICT能效峰会成功召开
[法国，波尔多，2023年10月24日] 10月24日，以绿色站点，智赢未来为主题的第七届全球
公益再破圈！清华×腾讯启动数字公益研究和人才培养
中国数字公益发展路上又多了一群最强大脑！10月24日，由腾讯公益慈善基金会资助的清华
解码小红书大健康行业人群图鉴，开启健康生活的养生之道
随着人们生活质量的提升，消费者对健康和养生的关注也日益增强。在国家各项利好政策驱
强强联手！百度智能云携手NVIDIA，共同助力大模型应用落地
AI大模型在生物医药领域到底都有怎样的前景？百度智能云与NVIDIA在生物医药行业的成果

腾讯郑亚峰：打造大模型时代的网络“高速公路”

相关阅读

猜你喜欢

热点图片

要闻