算力与能源正在成为世界的硬通货,看超级计算机安腾如何突围

2024-06-17 09:43:13     来源:

特斯拉创始人马斯克公开表态称未来两年人工智能行业将由“缺硅”变为“缺电”。据媒体报道,OpenAI的ChatGPT每天消耗超过50万千瓦时的电力,用于处理约2亿个用户请求,相当于美国家庭每天用电量的1.7万多倍。除了这类生成式AI耗能外,还有同样涉及到海量数据、特别是涉及到大规模并行计算的业务也正在成为“电能吞金兽”。全球前十名的超级计算机每小时耗电量高达2万度,堪比一座小型城镇的能源消耗。可见,随着技术革新步伐加快,全球算力竞争将对能源消耗提出更为严峻的考验,算力与能源将成为未来世界的核心硬通货。

以超级计算机为例,其作为解决复杂问题和大规模计算任务的利器,其能耗问题日益凸显,成为制约其长远发展的关键瓶颈。一味追求极致算力而忽视能源效率,不仅削弱了超算的实际价值,也使其发展陷入困境。正如美国加州大学计算机工程博士刘少山所指出,超级计算机是一个精密复杂的系统工程,任何短板都可能导致算力受限。

目前,各国在竞逐超算领导地位的同时,也在积极寻求在节能前提下提升性能的技术路径。

美国能源部于2013年和2018年先后启动“百亿亿次超级计算机”项目,明确要求E级机的功耗上限为20兆瓦,强调需要在不增加能源消耗的基础上提升性能,这表明如果单纯依赖扩大系统规模提升性能,那么E级机的技术选择将面临严格约束。2022年,麻省理工学院林肯实验室超级计算中心(LLSC)的研究人员进一步指出,超算系统的电源效率有巨大提升空间,如通过简单硬件调整如限制单个GPU功率,即可将AI模型训练的能源成本降低20%,仅带来适度的计算时间增长。

面对如何构建“既快又省”的超级计算机这一课题,大名鼎鼎的专用超级计算机安腾提供了一种新的解题思路。

安腾超级计算机丨图片来源:网络

安腾系列超级计算机由D. E. Shaw研究所研发,在能耗控制方面表现极为出色。

以第二代安腾超级计算机(Anton2)为例,其在一个单个机架内提供约2 TFLOPS(每秒万亿次浮点运算)的计算能力,能耗仅为25千瓦,与一辆中型电动汽车的充电功率相当,这一表现在当时同类设备中居于高位。

为什么超算安腾可以做到算得快还省电呢?

原因在于,有别于全面采用CPU、GPU等通用芯片架构的传统超算,安腾采用的是以ASIC专用芯片为主的专用超算的架构。专用超算在应用场景上受到严格的限制,只能处理某个特定领域的算法,例如安腾就是一台完全聚焦在生物计算领域最常用的分子动力学模拟计算的专用计算机,并且开发成本极其昂贵,但是以此为代价,换来的是在该特定领域的极强的加速性能和极低的能耗。

为降低全面计算资源损耗,超算安腾的软硬件采取了全面定制设计,核心组件为大量专用芯片(ASIC),并通过独特的高速三维环形网络实现互连。据称,在硬件上,整个超算安腾的ASIC芯片由288个核心瓦片和24个边缘瓦片构成,整体提供了5.6 Tbps的片外带宽。由于较大的Serdes物理PHYs在芯片的两个边缘都与这些瓦片相连,瓦片直接相邻,从而减少了未使用的芯片面积,简化了物理设计。

第三代安腾超级计算机的晶片管芯布局

同时,超算安腾的芯片保留了低电阻率的顶部金属层(TM0、TM1等)用于电源分配,从而确保其电源分配网络是完全连续的。为了改善瞬时电流尖峰,安腾将去耦电容、而不是备用单元装入所有可用空间,以良率来换取电源管理。并且,该芯片使用全局时钟网,以最小的偏移实现高时钟速度,这样的网状结构节省了功耗,网络只占芯片TDP(热设计功耗)的5%。

此外,超算安腾的芯片可以分区域、分精度计算不同任务,突破了制约分子模拟速度的瓶颈,这样可以在处理小任务时分配较少的节点用于运算,从而避免多节点时的能源浪费问题。

在通信层面,超算安腾各个节点之间通讯采用特殊设计的高速三维环形网络相互连接,形成了超高速低延迟网络。超算安腾共具有 512 个计算节点,它们在空间上的排布使得相当于将被模拟的系统分为 8 × 8 × 8 的盒子,每个盒子只负责 1/512 的原子,每个节点和盒子一一对应,并且只需要和邻近的 6 个节点通信。这些库中通信基于类 MPI 的「共享内存式并行」,把需要共享的数据放到公共空间各自读取;而这里每个节点之间都有点对点的专用信道,不存在访问资源的冲突问题。对于分子动力学而言,主要的通信内容是处在盒子边界的原子的位置,只有进行准确的通信,我们才能够准确计算这些原子与其他原子之间的作用力。由于低时延(约 50 ns)、高带宽的一对一信道的建设,大大减少了计算节点间通信需要的时间。这样,超算安腾可在512个节点并行处理下,能够对达100万个原子的大体系,每天进行10-100微秒量级的分子动力学模拟。相较于其他每天只能模拟几纳秒到几十纳秒不等的通用架构超算系统,512节点的超算安腾完成分子模拟的速度几乎快了100-10000倍。

图片来源:众妙斋

2020年3月27日,D. E. Shaw研究所公布了新冠病毒3CL蛋白酶的长达100微秒的MD模拟动画及数据,3CL蛋白酶被认为在病毒增殖和组装中发挥了重要作用,并且是新冠药物开发的热门靶点之一。超算安腾完成的3CL蛋白酶MD模拟结果,为科学家和制药学家透彻理解新冠病毒增殖与组装的机理,从而开发针对性的3CL蛋白酶抑制剂提供了极其宝贵的研究基础。随后的两年里,D. E. Shaw研究所更是陆续围绕新冠病毒公布了超过1000微秒的MD模拟结果,对新冠病毒的病理研究和药物研发起到了非常重大的作用。

在计算效率和能耗方面,哪怕是现如今全世界最强的通用超算中心的算效,针对复杂程度达到百万体系的蛋白质给出100微秒的模拟结果,几乎需要花费数年时间才能算完,期间耗费的电量将达到兆瓦级别,换算成电费将达到数亿元。作为对比,超算安腾则只需要十几天就可以算完,并且至多也只需要几万元的电费,几乎是前者的千万分之一,这就是采用的专用超算架构、经过一系列软硬件功能特化的超算安腾在自己擅长的分子动力学领域能够实现的计算效率和能耗的绝对优势。

我们可以看到,超算安腾凭借其对分子动力学模拟的专注,以及自主研发的软硬件设计,实现了相较于通用计算机高达百倍的计算能效提升,并在此过程中显著降低了能耗。这一成果无疑为国内企业在面对未来计算需求与能源挑战时提供了深刻启示:在特定的高价值应用场景大力发展专用超算路线,有望在大幅提高计算性能的同时有效降低能耗,实现绿色、可持续的科技创新。

 

标签:

猜你喜欢

私宅梯钜惠来袭,美的领沃618直播有大动作!
半年销量破200万套!风云变幻的空调市场,看小天鹅空调如何逆势起飞?
华昱欣科技亮相SNEC盛展,追“智”逐“绿”发展新质生产力
2024MWC邀请函 | 途鸽科技隆重邀您相聚世界级峰会!
AI赋能宜人智科降本增效,“蜂巢”智能语音交互机器人助力实现高质量增长
企业快成长创新云基础设施论坛走进天津,助力企业抢占智能化先机
看了华为小艺的父亲节短片,我也想和爸爸一起当“显眼包”
新能源汽车座舱将迎来新标准 全新AIHF™艾弗“石墨烯热管理汽车座舱标准”启动
3 分钟,飞书多维表格零代码搭出「搜一搜神器」!
极越汽车设计总监Shawn Kim受邀出席第十六届中国汽车蓝皮书论坛
人工智能创新论坛举行,华为云做厚“黑土地”助力企业深化AI实践
科大讯飞刘庆峰:大模型解放生产力,释放行业想象力
奇瑞汽车NEXT AI的战略,打造AI汽车名片
超氧化物歧化酶SOD的神奇功效
云从科技全面启动昇腾原生开发合作
第26届上海国际电影节启幕 百视通线上线下点亮“电影之城”
技术巅峰,创意无限 —— HarmonyOS极客马拉松2024决赛即将开启
填补空白,阳光新能源重磅发布iSolarSim光易仿光伏发电仿真软件
Compass Arena首期大模型竞技场榜单揭晓,智谱AI GLM-4系列模型展示领先实力
芜湖传媒中心与安徽省文化产权交易所、华为云签约成功,共筑数字文化产业新高地
华为云数智生态创新论坛成功举办,为数智时代产业发展造芜湖生态“样本”
覆盖诸多应用场景,智联校园率先推动数字人招聘落地
云从科技和华为云签署全面合作协议,加速推动人工智能产业化进程
奈尔宝联手飞书:革新招聘排班,数据驱动门店高效运营
加速推动软件新质生产力发展,格创东智受邀出席软件创新发展大会
22万奖金池已到位,2024天池云原生编程挑战赛正式启动
在抖音降低知识获取门槛,十几位学霸轮番讲题吸引百万粉丝
高考志愿不再迷茫!升学e网通升级算法升级,更精准助力学子
逐光之旅,星启未来 | 光伏星携全新方案 亮相SNEC 2024
TCL魏雪:绿色是企业高质量发展的底色