WAIC 2024盛大召开,天翼云以全栈智算能力赋能AI时代

2024-07-06 12:17:53     来源:

7月5日,2024世界人工智能大会期间,中国电信星辰人工智能生态论坛在上海世博中心启幕。论坛以“星辰注智,焕新领航”为主题,围绕人工智能技术发展趋势,分享中国电信与产业各界在人工智能领域的创新与实践。天翼云科技有限公司董事长、总经理胡志强出席,并发表演讲《云智一体国云焕新》。他表示,人工智能已成为新一轮科技革命和产业变革的核心驱动力量。天翼云坚持科技创新驱动高质量发展,以丰富的智算资源供给强大的智算服务能力和开放的模型应用生态,为数字经济发展注入新动能。

在智算资源供给方面,天翼云自建了丰富、多样化的智能算力资源。围绕AI产业集聚地区,天翼云规划建设北京、上海、广东、浙江、安徽人工智能公共算力中心,提供训推一体化能力,并先后建成上海、北京万卡池,这也是全国最早建成并真正投产运行的两个国产化、全液冷、单集群万卡公共智算中心;在清洁能源集聚地,建设内蒙、贵州、宁夏智算中心,提供绿色算力;此外,天翼云还在31省预部署AI云电脑和推理池,在280多个地市的一城一池节点和1000多个边缘节点按需下沉AI云电脑算力和推理算力;提供国内外主流的GPU、NPU算力方案,面向不同场景为用户提供公有云、私有云、边缘云多种形态服务。

另一方面,天翼云汇聚社会多方算力,通过高效调度实现算力供需匹配。天翼云重点研发算力分发网络平台“息壤”,从算力统一接入、算数网一体化调度、算力简便易用三方面进行技术创新,实现裸算力云化接入、算力更泛在、算力选择和应用部署更简单,促进算力互联互通、高效利用、供需匹配。

基于此,息壤可赋能三大算力服务场景。一是天翼云自营的公共算力服务平台,目前已接入多家算力伙伴,扩大了天翼云算力规模和品类,满足公有云客户的多元算力需求;二是行业算力互联网,如国资央企智算云管理调度平台,接入多家央企算力,提高国资监管水平,提升算力利用率;三是城市算力互联网,通过整合区域内多方算力,结合产业政策,实现一体化统筹调度算力,目前已在多个区域成功实践。

当前,基础大模型训练呈现参数越来越大的趋势,在超大规模参数的基础大模型开发训练场景中,对AI基础设施的算力、性能、稳定性都提出了更高要求。天翼云基于单集群万卡智算中心,搭载一体化计算加速平台云骁和一站式智算服务平台慧聚,从基础设施到平台,构建了基础大模型训练解决方案。

在大算力需求方面,天翼云建设了可横向扩展的PB级HPFS,满足存储要求;组建了低延时的超大规模RDMA网络,满足基础算力需求;同时,通过计算、内存、通信多维优化,提升综合算效。在性能方面,天翼云升级AI框架,编译效率翻番,通过拓扑感知调度,集合通信效率提升显著,多种加速优化后将国产算力的综合算效比提升到了行业可比水平。在稳定性方面,故障训前发现,结合断点续训能力,实现训练任务长期稳定、高可用运行。

构建国产万卡集群不是一万张卡的简单堆叠,而是一项高度复杂的系统工程,需要解决超大规模的组网互联、高效率的集群计算、长期稳定性和高可用性等众多技术难题。天翼云基于国产万卡智算集群和自研智算平台,已具备支撑万亿参数基础大模型训练的能力。

在行业大模型训推过程中,普遍存在着训练部署工程化复杂、训推效率有待提高、训练中断频繁等挑战。面向行业大模型训推场景,天翼云提供一站式智算服务。其中,“慧聚”平台预置行业数据集、纳管国内外主流AI加速硬件、并预置基于国产算力的基础大模型等全栈工具链能力,大模型精调场景通过选数据、选硬件、选模型3步,即可实现大模型训推;通过自研AI框架、3D并行加速、自研训练加速库、容器调度优化等核心技术,大幅提升训练效率;通过模型量化压缩、自研推理加速算子库、自研AI推理加速框架等核心技术,推理效率也明显提升;通过全链路故障分钟级检测、定位、告警,全链路日志监控与可视化、断点续训快速恢复等核心技术,实现训推过程全链路监控。

基于技术创新与项目经验沉淀,天翼云打造了全面的平台化能力和解决方案,保障客户高效、便捷、稳定、安全使用智算服务。

在模型应用生态建设方面,天翼云在业界率先发布AI云电脑。AI云电脑具有算力更强大、更弹性、更安全、更优惠的优势,降低大众使用AI的门槛,加速推进AI普惠化。目前天翼AI云电脑已接入多个主流通用大模型,以及教育、医疗、法律、心理等多个行业大模型,打造AI应用中心,创新推出AI会议、AI低代码、AI文档、AI教育等场景化标杆应用,提升客户办公、生产效率。

此外,天翼云打造红云大模型开发者社区,聚合本土中文优质AI资源,加速AI应用创新和商业闭环。通过简单易用的工具链,端到端使能AI应用开发全流程,助力孵化国产原生模型。

大会期间,天翼云携智算创新成果亮相世博展览馆,展出了国内领先的单体万卡液冷智算池、“息壤”“云骁”“慧聚”三大智算平台、AI云电脑以及基于天翼云智算云底座的星辰大模型等硬核技术成果,全方位展现在人工智能领域的深厚实力。

人工智能正成为发展新质生产力的重要引擎,作为云服务国家队,天翼云具有丰富的智算资源储备、强大的智算平台能力以及开放的模型应用生态。未来,天翼云将持续深耕技术创新,携手产业各界共创智算未来,共赢AI时代。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

弥知科技Kivicube重磅更新, 上架苹果 Vision Pro 应用市场,零门槛低代码创作, 打造XR未来
2024全球数字经济大会,中关村科金受邀出席城市副中心论坛演讲
备战马拉松,开启竞速新时代 On昂跑 全新发布 Prism 系列
文心大模型4.0 Turbo面向企业开放,文心旗舰模型全线降价!
40多位车企工程师现场监督,懂车帝夏测给中国新能源行业带来了什么?
新壹科技亮相2024世界人工智能大会 推出新壹视频大模型2.0
从今天起,文心智能体平台开发者可免费使用文心大模型4.0
守护数字安全:WiFi万能钥匙彰显个人信息保护承诺
途鸽科技亮相MWC世界移动通信展,多款物联网出海解决方案受热捧
BW 2024盛典来袭!ROG掌机X新品首亮相 实力再进化!
智子引擎亮相2024世界人工智能大会,Awaker多模态大模型系列产品惊艳首秀
云原生|全景智联SMCDB平台上架青云科技KubeSphere Marketplace!
倍思主动召回流程早已上线 用户可登陆小程序“倍思售后”参与
2024全球数字经济大会,中关村科金受邀出席城市副中心论坛演讲
数字人+大模型,相芯亮相2024世界人工智能大会展示行业新质生产力!
向“新”而行,“质”赋滨城,华为开发者大会2024大连分会场圆满举办
华为发布园区网络“光进铜退”先锋行动——将投入5000万元营销资源支持新老伙伴共赢园区数智新未来
5G-A“六边形战士”,芯讯通SIM8390实时在线
强力巨彩LED灯杆屏性能显著,多维赋能智慧城市建设
金山办公升级AI战略 正式发布WPS AI 2.0
北京科学智能研究院、上海算法创新研究院与华为云达成深度合作 共推AI技术创新与产业发展
2024世界科学智能大赛启动,上海科学智能研究院、复旦携手阿里云推动科学智能创新
《国有企业数字化转型成熟度评估模型》在全球数字经济大会发布|中科通量参编
暑期购机好价嗨翻天 三星商城热门Galaxy等你来选
明略科技集团强势入选“2024年中国人工智能行业大模型企业竞争力100强”
华为云董理斌:做难事解难题,盘古大模型以“智”重塑千行万业
盘古大模型5.0加速AI行业应用落地 华为云将推动端云算力协同
施耐德电气:三箭齐发,借力AI技术加速能源转型
2024中国(丹阳)国际菁英创业大赛火热报名中
华为云与朗坤集团、软通动力全面合作,探索生物科技数字化转型新路径