5 月 24 日,腾讯作为科技企业代表,受邀参加《深入推进长三角 G60 科创走廊科创生态建设大会》。现场,腾讯集团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的 AI 基础设施服务,为中国大模型产业繁荣发展提供技术支撑。
去年 9 月,腾讯全链路自研的腾讯混元大模型正式亮相。根据沙利文的权威报告,凭借在综合算力、工程和算法上的自研创新,腾讯混元大模型稳居国内大模型第一梯队。作为实用级大模型,腾讯混元已经在腾讯内部 600 多个产品和场景落地测试,进一步锤炼了大模型的产品能力。
前不久,混元大模型进行了能力升级,率先探索万亿参数 MoE(混合专家模型),升级后的总体效果相比上一代提升 50%,部分中文能力已追平 GPT-4。多模态能力层面,混元文生图基础架构全面升级至 Sora 同款 DiT 架构,成为国内首个中文开源文生图 Dit 架构的大模型。
李强表示,为了服务大模型产业发展,腾讯云推出大模型训练 " 黄金三件套 "。新一代 HCC 高性能计算集群,支持超过 10 万张卡并行计算,在同等数据集下,可以将万亿参数大模型的训练时间缩短至 4 天。腾讯自研星脉高性能计算网络,具备业界最高 3.2T 通信带宽,通信性能提升 10 倍,成本比国外 IB 网络降低 70%。腾讯还发布了国内首个 AI 原生的向量数据库,最高支持千亿级向量规模,峰值能力达到 500 万 QPS,是国内首家通过信通院向量数据库能力测评的产品。
数据显示,包括百川、MiniMax、智谱科技、元象等在内的 90% 头部大模型企业,都在使用腾讯的解决方案。
谈及助力上海和长三角发展。李强提到,腾讯在松江区落地了长三角人工智能先进计算中心,为大模型产业提供强大算力支撑。依托 G60 科创走廊的优势,腾讯联合伙伴引入了近 100 家 AI 相关生态企业。同时,腾讯为上海本地 AI 芯片公司燧原科技打造了芯片仿真混合云平台,缩短仿真周期达 50%,大幅节省了 IT 投入成本。大模型企业 MiniMax,基于腾讯的云原生技术,提升大模型训练效率,整体用云成本降低了至少 20%。
李强介绍,在前沿技术布局层面,腾讯在上海拥有优图、科恩两大实验室。目前,优图实验室拥有超过 1600 项全球专利,公开发表的论文超过 400 篇,被国际各类顶级会议收录。近年来,科恩实验室积极布局 AI 安全、车联网安全和物联网安全等前沿方向,技术实力和研究成果达到了国际领先水平。
最后,李强表示,腾讯将持续发挥前沿科技力量,积极融入长三角一体化发展,助力长三角打造世界级产业集群和国际一流创新生态。