
近日,中国电信翼支付在人工智能核心领域再获突破,两项技术成果成功入选 AAAI 2026 论文录用名单。此次公布结果的 AAAI 2026 是 CCF 推荐 A 类学术会议、国际顶级 AI 会议,翼支付的入选成果围绕大语言模型推理加速与扩散模型展开,展现关键技术创新实力。
AAAI 系列会议已举办至第四十届,其宗旨是推动人工智能领域的创新研究,促进领域内研究人员、从业者、科学家、学生和工程师之间的学术交流。本届会议共收到 23,680 篇有效投稿,创下历史新高,而录取率仅为 17.6%,远低于 2025 年的 23.4%,研究方向覆盖机器学习、自然语言处理、计算机视觉、数据挖掘等多个领域。
中国电信翼支付始终坚持在新一代人工智能技术的研发投入,收获深厚的技术积淀。此前,中国电信翼支付已在NeurIPS、AAAI、WWW 等国际顶级人工智能会议发表多篇学术论文,参与多项国家行业标准,并累计申请百余项专利,荣获“中央企业人工智能高价值场景”“华彩杯”算力大赛奖项等行业重要荣誉。
作为推动AI规模化落地的核心环节,大模型推理加速已成为行业竞争的关键赛道,其重要性不言而喻。IDC数据显示,2028 年全球推理工作负载占比将达 73%,2030 年市场规模预计突破万亿美元,年复合增长率维持 35% 高位。但推理加速面临严苛技术挑战,70B 级模型仅权重存储就需 141GB 显存,超主流 GPU 上限,且 KV 缓存随序列长度超线性增长,同时受限于算术强度低、内存带宽瓶颈等问题,需多卡并行与架构创新突破。
而解决这一高成本困局意义重大,传统的投机解码虽然一定程度上提升了推理速度,但存在同步瓶颈与Draft token的低接受率挑战。因此,中国电信翼支付创新提出了推理加速架构--Talon,这也是继 Falcon 之后翼支付在攻关精度无损的大模型推理加速关键技术方向上取得的又一项关键突破。Talon从推理范式上进行了重构,通过设计异步并行执行范式,将草稿生成与验证解耦为可同时进行的独立任务,从根本上消除了资源等待。同时,Talon引入了自适应混合草稿策略,融合模型驱动与检索驱动的方法,同时提高模型在通用和专业领域的draft token接受率,大幅提升了大模型推理速度。

得益于扎实的技术组合优势,Talon在涵盖多轮对话、代码生成、数学推理等领域的多个维度权威基准测试中得到严格验证,相比传统自回归解码实现了4.04倍至6.52倍的加速效果,尤其在知识密集型以及确定性解码场景下,Talon在各类模型、任务配置中均表现出色。该项工作对应的学术论文也以翼支付为独立单位提交至 AAAI 2026 并被录用。

X X. Gao et al.,“Talon: Breaking the Synchronization Barrier in Speculative Decoding with Hybrid Model-based and Retrieve-based Drafting”, AAAI 2026
扩散模型近年来在计算机视觉领域取得了突破性进展,广泛应用于图像生成、修复、超分辨率、视频生成等任务。其通过逐步去噪的过程生成高质量图像,已成为人工智能视觉应用的重要工具。潜在扩散模型通过压缩像素空间到潜在空间来提高生成速度与训练效率。该模型通常将图片输入VAE压缩到潜在空间,再在潜在空间中进行加噪去噪。然而在图像恢复任务中,引入两阶段模型必然会引起误差累积问题,从而导致最终恢复图像的性能下降。
现有的一些潜在扩散模型在图像恢复任务上通常采用模块堆叠的思想来进一步提高恢复效果,却很少探究潜在扩散模型在恢复任务中的缺陷。因此,中国电信翼支付与华东师范大学合作提出了潜在状态优化的策略。该策略通过重新锚定矢量量化后的锚点,来减小VAE与diffusion之间的性能间隙,从而来提高图像恢复的性能。

该策略不仅解决了潜在扩散模型在恢复任务中的痛点,还提供了充足的理论支撑来论证方法的可行性。在多个图像恢复/视频恢复数据集上均取得了性能提升的效果。该项工作由华东师范大学和翼支付合作完成,对应的学术论文此次也被 AAAI 2026 录用。

C. Hang et al.,“A Geometric Perspective on Optimizing Vector Quantized Latent Diffusion Model for Image Restoration”, AAAI 2026
