中国电信翼支付自研推理加速架构Talon被国际人工智能顶会AAAI 2026接收

2025-11-10 18:21:09     来源:

当前,大语言模型(LLMs)在智能客服、代码生成、内容创作等场景中正发挥着越来越重要的作用,但受限于推理速度瓶颈,多数模型在部署和运行过程中的计算资源消耗仍存在较大优化空间,难以控制推理成本,也因响应延迟而影响用户体验,限制了在实时场景下的应用。据统计,截止到2025年上半年全国公有云厂商大模型调用日均输出约2.96万亿tokens,成本高达405亿元。与此同时,大模型深度思考大幅提升了推理结果的可靠性,然而更长时间的响应延迟也带来了AI产品使用体验不足的问题。

11月9日,中国电信翼支付Talon架构技术论文被国际人工智能顶会AAAI(人工智能促进协会会议)2026接收,标志着其创新性再次获得了国际学术界的权威认可。

中国电信翼支付一直致力于攻关大模型推理加速关键核心技术,2024年中国电信翼支付自研Falcon架构技术论文被国际人工智能顶会AAAI 2025接收。2025年,中国电信翼支付推出第二代推理加速架构——Talon,该架构严格保持生成质量无损的基础上,实现最高6.52倍的加速,在精度无损条件下最高可将推理成本降至原来的1/6,性能相较于大模型行业领先水平提升了50%+, 也超越了当前国际同类型方法。

AAAI创办于1979年,是国际人工智能顶级学术会议,并收录于CCF-A类会议目录中,每年吸引全球大量知名企业、科研院校等顶尖AI团队参与,至今已举办40届。AAAI 2026将于2026年1月在新加坡举行,本次会议共收到近31000篇投稿,其中有效投稿共计23,680篇,创历年新高,然而录用率仅为17.6%,为近三年最低,且热门领域第一阶段拒稿率高达67%,反映出空前的竞争压力。

破解效率难题,实现推理速度最高6.5倍

传统的投机解码虽然一定程度上提升了推理速度,但存在同步瓶颈与Draft token的低接受率挑战。Talon从推理范式上进行了重构,通过设计异步并行执行范式,将草稿生成与验证解耦为可同时进行的独立任务,从根本上消除了资源等待。同时,Talon引入了自适应混合草稿策略,融合模型驱动与检索驱动的方法,同时提高模型在通用和专业领域的draft token接受率,大幅提升了大模型推理速度。

得益于扎实的技术组合优势,Talon在涵盖多轮对话、代码生成、数学推理等领域的多个维度权威基准测试中得到严格验证,相比传统自回归解码实现了4.04倍至6.52倍的加速效果,尤其在知识密集型以及确定性解码场景下,Talon在各类模型、任务配置中均表现出色。

学术行业双认可,夯实技术领先地位

中国电信翼支付始终坚持在新一代人工智能技术的研发投入,收获深厚的技术积淀。此前,中国电信翼支付已在NeurIPS、AAAI、WWW等国际顶级人工智能会议发表多篇学术论文,参与多项国家行业标准,并累计申请百余项专利,也为此荣获“中央企业人工智能高价值场景”“华彩杯”算力大赛奖项等行业重要荣誉。此次Talon被国际人工智能顶会AAAI 2026接收,是中国电信翼支付创新研发能力的又一次有力证明。

理论实践并重,助力企业用户降本增效

性能突破的价值最终体现在业务成效上。目前,Talon技术已集成至中国电信一站式Mass平台InsightAI,服务中国电信翼支付“数字人客服”“翼小橙”“翼点通”“翼小财”等多个核心业务,不仅为用户带来了流畅、迅捷的交互体验,更在保证生成内容精准无误的前提下,将大模型推理成本降至原先的1/6,降本增效效果显著,将数智化技术高效性直接转化为了可观的运营效益,为大规模、高并发下的AI应用铺平了道路。

未来,中国电信翼支付将继续深化Talon等自主核心技术的迭代与应用,并将其通过InsightAI平台向更广泛的行业伙伴开放,以创新技术赋能至千行百业,助力企业实现大模型高效、可靠、低成本的规模化部署,推动人工智能技术的务实发展与产业升级。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

宏碁双十一限时特惠,好价好机叠加多重好礼!
鸿蒙版百度文库上架!18亿文档+多样AI工具,让创作更专业、高效
企业如何构建「本体」驱动的智能决策闭环
双十一NAS推荐,首选铁威马F4-425 Plus
韩正副主席出席联合国第二届社会发展世界峰会 数智院蒋光建院长随团参会
平板手写笔也能发挥大作用!双十一必买张凌赫同款AI平板YOGA Pad Pro 14.5
SEAVIV希未与AMD共同助力 淮师数字科技文化节完美收官
施耐德电气八赴进博之约:深耕中国,共创新质未来
新能源汽车行业“一图四清单”供需对接会 | 需求&解决方案征集正式启动!
新浪新闻探索大会丨探索对话:如何掌握科技创新的时代红利?
海信、TCL、倍轻松、艾力斯特等品牌齐聚京东直播间 现场比价发5折优惠
全球权威媒体解密HUAWEI SOUND ULTIMATE 非凡系列音响的“成熟方法论”
中国学者发现诗歌“结构常数” 鸢尾诗体研究取得计量突破
海信激光电视携手帝瓦雷亮相巴黎歌剧院,打造家庭影院全新视听盛宴
久雀携手帆软:打响数据驱动的“升维之战”,久雀使命:先进的管理一直以来都不是一句空话
靠抖音1年拓店300家,江西这个“95后”餐饮老板凭什么?
演讲精粹|硅基流动大模型基础设施探索与实践洞察
拍我AI双十一推出商用Agent一键成片和模板库,助力分钟级创意生产力
连续三年!腾讯云列入Gartner®《中国托管检测和响应服务市场指南》代表供应商
HUAWEI SOUND车载音响技术品鉴会圆满落幕,非凡系列车载音响以硬核科技赢得国际赞誉
高通侯明娟:与合作伙伴将AI持续落地到终端,让消费者体验变得更好
《2025天猫耳机品类年度白皮书》重磅发布
思必驰高始兴出席两岸两链大会,谈大模型对话式AI赋能终端实践
从列车高清视频方案看国产操作系统赋能铁路数字化转型
新浪新闻探索大会丨秦兵:大模型时代情感交互的演进与对齐
央视走访京东家电家居采销直播间 探秘11.11物美价优的背后门道
通兑券订单1400+ 直播成交GMV超233万 “买车先买券”成汽车“双11”增长关键词
京东联合多方发起助老公益行动,500份爱心电饭煲和优质大米守护乡村老人每一餐
“腔镜圣手”白会敏医生CSCCP分享:以保守治疗守护女性未来
魔力全开 狂补狂省 三星Galaxy穿戴产品双十一热销中