腾讯云TCDataAgent:跻身国际Bird榜单前三,研究成果入选VLDB

2025-07-07 13:51:23     来源:

国产Agent进入“NL2SQL全球最难榜单”前三。

7月4日,据国际权威评测基准BIRD-Bench官网消息,腾讯云自研的数据分析智能体TCDataAgent斩获全球第三的成绩,超越IBM、Meta等众多国际厂商,同时也是目前国内在该榜单上排名最高的排名。

来源:BIRD-Bench官网

BIRD-Bench以其严苛性被誉为“NL2SQL全球最难榜单”。它不仅要求系统将自然语言问题(如“找出未通过质检的订单”)准确翻译成SQL语句,更要求生成的SQL在真实、庞大且含“脏数据”的企业级数据库上执行结果精准且运行高效,对模型的深层语义理解和数据库真实内容感知能力提出了极高挑战。

在这个以真实业务数据库为基础的测试中,覆盖金融、医疗、体育等37个行业场景,数据库总容量达33GB,查询问题超过1万条。TCDataAgent在官方不公开数据集的封闭测试环境下,最终获得了75.74分,位居全球第三, 国内第一。

相比于传统NL2SQL方案往往只能依赖有限信息“猜测”用户意图,易因数据结构复杂或语义模糊出错。TCDataAgent登榜的技术创新来源于引入了数据库约束验证机制,能够自动识别并修正SQL中潜在的结构性或语义性错误(如错误连接、冗余条件)。

更重要的是,它紧密结合数据库的真实内容对生成的SQL进行优化,显著提升了用户意图识别的准确率和翻译结果的可靠性。值得一提的是,TCDataAgent还引入了后训练(post-training)技术,通过优先筛选并复用效果最优的SQL样本进行模型迭代训练,有效提升了训练样本的质量和模型学习的稳定性。

腾讯云TCDataAgent在NL2SQL领域的技术研究成果也获得了国际学术界的认可,相关论文已被今年的数据库领域顶级国际会议VLDB接收。论文中的实验表明,TCDataAgent的“数据库内容感知”核心技术模块,可以无缝集成到其他NL2SQL系统中,最高能将查询执行准确率提升18.3%,并在多个主流方法上实现了超过5%的性能提升。

作为腾讯云新一代企业级智能分析Agent,TCDataAgent致力于让用户直接使用自然语言对结构化和非结构化数据进行复杂的数据查询、报表生成和趋势分析等任务,目前已开启内测。

 

标签:

猜你喜欢

轻薄实力派 |TECNO SPARK40系列发布,越级体验,一步到位
科大讯飞双屏翻译机2.0荣获“国际CMF创新奖”
厚植金隅沃土 滋养科技之花丨2025“隅翼杯”创新创业大赛燃情启航
小哈发布棱镜·云BMS,携宁德研究院、新能安重构两轮能源安全新标准
打造金融行业鸿蒙化“中行样本”,中国银行旗下多款鸿蒙应用迎来新突破
从绿茵场到洗衣房:海信三筒专利开源背后的全球体育消费新逻辑
从无码化脚本到根因智能诊断,Testin云测AI测试的实战突破
科力锐深度参编新版《信息系统灾难恢复规范》国标发布,引领应用级灾备新纪元!
中国红十字基金会携手北京字节跳动公益基金会助力233名西部儿科医师成长
AI测试服务商标杆:Testin云测获评“2025 AI测试创新引领奖”
毕业季游戏利器 RTX™ 5060 ROG魔霸新锐2025 部分地区享国补20%优惠
AI社交先行者Soul:以技术创新开拓陪伴边界
银河麒麟赋能医疗创新:瑞金医院构建全栈国产化数字底座
破解废弃资源再生难题,高端热解技术助力"绿色产业崛起"
CTI华测灏图品测首创消费者偏好AI预测模型斩获"2025荣格技术创新奖"
充电宝登机新规 充客以长效安全构筑品牌通行证
华为携手中戏打造“智能艺术教育空间”样板点——艺术与科技共生的数智化创新实践
荣耀Magic V5打破荣耀历史折叠屏首销日销量记录
李一桐、刘宇宁担任爱奇艺VIP内容推荐官 邀会员追剧赢好礼
国产射频再发力 左蓝微电子推出PESAW工艺高性能四工器B66+B25+70
一家黄金“老牌子”,决定在抖音生活服务讲新故事
腾讯系TOP游戏《火影忍者》鸿蒙版正式上架,头部游戏矩阵再扩容
AGON爱攻BW竞化之旅:赢G2签名版显示器,燃爆盛夏
菲沃泰亮相Motor CHINA 2025中国电机展,以纳米科技赋能电机产业迈向“智造”新高度
模型推理协作正式开启,魔乐社区,让模型跑遍“中国芯”
中国本地化集成平台WeCom Template iPaaS重磅发布,推动企业数字化集成迈向标准化
服务3000万大学生,易校园App鸿蒙版已支持校园卡、后勤等核心功能
碾压级洁净力!MOVA Z60 Pro滚筒式扫地机,污渍克星正式上线!
暑期出游更省心!鸿蒙版去哪儿旅行:一句话订票、高铁动态桌面看、车机导航碰一碰
优刻得x创新奇智,工业AI Agent一站式开发上岗