近日,2024中国国际大数据产业博览会(数博会)在贵州发布年度科技成果。腾讯凭借其“数据要素自适应流通技术创新及合规应用”项目荣获优秀科技成果奖。该项目首次将“自适应”理念引入数据流通环节,并通过四大技术引擎实现了数据流通性能可用和安全合规的平衡。
据预测,2024 年我国数据要素市场规模将达到 1465 亿元。未来五年(2024-2028)年均复合增长率约为 17.05%。各行各业都投身于数据价值挖掘,但一直面临着数据流通和安全合规难以兼得的挑战。
腾讯依托内部大规模业务的数据流通及安全实践和多年的技术标准积累,通过天穹平台的承载,将“自适应”的理念贯穿数据要素流通技术处理各环节。具体而言,通过构建数据流通合规引擎、去标识化/匿名化引擎、数据访问控制引擎和隐私计算引擎四大引擎,保障各个流通环节的效率和安全。
数据流通合规引擎,将原本线下评估流程转变为线上自动化操作,通过“灵犀隐私平台”实现合规要求与业务开发程序的融合,以数据分类分级为基础实现自动化、系统化地管理数据全流程。
去标识化/匿名化引擎,采用差分隐私、k-匿名等技术降低数据敏感性,确保查询结果不受个体数据的影响,进而保护数据主体的敏感信息不会泄漏。目前,该引擎可同时支撑千万级数据规模计算。
数据访问控制引擎融合了可信硬件和先进的密码算法,既保障了计算效率又不失安全防护;同时,通过创新的加解密技术,确保了数据处理的每一步都固若金汤,让敏感信息牢不可破。
隐私计算引擎整合了同态加密的联邦 XGBoost、联邦 DNN、全匿踪联邦学习等技术,实现数据的“可用不可见”。其中,全匿踪联邦学习开创性提出了Dual-Circuit-PSI 框架,为业界首个支撑百万级别的全匿踪联邦 GBDT 系统,性能可用的同时保证整个过程中不会泄漏用户信息以及任何中间结果。
由这四大技术引擎形成的数据要素流通解决方案,已在多个场景中得到应用。在营销场景,支撑某联邦广告在金融、网服、电商零售等行业的业务落地,全年提升广告消耗4000万;在金融风控场景,通过联邦建模提升某支付业务的贷前反欺诈模型效果,减少违约金额800万。
除此之外,腾讯还在四大引擎技术基础上,通过腾讯云联邦学习平台、隐私计算平台、数链通平台等产品,为政务、金融等多领域头部企业大数据平台提供服务,助力企业安全释放数据价值。
随着数据要素市场的不断扩大,腾讯的“数据要素自适应流通技术及合规应用”体系将在企业内部、跨企业、跨行业、跨地域的数据流通中发挥更大作用。该技术体系不仅有助于提升数据流通效率和性能,降低流通成本,还将进一步繁荣数据要素市场,驱动数字经济高质量发展。