2023年初,ChatGPT横空出世,标志着生成式人工智能崛起。
作为一种新兴的数据安全技术范式,隐私计算借此契机,再次成为焦点。
近日,召开的2023中国人工智能大会共有8个平行专题论坛,其中就包含聚焦隐私计算的“隐私计算与人工智能发展专题论坛”。无独有偶, 今年7月初举办的2023世界人工智能大会上,同样针对隐私计算技术开设了“数据要素与隐私计算高峰论坛”。
2023年,被视为隐私计算“融合应用之年”,是隐私计算在多个行业场景大规模应用的关键年份,在人工智能加速落地的时代,这一“数据安全技术基座”将迎来更多的爆发机遇。
隐私计算是在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。基于这一特性,隐私计算可以确保在不泄露数据内容的情况下,帮助人工智能获取更多、更广、更深的数据资源。
从1949年香农开创现代密码学时代起,安全多方计算、零知识证明被陆续提出,多种新的技术路线和隐私计算方案(例如混淆电路、基于秘密分享的MPC、半同态加密等协议和算法等)也陆续出现,七十余年间,隐私计算的技术体系逐步发展和壮大,并开始有大规模的项目落地。
2019年后,隐私计算进入应用期,在数据要素市场建设和数据价值发挥的时代背景下,产业需求快速增长,隐私计算走出学院派与实验室,广泛与行业应用场景相结合。各类隐私计算厂商也如雨后春笋一般涌现出来,激发了隐私计算技术可用性的快速提升。
时间来到2023年。数字经济建设提档加速,人工智能方兴未艾,人们开始了对区块链、元宇宙等概念的探索。新技术崛起,为隐私计算带来了全新的挑战与机遇。
融合发展:人工智能带来挑战与机遇
2023中国人工智能大会期间,上海交通大学讲席教授、博导、日本工程院外籍院士李颉在演讲中指出,人工智能的三大基础是算法、数据、算力。聚焦数据层面,如何在合规尊重用户隐私的条件下充分发挥数据价值,如何打破壁垒、连接数据孤岛、提高可用数据的数量和质量 ,已成为人工智能发展需要解决的关键问题,而隐私计恰恰就是打破数据孤岛、拓展数据疆界的关键技术。
人工智能技术革命背后意味着巨大的隐私挑战。
在以深度学习为主导的人工智能浪潮中,基于大数据的深度学习技术最开始在互联网领域成功落地,并广泛运用于搜索、推荐、语音识别、机器翻译等各个方面。随着人工智能超级模型工作的推进,算法训练模型所使用的数据规模越大,模型参数规模越大,模型在使用时候识别精度就越高。至此,AI进入大模型时代,并有望在医疗、金融、教育等数据丰富的行业首先落地。
AIGC的出现标志着人工智能发展史走到了“奇点”。数字技术迎来颠覆性的变局,也将会带来新的冲击和挑战。尤其是AIGC的训练过程基于大量数据集,这一属性也会使数据收集、使用、流通和计算面临更多合规要求。因此,在展望AIGC未来的同时,仍需要增强隐私计算技术的应用,并通过建立监管机制、增强相关立法,确保AIGC合规发展。
未来方向:乘时乘势,带入千行百业
AIGC崛起,有望成为隐私计算迎来“原爆点”的契机。
在技术层面,隐私计算不同技术路线正在走向融合,实现“1+1>2”的效果。与此同时,隐私计算与区块链、人工智能、工业互联网也逐步融合,尤其是隐私计算与硬件的结合已产生多款一体机等软硬件结合产品,预计将会越来越丰富。聚焦AIGC,当前业内均在尝试使用各种方式保护用户数据隐私。除了较为直接的方法,如向用户提供警告信息之外,隐私计算也已成为AIGC中隐私保护的重要工具,联邦学习和可信执行环境是其中较有代表性的技术路线。
在AIGC服务的生命周期中,用于训练的大规模数据集和用户的私人信息需要得到保护,可以利用联邦学习来解决训练数据的安全问题。由于AIGC应用与互联网高度集成,用于AIGC模型训练的数据发生在边缘服务器和移动设备上,它们对各种威胁隐私的攻击的防御能力较弱。最近,研究人员已经提出几个分布式学习框架用于隐私保护,利用联邦学习技术,可以实现在边缘服务器和移动设备上进行模型微调和推理,联邦学习在训练期间不传输原始数据,从而确保AIGC模型训练过程的安全性。
在此基础上,将可信执行环境(TEE)和联邦学习技术结合,可以为大语言模型提供更完善的隐私和数据保护。借助基于TEE的联邦学习解决方案,在训练阶段,TEE中的数据处理都处于加密状态,在推理阶段TEE能够保护用户输入和模型结果的隐私;同时,TEE的硬件隔离和安全验证机制可以防止未经授权的访问和攻击,增强模型运行时的安全性。
伴随着技术的不断成熟,国内外隐私计算产业化的步伐明显加快。未来几年,将是隐私计算技术产品加速迭代、应用场景快速拓展、产业生态逐步成熟的重要阶段。
以AIGC的“奇点”为契机,隐私计算有望迎来“原爆点”,被带入千行百业。联邦学习、TEE等多种技术体系间也将实现更深刻的融合。
在不远的将来,这项技术将如同移动互联网、水、电网一般,成为数字时代的底层基础设施。