《机器学习模型数字水印》出版，破解人工智能模型产权保护难题

摘要：近日，由微众银行人工智能首席科学家范力欣博士，马来亚大学陈志胜教授，加拿大工程院及加拿大皇家科学院两院院士、微众银行首席人工智能官杨强教授联合业内多位专家学者共同编写的，关于利用数字水印技术验证机器学习模型所有权的论文合集《机器学习模型数字水印》正式出版。

正文：

6月30日，国家知识产权局发布《二〇二二年中国知识产权保护状况》白皮书显示，中国政府不断强化知识产权全链条保护，筑牢知识产权领域安全屏障。随着人工智能的发展，机器学习模型在各个行业、各个领域中发挥着越来越重要的作用，特别是大型预训练深度学习模型，其经济价值日益凸显，模型的知识产权保护问题也越来越受到关注。一方面，训练性能优越的模型成本高昂，需要大规模数据集、庞大的计算资源和设计者的智慧，模型产权保护涉及数据提供者和模型开发者的直接利益。另一方面，模型知识产权保护对于激励创新、促进技术转移和合作起着至关重要的作用，关乎整个产业的公平、健康发展。在此背景下，结合行业专家的研究成果与法律政策要求，以技术手段解决时代难题，将助推当前大模型时代下模型知识产权保护领域的发展。

近日，由微众银行人工智能首席科学家范力欣博士，马来亚大学陈志胜教授，加拿大工程院及加拿大皇家科学院两院院士、微众银行首席人工智能官杨强教授联合业内多位专家学者共同编写的，关于利用数字水印技术验证机器学习模型所有权的论文合集《机器学习模型数字水印》正式出版。

图：书籍封面

书中提出了一系列模型水印方法，将水印植入到目标模型中以便在模型被窃取时，模型所有者可以提取预定义的水印来声明所有权。模型水印方法采用后门训练、多任务学习、决策边界分析等常用技术来生成构成模型水印或仅为模型所有者所知的指纹的秘密条件。这些方法对模型性能几乎没有影响，这使得它们适用于各种情况。就鲁棒性而言，植入水印必须能够抵御各种试图删除水印的对抗性攻击。模型水印方法的有效性体现在图像分类、图像生成、图像描述、自然语言处理和强化学习等多种应用中，有助于破解人工智能模型产权保护的难题。

本书的主要编者之一，微众银行人工智能首席科学家范力欣博士表示：“本书由一群活跃在机器学习、数据和模型管理、联邦学习等技术前沿应用领域的研究者共同完成，汇聚了大家在人工智能领域的最新研究成果。书中涵盖了使用水印保护机器学习模型的动机、基本原理、技术和协议。此外，还展示了模型水印、签名和护照嵌入等方面的前沿工作，以及它们在分布式联邦学习环境中的使用案例。”

图：章节目录

行业相关专家对书中的相关技术与应用给予了高度评价。观韬中茂律师事务所合伙人、中国首席数据官联盟专家组成员王渝伟指出，“数字水印技术在传统知识产权保护领域有较广泛的应用，但就该技术在模型产权保护中的应用及其价值的讨论和研究还是一个很新的话题。与其他技术手段相比，数字水印技术所具有的唯一性、与加密相结合、难以伪造以及成本效益高等优点，让我们相信该技术可以成为模型产权保护中的重要技术手段和法律证据来源。但考虑到模型具有软件、算法和数据的特征，难以纳入现有的知识产权类别，这也使得依靠现有知识产权法律难以提供全面保护。更优的方式是将数字水印等技术与明确的法律法规相结合，探索的多层次的模型产权保护机制，以发挥数字水印等技术的最大作用。这些都是未来人工智能立法需要统筹考虑的，同时也是留给关注该领域技术与应用的本书读者们可以持续思考的问题。”

标签：