信息安全共性技术国家工程研究中心推出【生成式大模型评测服务】

在当今飞速发展的数字时代，生成式大模型正以其令人瞩目的创意能力和潜力引领着人工智能领域的前沿。

作为一种集合了复杂算法、海量数据和深度学习技术的产物，生成式大模型已经广泛应用于自然语言处理、创意生成、智能对话等领域。然而，尽管其在创造性和创新性方面取得了巨大成功，但也不可避免地面临着一些潜在风险和挑战。

为了迎接大模型带来的数字化变革，工程中心基于《生成式人工智能服务管理暂行办法》推出了大模型评测维服务。

一、生成式大模型风险与挑战

随着生成式大模型的广泛应用，一些问题也开始浮现。其中包括信息可信度的问题，模型可能会误导用户或产生不准确的内容；另外，隐私和数据安全也成为了关切的焦点，模型可能会泄露敏感信息。因此，在探索生成式大模型的无限潜力的同时，科学评测其风险势在必行。

1、数据安全与合规风险问题

数据样本的隐私性、知识产权、数据质量可能无法得到有效保护，从而导致生成式人工智能输出内容异常；

恶意用户可能利用系统漏洞，运用特定手段导致模型数据泄露，以及一些不良信息的输出；

2、对话与输出机制——用户风险与价值风险

模型可能因为无法审核带有诱导性的指令，或无法判断生成结果的影响，导致输出不良信息；

生成的内容可能包含错误、不准确或无法验证的信息，模型可能在处理特定问题时在逻辑上缺乏一致性和连贯性；

3、政策导向——国内监管日趋加强

（1）2023年4月中共中央政治局召开会议，分析研究当前经济形势和经济工作。会议提出要重视通用人工智能发展，营造创新生态，重视防范风险。

（2）2023年5月，北京市人民政府办公厅印发了《北京市促进通用人工智能创新发展的若干措施》，加强了大模型等通用人工智能的评测监管。

其中，第九条强调：“建设大模型评测开放服务平台，建立公平高效的自适应评测体系，根据不同目标和任务，实现大模型自动适配评测。”

（3）2023年7月七部门联合公布《生成式人工智能服务管理暂行办法》，自2023年8月15日起施行。

《办法》明确生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动，使用具有合法来源的数据和基础模型；涉及知识产权的，不得侵害他人依法享有的知识产权；涉及个人信息的，应当取得个人同意或者符合法律、行政法规规定的其他情形；采取有效措施提高训练数据质量，增强训练数据的真实性、准确性、客观性、多样性。此外，明确了数据标注的相关要求。

二、工程中心生成式大模型评测服务

为了迎接大模型带来的数字化变革，工程中心基于《生成式人工智能服务管理暂行办法》制定了全新的评测维度，形成大模型评测服务，为模型的全面性能评估提供了更多的视角，可有效提升大模型服务的透明度，提高生成内容的准确性和可靠性。

工程中心大模型评测服务从稳定性、交互性、应用性、安全性、鲁棒性五大评测维度等多角度出发，针对生成式人工智能模型目前存在问题，进行全方位评测，不仅涵盖当前主流评测体系的评测维度，还引入了一些新的维度来评估模型的性能和合规性。

• 模型稳定性评测

模型稳定性测评是评估模型在非常规输入下能否提供安全稳定的服务，用于测试大模型在各种场景下的稳定性和性能。这有助于评估模型在实际应用中是否能够满足需求。

• 模型交互性和应用性评测

具体包括了多语种评测、语言流畅度、情感分析、代码评测、专业翻译、摘要能力、百科知识、逻辑推理等多个子项。通过这些评测子项，可以全方位衡量大模型的表现和能力。

• 模型安全性评测

模型安全性主要包含模型可以避免虚假、歧视信息输出、数据合规检查以及环境安全检测等多个子项，为模型可靠性和安全性提供应用依据。

工程中心大模型评测服务以法律层面《个人信息保护法》、《网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国密码法》等法律要求；国家标准层面《GB_T 22239-2019信息安全技术网络安全等级保护基本要求》、《GB-T 39412-2020 信息安全技术代码安全审计规范》、《GB_T 25000.10-2016 系统与软件工程系统与软件质量要求和评价(SQuaRE) 第10部分系统与软件质量模型》、《GB_T 41479-2022 信息安全技术网络数据处理安全要求》、《GM/T 0054-2018信息安全技术信息系统密码应用基本要求》、《GB/T 20984-2022信息安全技术信息安全风险评估方法》等标准；为支撑实现大模型软件安全、等级保护、密码评估、风险评估、代码审计、数据安全等合规性的评测。

• 模型鲁棒性评测

模型鲁棒性主要包含模型可以抵御恶意数据的输入、防止隐私泄露以及模型输出的可解释性，从测试数据攻击、训练数据投毒、隐私泄露以及可解释性多角度出发进行评测。

了解更多服务详情可通过工程中心官方微信【信息安全国家工程研究中心】联系交流。

让我们共同创造一个安全、可靠的人工智能未来！

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

标签：

猜你喜欢

打通数字化供需的“堵点”，第二届828 B2B企业节北京站正式启动

CAS华车展全球发布，开启恢宏新篇章

CAS华车展正式启动：“超越会展”打造智能电动汽车会展标杆

【爱普生光影研究院】中国传媒大学戏剧影视学院光影空间艺术专业成果展

英雄出少年！爱普生助力青少年高尔夫球员挥出精彩，释放热爱！

绿色未来ESG科技圆桌 x MINDPARK圆满举办

新学期、新课程，华为云空间助你快速“通关”新挑战

NO钱包，便捷高收益的数字资产管理平台，开启财富增值之旅

夏日盛宴！NO钱包福利提升，矿工补贴大升级！

中科大数据研究院丨“计算机系统与开源芯片敏捷开发”首期师资培训班顺利举办

重庆邮电大学骁磁科技团队:创新打造高性能吸波材料,守护星载设备安全

让数据美丽，为产业赋能，奥维云网数字生态大会价值显现

心血管健康问题上升？赛乐瑞Super-K专注细胞抗衰，给予科学养护

过度依赖代餐更易加速衰老？赛乐瑞Super-K双维养护，助力健康长寿

殿堂级别细胞抗衰对抗岁月流逝，赛乐瑞MAX开启健康长寿新时代

逾越时光，赛乐瑞Pro助力激发年轻活力

益生好真的好用吗？TIMESHOP益生好让你无惧断崖式衰老

TCL华星参展DIC 2023 多款高精尖产品尽显科技魅力

倒计时1天！「抖音中秋好礼季」将启动盛大招商

博奥真脑怡维提升神经细胞活力，促进脑部健康

博奥真脑怡维全链路脑衰老干预，提高你的记忆能力

InfoLink 2023上半年光伏组件出货排名出炉，正泰新能全球第六

博奥真脑怡维靶向脑部抗衰老，预防阿兹海默症生成

博奥真脑怡维助力大脑年轻态，减少脑力劳动的疲惫感

前瞻预告，TCL光伏科技一站式智慧能源解决方案即将亮相IFA

数字方程出版喜获6项计算机软件著作权

TIMESHOP益生好辅助改善亚健康问题，深层呵护，焕活新生

权威认可！闪回收系统通过公安部“国家信息安全等级保护认证”

“马上速度”！全国首个零售金融大模型亮相，数字融合体时代来临

喜讯丨健康有益董事长李宇欣入选《霓——2023中国女性创始人TOP20》

热点图片

要闻

立足国家战略需求创新金属复合材料
当今时代，人类科技水平迅猛发展，达到了前所未有的高度，而随着材料的日新月异，更新
奏响数字建设最强音|鲲鹏开发者创享日助力广州数字建设大有可为
8月25日，鲲鹏开发者创享日广州站在香格里拉酒店拉开帷幕。本次活动由华为公司主办，
华为数字机器人华北示范中心人才培养师资培训成功举办
2023年4月,唐山市人民政府、曹妃甸区人民政府、华为三方签署华为数字机器人华北示范中
为跨校跨专业考研学子护航，橙啦考研考研SPA全新升级
2023年8月28日，「跨考不设限」暨橙啦考研秋季产品发布会在北京互联网教育创新中
护肤怎能不对付“细胞刺客”？Bioagen博奥真面膜专利成分助力还原至臻美肌
对于资深爱美人士来说,自由基肯定不陌生,自由基是一种高度活跃的化学物质,它们具有未
肌肤修护不焦虑！Bioagen博奥真超导精华科学复配只为肌肤健康
作为二十一世纪的都市丽人,修护肌肤的专业用品必不可少,洗面奶、爽肤水、面膜、乳液、
黑眼圈不可怕，Bioagen博奥真超导眼霜助力减轻色素沉积，还原眼周紧致
在周日夜晚的凌晨时分,抱着手机醉心于综艺和短视频的样子,已经成为当下生活的常态。对
再也不怕肌肤冷应激！Bioagen博奥真超导面霜助力在高寒地区还原至美肌肤
在最近的互联网上,有一句话广为流传,它就是青春没有售价,硬座直达拉萨,如此的slogan再
TIMESHOP倍他强加倍强大，精准靶向抗衰，守护男性健康
21世纪以来,男科疾病以每年3%的速度递增,已经成为威胁男性健康的第三大疾病,这已经引
赛乐瑞Cellerator守护机体，做你抗衰道路的指明灯
大健康和抗衰是当今社会越来越受关注的话题。随着人们寿命的延长和生活压力的增加,健

信息安全共性技术国家工程研究中心推出【生成式大模型评测服务】

相关阅读

猜你喜欢

热点图片

要闻