蚂蚁集团蚁天鉴2.0发布，打造业内首个大模型安全测评智能体和AI鉴真功能

7月5日,在2024世界人工智能大会“迈向AGI:大模型焕新与产业赋能论坛”上,蚂蚁集团联合清华大学发布大模型安全一体化解决方案“蚁天鉴”2.0版。蚁天鉴2.0新增AI鉴真功能,支持图像、视频等多模态内容真实性及深度伪造检测;并在测评功能上持续升级,打造了大模型安全测评“智能体”,并新增大模型X光、大模型基础设施测评两大测评功能。至此,蚁天鉴2.0形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。

(图:蚂蚁集团联合清华大学发布“蚁天鉴2.0”)

蚂蚁集团副总裁、大安全技术部总裁李俊奎现场发布了这一升级产品,并介绍道,大模型和Agent智能体正带给我们前所未见的智能体验,同时也带来了模型内部幻觉、安全漏洞和深度生成内容滥用等新的挑战。蚁天鉴旨在打造AI大模型的安全铠甲,确保大模型技术在安全可靠的环境中发挥效能。

记者从现场了解到,蚁天鉴2.0有两大特色,一是在测评端研发了业内首个“测评智能体”。该测评智能体提供全流程自动化的安全测评工具,支持各种形式模型和深度学习框架,可扩展测评垂类大模型、多模态大模型及Agent智能体,并能根据被测大模型的安全水位动态调整攻击策略和出具测试用例,保障测评效果和效率。目前,蚁天鉴2.0有超300万高质量测评题库,支持最高50万/日的饱和式攻击和逐级诱导深度攻击,并实现了1工作日内完成测评,全流程自动化率>99%。

与此同时,该智能体也增加了两项新功能。一是「大模型X-ray」。即大模型X光,可针对大模型的内在神经元进行X光扫描来做探查和判断,让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正,从而在模型内部治理幻觉,实现从源头识别和抑制风险。二是「大模型基础设施测评」。此前蚁天鉴的测评能力主要集中于大模型生成的内容安全、合规风险等检测。蚁天鉴2.0从攻击者全链路视角出发,深入扫描模型算法组件及软件系统,可及时准确发现大模型供应链及运行环境安全问题,保障云到端的应用安全可控。

同时,蚁天鉴2.0防御端新增「AI鉴真」功能。支持多模态内容真实性及深度伪造检测,可快速精准鉴别图像、视频、音频、文本内容的真伪,图像识别准确率99.9%达到行业最高优秀级(信通院测评)。目前,蚁天鉴2.0依托生成模型自建百万量级音视图多模态合成数据集,覆盖主流生成方案,有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景。

(图:蚁天鉴2.0大模型安全一体化解决方案全景图)

据了解,蚂蚁集团是国内较早布局大模型安全的厂商。蚁天鉴去年7月首次对外发布,1.0版本即被评为2023年世界人工智能大会“镇馆之宝”。历时1年升级到2.0版,蚁天鉴2.0构建了双重防御护栏,内置防护关注训练阶段的数据清洗和风险抑制;外置护栏融合智能风控技术,精准拦截输入和输出的风险内容,保障其应用安全。

目前,蚁天鉴的检测与防御产品已开放给20家外部机构和企业使用,为通用大模型及医疗、金融、政务等垂直领域行业大模型应用安全保驾护航。例如,上海市第一人民医院引用了蚁天鉴,有效应对医疗领域大模型应用中的信息安全与隐私保护、双向内容风险防控等挑战;蚂蚁AI金融助理“支小宝”结合蚁天鉴,通过大模型训练与推理风险管控、大模型风险点全方位评测、大模型用户交互风险管控等举措保障大模型应用安全,确保数据的准确性和金融逻辑的严格性。2024年,蚁天鉴商业化迈出重要一步,通过蚂蚁数科开始服务广泛的外部客户。

论坛现场还发布了由清华大学、中关村实验室、蚂蚁集团等机构联合编制的《大模型安全实践(2024)》白皮书。这也是国内首份“大模型安全实践”研究报告,为行业打造高价值参考体系。

(图:大模型安全实践白皮书现场发布)

白皮书基于当前大模型发展趋势与挑战,提出了大模型安全实践总体框架。即确立了“以人为本,AI向善”为大模型安全建设的核心,确保技术进步服务于人类福祉;以“安全、可靠、可控”三个核心维度的大模型安全技术体系,涵盖大模型安全测评与防御的综合技术方案;以及“端、边、云”为大模型安全技术的主要承载实体。作为企业撰写方,蚂蚁集团安全生态副总裁邵晓东进行了现场发布并表示,白皮书还阐述了大模型在金融、医疗、政务等领域安全应用的案例,以及“五维一体”协同共治的治理框架,希望行业共同推动大模型安全生态发展。

本场论坛汇聚了国内外研究机构和顶尖学者以及产业人士等,从前沿技术、产业应用等不同视角分享了大模型安全的研究,探讨端云协同、端侧应用等最新趋势以及大模型安全最新体系与实践。这些深入的讨论,也将为大模型如何安全可靠地助力产业转型升级、推进数字经济发展提供更加明确的前进方向。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

标签：

猜你喜欢

直击WAIC：阡视科技自主创新技术引领AI大模型未来

里昂证券公布中国ESG得分TOP10 A/H股公司，瑞声科技、比亚迪等上榜

华为发布全球首个基于R18 的5G-A商用版本Apollo

易庐展位亮相2024广州光亚展，全方位赋能光空间

华为岳伟：F5G-A品质全光网，开启体验经营新时代

华为在WAIC 2024召开分论坛正式启动2024华为开发者大赛上海站

弥知科技Kivicube重磅更新, 上架苹果 Vision Pro 应用市场，零门槛低代码创作, 打造XR未来

2024全球数字经济大会，中关村科金受邀出席城市副中心论坛演讲

备战马拉松，开启竞速新时代 On昂跑全新发布 Prism 系列

文心大模型4.0 Turbo面向企业开放，文心旗舰模型全线降价！

40多位车企工程师现场监督，懂车帝夏测给中国新能源行业带来了什么？

新壹科技亮相2024世界人工智能大会推出新壹视频大模型2.0

从今天起，文心智能体平台开发者可免费使用文心大模型4.0

守护数字安全：WiFi万能钥匙彰显个人信息保护承诺

途鸽科技亮相MWC世界移动通信展，多款物联网出海解决方案受热捧

BW 2024盛典来袭！ROG掌机X新品首亮相实力再进化！

智子引擎亮相2024世界人工智能大会，Awaker多模态大模型系列产品惊艳首秀

云原生|全景智联SMCDB平台上架青云科技KubeSphere Marketplace！

倍思主动召回流程早已上线用户可登陆小程序“倍思售后”参与

2024全球数字经济大会，中关村科金受邀出席城市副中心论坛演讲

数字人+大模型，相芯亮相2024世界人工智能大会展示行业新质生产力！

向“新”而行，“质”赋滨城，华为开发者大会2024大连分会场圆满举办

华为发布园区网络“光进铜退”先锋行动——将投入5000万元营销资源支持新老伙伴共赢园区数智新未来

5G-A“六边形战士”，芯讯通SIM8390实时在线

强力巨彩LED灯杆屏性能显著，多维赋能智慧城市建设

金山办公升级AI战略正式发布WPS AI 2.0

北京科学智能研究院、上海算法创新研究院与华为云达成深度合作共推AI技术创新与产业发展

2024世界科学智能大赛启动，上海科学智能研究院、复旦携手阿里云推动科学智能创新

《国有企业数字化转型成熟度评估模型》在全球数字经济大会发布|中科通量参编

暑期购机好价嗨翻天三星商城热门Galaxy等你来选

热点图片

要闻

明略科技集团强势入选“2024年中国人工智能行业大模型企业竞争力100强”
近日，赛迪工业和信息化研究院（集团）四川有限公司正式发布2024年中国人工智能行业大
华为云董理斌：做难事解难题，盘古大模型以“智”重塑千行万业
7月5日，2024世界人工智能大会暨人工智能全球治理高级别会议—盘古大模型重塑千行万业
盘古大模型5.0加速AI行业应用落地华为云将推动端云算力协同
7月4日-6日，2024世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2024）在上海
施耐德电气：三箭齐发，借力AI技术加速能源转型
突飞猛进的人工智能（AI）技术，正在以汹涌澎湃的创新动能，叩响着各个行业的变革之门
2024中国（丹阳）国际菁英创业大赛火热报名中
丹阳，古称曲阿，地处长三角核心腹地，是中国县域经济最发达的城市之一。丹阳区位优势
华为云与朗坤集团、软通动力全面合作，探索生物科技数字化转型新路径
7月3日，华为云与深圳市朗坤环境集团股份有限公司（以下简称朗坤集团）、软通动力信息
四川小伙裸辞扎进抖音探店赛道，靠特色内容种草带旺酒店民宿
心灵与身体都要在路上，33岁那年，四川小伙刘仁辉从旅游公司辞职，开始在抖音全职做酒
中国教练机，从这里起飞
南昌，人民军队军旗升起的地方，红色是这里最鲜明的底色。从成立之初就与人民军队紧紧
妆食同源活性原料《根皮素白皮书》在上海FBIF 发布
6月26日,《根皮素白皮书》发布会于FBIF2024食品饮料创新论坛期间在上海国家会展中心隆
全国首个数字经济企业出海创新服务基地落地北京大兴
7月3日上午,由全球数字经济大会组委会主办,北京市经济和信息化局、北京市政务服务和数

蚂蚁集团蚁天鉴2.0发布，打造业内首个大模型安全测评智能体和AI鉴真功能

相关阅读

猜你喜欢

热点图片

要闻