专家论道大模型 | 资源受限下 ,“白泽”有何秘籍?

2023-03-21 19:33:21     来源:

3月21日,机器之心在北京举办ChatGPT 及大模型技术大会。大会围绕研究、开发、落地应用三个角度,邀请了大模型领域的知名学者、业界顶级专家共谈大模型及中国版 ChatGPT的未来。

人民中科创始人、中科院自动化所模式识别国家重点实验室研究员、博导李兵受邀出席,做了“白泽”—— 面向数字发现的跨模态基础模型探索为主题的演讲。

李兵博士,人民中科创始人、中科院自动化所模式识别国家重点实验室研究员、博导,国家优青,北京市杰青,中科院 “青年学习标兵”,科技部 “新一代人工智能” 重大项目负责人,国家自然科学基金重点项目负责人。

长期从事人工智能、跨模态内容理解与安全方向的研究,在包括 IEEE TPAMI 等人工智能权威国际期刊和会议上发表论文 100 余篇,曾获国家自然科学二等奖、中国自动化学会技术发明一等奖。

在 ChatGPT 引爆科技领域之后,时隔不到四个月,OpenAI 又出大招,重磅推出多模态预训练大模型 GPT-4,号称史上最先进的 AI 系统!微软更是将 GPT-4 全面接入 Office 全家桶,人人都可以用人工智能自动生成文档、电子邮件、演示文稿。

其实不管是 ChatGPT ,还是 GPT-4,其背后都依赖大模型。ChatGPT的巨大成功要归功于长久以来业界对大模型发展的重视。短短几年,AI 模型的参数量已经从最初的数亿扩张到千亿,甚至万亿规模。

从技术上讲,ChatGPT是一个出色的NLP(Natural LanguageProcessing,自然语言处理)新模型。如今大火的ChatGPT,得益于AIGC背后的关键技术NLP得到突破。NLP赋予了AI理解和生成能力,大规模预训练模型也是NLP的发展趋势。

预训练大模型是面向通用智能最高阶的探索,也是AI持续变革的核心发展方向与动力。而随着 GPT 技术的快速发展,尤其 ChatGPT 展现出来的出众的智能能力,传统的 AI 研究范式已经被打破。与此同时,面向未来 Web3.0 环境下海量的多源异构的泛视频数据,传统基于单模态内容理解已无法满足高语义级别的内容理解与线索发现。

多模态是未来人工智能应用发展的方向。从多模态到跨模态,作为人民中科创始人,李兵带领的团队坚持多模态和跨模态基础研究20余年,人民中科的核心产品——“白泽”核心技术就是跨模态预训练大模型。

“白泽”可跨越文字、语音、视频等多模态内容的语义鸿沟,自动关联多模态间关键要素。可跨模态实现文本搜图片、文本搜视频、图片搜视频、视频搜视频、图片搜文字、视频搜文字等功能,是探索数字世界的重要工具。

值得一提的是,从“雨燕”智能计算加速卡,到“白泽”跨模态智能引擎,人民网内容风控大脑全部技术组件实现了整体国产化,形成了涵盖内容风控,内容聚发,版权保护等新领域、新应用软硬件技术架构。

从产业价值的角度来看,预训练大模型带来了一系列可能性,让产学研各界看到了由弱人工智能走向强人工智能,走向工业化、集成化智能化的路径。在这样的驱动背景下,大模型也会有一些可预见的趋势与发展。

人民中科跨模态技术手段,能通过中小模型解决以前需要上百个模型才能解决的问题,同时跨模态技术的算力和应用的投入是非线性的,可以大幅减少算力消耗。

在受限资源下的基础大模型探索,“白泽”是如何做到的?

比如,“白泽”大模型前端提速——基于压缩域视频内容理解

人民中科-中科院自动化所团队联合推出了面向高通量小样本条件下的基于压缩域视频识别新方法,相关成果已被人工智能国际权威学术会议IJCAI2022接受。此方法对昔日人海战术的视频标签,分类,审核是一项重要的技术突破。

基于该成果,将极大地提高“白泽”对海量视频数据的识别效率,以及提升其对小样本视频的识别性能。

比如,“白泽”——教导主任指导下的大模型蒸馏压缩一体化

面对越来越深的深度学习模型和海量的视频大数据,人工智能算法对计算资源的依赖越来越高。为了有效提升深度模型的性能和效率,通过探索模型的可蒸馏性和可稀疏性,人民中科和中科院自动化所联合研究团队提出了一种基于“教导主任 - 教师 - 学生” 模式的统一的模型压缩技术。

基于该项研究成果,“白泽”能够在保证算法性能的情况下,将模型大小进行大规模压缩,从而实现高通量低功耗的跨模态智能理解和搜索能力。根据初步的实际应用情况来看,该项技术能够将大模型的参数规模压缩平均四倍以上。一方面能够极大降低模型对 GPU 服务器等高性能计算资源的消耗,另一方面能够将无法在边缘端部署的大模型经过蒸馏压缩后实现边缘端的低功耗部署。

让机器理解视频,提升数字世界透明度。人民中科拥有世界领先的内容理解技术和视频搜索能力,希望能在数字世界急剧膨胀、安全形势严峻的大背景下,为市场提供高智能、低成本的内容发现和管理服务,为社会治理、政务服务、教育金融、消费娱乐等领域提供技术支撑。

“道路对了,不怕遥远!”未来,人民中科将继续深耕内容安全领域,将人工智能前沿技术与市场需求融合,形成低成本、高效率、自主可控的产品体系,帮助企业降低AI应用门槛。同时,不断升级产品和服务,护航政府、企业、机构内容安全,为网络强国建设作贡献。

 

标签:

猜你喜欢

让云上办公更流畅!国内最大天翼云电脑资源池一期资源完成交付
法国“欧葆庭”来华10周年, “果拾累累,未来可柒”
出门从来不带钥匙!陕西这个地方的居民为啥能这么“大胆”?
中南大学杨雨教授:短视频拉近了诗词与日常生活的距离
哈趣投影引领单片式LCD行业持续发展,成为首个启用中国CVIA亮度标准品牌
美国NBC电视台推荐:追觅扫地机、洗地机成北美“春季大扫除”热门产品
超120家国内外顶级工业品牌已加入,2023天猫工业品峰会等你来
入围婴幼儿dha十大牌子排行榜,澳乐乳dha双植物配方获家长认可
入围婴幼儿dha十大牌子排行榜,澳乐乳dha双植物配方获家长认可
飞凡汽车成功上线RISE with SAP
2亿像素领衔 三星Galaxy S23 Ultra掀移动影像新浪潮
提升专业水平,西通TIGTAK将在全国召开系列隐形矫正培训会议
永中软件亮相2023浙江数字教育装备应用展,提速教育数智化改造
锚定建设数字中国新坐标,博彦科技发力中小银行数字化转型
龙华区创新创业孵化基地—英才港启动仪式圆满成功
徕芬科技专注高速吹风机领域
2023政务V影响力峰会|微博CEO王高飞:共担时代责任、共创全媒格局、共益未来征程
升维影像体验 三星Galaxy S23系列持续热销
销售榜首火爆单品,美的星光科技版风管机强势来袭
释放数字技术生产力——华为云联合云学堂举办CXO云上创新私享会
第九届深宠展,petgugu将携金奖宠物智能产品亮相
壁纸电视普及风暴来袭 用正确方式打开创维408全球电视节
百度文库接入文心一言,国内首个生成式AI文档服务即将上线
乐视再添一大女主戏 新谍战剧《蝶影》今日开播冯越魏大勋领衔主演
多点Dmall助推实体零售全面数字化,再造模式与价值
中国制造网超级出海季:积极迎战外贸旺季
思享无限荣获浙江省首批数字文化企业梯度培育领军企业
​讯飞听见全栈产品亮相广东省500强及上市公司CIO大会
技术革新 场景丰富——虚拟数字人蓄势待发,金融数字化空间巨大
赏花海 拍大片 与三星Galaxy Z Fold4共赴春天之约