第四范式斩获CVPR 2023挑战赛世界冠军 核心技术已应用于「式说」大模型

2023-06-29 14:03:05     来源:

在刚刚结束的计算机视觉与模式识别国际会议CVPR 2023中,第四范式联合南京大学、威斯康星大学麦迪逊分校联合团队斩获了由CVPR举办的EPIC-KITCHENS-100系列赛Action Detection赛道冠军。

由IEEE举办的学术性会议CVPR,是全球人工智能计算机视觉领域三大顶级会议之一,被誉为衡量业界科研水准的标杆。该会议旨在研究、探讨全球最前沿的人工智能科学技术,并举办知名国际赛事吸引全球顶尖人工智能团队竞相角逐。

今年的EPIC-KITCHENS-100系列赛相较于往年,任务难度更大,更为考验参赛团队在AI视频理解的创新与研发能力。其以数据集规模大、场景真、标签全著称,成为众多科技巨头、高校和科研机构实验技术成色的试金石。与先前的第三人称视角数据集只需要预测动作标签不同,EPIC-KITCHENS-100是专注于第一人称视角的厨房场景视频数据集,每个行为片段由动作和物体两个部分组成,涵盖了89977个动作,97个动词类别,300个名词类别,因更贴近人类的视觉感知与真实生活场景,具有广泛的研究与应用场景。

Action Detection又被称为行为检测,该赛道不仅识别给定视频中包含的所有行为类别,还要精准定位行为的起止时间,且数据集中包含了丰富的日常动作和短动作,对于算法的准确性和鲁棒性提出了更高的要求。此次,联合团队以独创的业界首个基于Transformer的单阶段 anchor-free 行为检测器——ActionFormer为基础,利用经过InternVideo预训练的VideoMAE模型作为骨干网络,获取了更好的特征表示。此外,联合团队微调了专门针对动作的骨干网络以提取动作信息的特征,以及针对物体的骨干网络以提取物体特征,显著提升了行为检测器的准确性,解决了第一人称视角下模型对动作和物体判断冲突等问题。最终,联合团队以领先第二名33%、第三名48%的绝对优势夺得冠军。

目前,用于此次比赛的核心技术已在第四范式「式说」大模型中应用,其视频理解能力已广泛应用于违规操作识别、安全生产监测、手术智能分析、运动分析等领域。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

海马云加入中国移动元宇宙产业联盟,积极参与算力网络建设
东方国信携5G移动产品亮相2023上海MWC世界移动通信大会
升级应用开发技能培训,谷歌网易携手带来全新数字人才培养计划
坚定与用户同行 日立中央空调打造品质用户生态体验
厄尔尼诺再度来袭,极端天气下墨迹天气彰显智慧气象能力
数实融合 智引润州——2023阿里云创峰会暨长三角(镇江)数字经济高峰论坛在润州区举办
参赛企业各显神通秀实力,首届“格物杯”联通物联网应用创新大赛初赛角逐激烈
亚马逊广告亮相戛纳国际创意节,探讨全球营销趋势变革
北京电信汇聚“云网算一体”澎湃动能 助力首都打造全球数字经济标杆城市
海马云批量部署海外节点,加速未来数字世界构建
特斯联与港科大(广州)联合研究中心正式成立 人才战略再升级
TiDB x Catalyst丨秒级洞悉数据价值,TiDB 帮助“客户成功 SaaS 厂商”提升用户体验
锐珂医疗荣膺通用X射线机最佳客户满意度奖
是时候了!MySQL 5.7 的下一站,不如试试 TiDB?
连续7年领跑中国桌面云市场 华为云的底气在哪儿?
2023MWC上海展今日开幕,思特奇与您开启数智融合新时代
王绍华:引领兽药营销创新的专家
农牧人商城引入贵州特产刺梨原浆,为消费者带来品质与健康并存的新选择
松下新风系统来袭!高效率、易操控,清新四季轻松即达
峰米投影出席首届CIC中国智慧生活大会 推动智能投影行业变革创新
创壹科技2023夏季产品发布会成功举办!
警企协同,创新方式:“Soul星反诈课堂”开课,只为“天下无诈”
若返NPC元气因复合配方,焕活机体年轻态
湖州中关村信息谷双创课堂预告: 大学生创业要度过的几个坑
智能化运营体系助力效率蝶变,江西华为云携手南昌海洋塑胶探索数字化新模式
浩鲸科技精彩参展2023上海世界移动通信大会
TimeShop倍他强,激发持久活力,助力男性健康!
Time Shop虾青素多维养护,让双眸焕发光彩!
TIMESHOP倍他强,久坐救星,解决“男题”困扰
ERS electronic在上海成立实验室,以扩大其在中国的规模