智象未来发布全新自回归图像编辑框架 VAREdit ,0.7 秒完成高保真图像编辑

2025-08-25 14:40:59     来源:

近日,智象未来团队正式推出全新自回归图像编辑框架 VAREdit,作为全球首个纯自回归的图像编辑模型,这也是该领域的又一重大突破。该框架不仅能够精准执行用户指令,避免过度修改,还将编辑速度提升至0.7秒级,为实时交互与高效创作开辟新路径。

长期以来,扩散模型在图像编辑中虽能生成高质量画面,但存在局部修改牵动整体结构、编辑不够精准,以及多步迭代效率低等瓶颈。针对这一问题,VAREdit首次将视觉自回归(VAR)架构引入图像编辑任务。它将编辑定义为“下一尺度预测”,逐层生成多尺度残差特征,实现局部精准修改与整体结构保持的统一。同时,团队创新设计了尺度对齐参考(SAR)模块,有效解决尺度匹配难题,进一步提升编辑质量与效率。

在权威基准 EMU-Edit 与 PIE-Bench 测试中,VAREdit在CLIP与GPT等指标全面领先。其中,VAREdit-8.4B在GPT-Balance指标上较ICEdit和UltraEdit分别提升41.5%和30.8%;轻量版VAREdit-2.2B可在0.7秒内完成512×512图像高保真编辑,实现数倍提速。

目前,VAREdit已在 GitHub 和 Hugging Face 平台全面开源。智象未来团队表示,未来将持续探索视频编辑、多模态生成等应用场景,推动AI图像编辑迈入高效、可控、实时的新纪元。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

崖山数据库系统通过安全可靠测评!
全AI制作短剧剧集《白月城·诡市迷雾》登陆爱奇艺 开启异世诡市迷雾之旅
AI收入超120%增长凸显强势AI竞争力 金山云有望成为翻倍黑马
麋鹿回归40载,麋鹿IP系列一“鹿”锦绣隆重登场
云鲸活水履带洗地机器人J6系列全新上市,重新定义中端旗舰标杆
首发!企业盒子AI节能大模型×物联中台: 构建智慧建筑能效管理新范式
第二届脑机接口(技术)开发者大会在成都举办!
百元价位 千元体验,骁骑X7“墩墩椅”,新品首发!
新质生产力视角下:AI测试如何重构数字时代质量竞争格局
2025 亚洲科隆游戏展移师曼谷,迈达斯 Midas Labs 官宣成主要赞助商​
不是外卖,是“团购+”:抖音“随心团”的增量玩法
橙星云机构版|高效、精准、低成本,数据驱动的心理健康管理系统|心理SaaS平台
逆水寒x小红书搭台“逆的穿搭局”,解锁游戏穿搭新范式
东软与武汉大学中南医院签订战略合作协议
从炒菜机器人到共享中央厨房,平谷加力布局食品营养新赛道
中化化工事业部与顶世智汇深化战略合作,共启卓越运营新篇章
Soul 利用AI技术反诈,保护年轻人社交安全
苏焱电子再度完成数千万元Pre-A轮融资,厚膜加热技术引领新能源车热管理升级
搭载量达成百万里程碑!华为乾崑正书写汽车产业下半场的新规则
抖音电商升级服务体验生态,携手商家持续保障消费者权益
京东全球独家首发鸿蒙智选MEIPONT智能空调 下单享多重新品权益
“识别准确又安全”的小艺输入法联名热门IP,定制皮肤全新上线!
问道未有穷期 星海即是归途 | 2025百度商业AI技术创新大赛圆满收官
德国雷根斯堡应用科学大学教授Thomas Linner来蔚建学术交流
共谋病理科数智化转型之路,瑞金医院成功举办数智化病理科建设研讨会
金i奖揭晓,途鸽科技荣获“2025AI赋能全球互联突出贡献奖”
小布AI如何成为工程项目的智慧鹰眼
从《王者荣耀世界》亮相科隆看中国游戏出海:文化差异成独特吸引力
中央空调寒冬破局者,美的领航者IV为何改写十万级别高端市场?
2025全球智慧教育大会在京召开 睿辅AI创始人吴海明分享AI老师的训练之路