智象未来团队研发成果获ICML 2025收录!图像生成更有“全局视野”

2025-05-23 11:48:11     来源:

智象未来团队提出全新层级自回归生成范式 Hierarchical Masked Autoregressive models (Hi-MAR),有效解决自回归图像生成中结构失真问题。该研究已被 ICML 2025 收录,并在多个图像生成任务中取得领先性能。

现有自回归图像生成模型存在缺乏全局结构建模能力、训练-推理分布不一致、尺度引导缺失等问题。Hi - MAR 借鉴人类绘画过程,采用自顶向下层次化生成范式,还引入多尺度联合训练策略等。实验显示,其在图像质量和语义一致性上优于主流方法,可以显著提升模型的全局感知能力与生成质量。

本次发表的论文《Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots》,展示了团队在多模态生成式基础架构设计领域的前沿探索。这一全新的层级自回归生成架构 Hi-MAR,为构建具备“全局感知+局部细化”能力的生成基础架构提供了新的范式,同时它也是HiDream系列开源模型家族重要的一员,为下一代多模态生成式基础架构的技术演进带来更多的可能性!

 

标签:

猜你喜欢

园区网络难不难,华为F5G-A有新招
逐马计划兰州站最强攻略!你想知道的都在这里
轻薄机身尽享旗舰体验 三星Galaxy S25 Edge全渠道开售
以“和韵交响”斩获iF大奖:搭载音画双芯的东芝电视Z970QF重新定义高端电视美学
三星AI神 黑钻热泵洗烘旗舰:一机满足全家的高效、便捷、健康洗烘
科大讯飞携全场景翻译产品方案亮相第十一届亚太翻译论坛,用AI让沟通无障碍
AI双引擎驱动全球贸易!百度爱采购携生态联盟为义乌商家插上“数字翅膀”
NAV“内卷”新战场:谁告警更少,看得更清?
“数智共进,共赢无限”2025施耐德电气工业新生态伙伴峰会成功召开
用企业微信加客户方式汇总,如何设置企业微信让销售丝滑加好友,获客自动化提高好友通过率?
马栏山音视频实验室全国产车载音频等成果亮相深圳文博会
声网蝉联PAGC金帆奖优秀出海产品技术服务奖项
行业调研:2024年新能源城市NOA搭载智驾地图已超70万
蚂蚁集团数字蚂力与珀莱雅达成战略合作:AI赋能美妆,提升消费者体验和企业竞争力
AI版office来了!deep research的内容质量+通用agent的多模态输出,你心动了吗?
酒店自助机如何解决酒店运营痛点?鹿马(LUMOUS)来解答
端午限定!硬笔书法名师王慧志线下沙龙开启,1 对 1 指导机会难得!
华图教育科技:在 AI 领域走“效率替代+体验升级”的发展路线
以光惠算,一场围绕园区网的“生产力”革命
无光,不AI,如何抓住F5G-A万兆全光园区的百亿商机?
至像打印全面接入为鸿蒙操作系统 携手华为共建智能办公新生态
2025京东净饮水行业峰会在京举行 多方共话高质量发展
Soul APP创始人张璐团队以科技创新推动无障碍社交,构建普惠数字空间
岂止纤薄 三星Galaxy S25 Edge带来毫不妥协的轻薄旗舰体验
2025长三角(芜湖)算力算法创新应用大赛正式启动,聚焦“算力+产业”融合新实践
热烈欢迎杭州市上城区副区长陈安一行到访心言集团
技术创新碳减排 助力双碳促发展
FlexEnable FlexiOM™ 有机薄膜晶体管材料荣获 信息显示学会颁发“2025 年度最佳显示组件奖”
MediaComm美凯亮相2025中国石油石化企业信息技术交流大会
数百个鸿蒙应用集中上新,共迎华为nova 14系列首销