NVIDIA Edify 解密 — 一种帮助开发者创建自定义模型的技术,这些模型可基于其数据进行训练

2024-08-17 11:44:08     来源:

Generative AI by iStock 为工作室和创作者提供了图像生成和修改工具。

编者注:本文属于《解码 AI》系列栏目,该系列的目的是让技术更加简单易懂,从而解密 AI,同时向 NVIDIA RTX PC 和工作站用户展示全新硬件、软件、工具和加速特性。

内容生成器 — 无论是生成语言、2D 图像、3D 模型还是视频 — 为创意社区提供了各种工具,可更快将想象变为现实。

为帮助开发者构建这些新型生成式 AI 工具,NVIDIA 建立了 NVIDIA AI Foundry。它有助于公司使用 NVIDIA Edify 基于自己的已授权数据训练生成式 AI 模型。Edify 是一种多模态 AI 结构,可使用简单的文本提示生成图像、视频、3D 素材、360 度高动态范围成像和基于物理性质的渲染 (PBR) 材质。使用 AI Foundry,公司可以训练定制 AI 模型来生成上述任何素材。

https://images.nvidia.cn/cn/youtube-replicates/cv_ozHmdoms.mp4

Edify 的关键优势包括能够生成多种类型的内容、其卓越的训练效率 (这便于它在基于更少的图像进行训练时生成高质量内容),及其调优模型以进行风格匹配或学习字符或对象的能力。

https://images.nvidia.cn/cn/youtube-replicates/F_dSq1IT6ws.mp4

基于 NVIDIA AI Foundry 和 Edify 构建的服务范例之一为 Generative AI by Getty Images,一种可商用的生成式摄影服务。组合使用 AI Foundry 与 Edify,用户可以控制他们的训练数据集,从而创建符合其需求的模型。

为避免版权问题,Getty Images 使用 Edify 基于自己的已授权内容对该服务进行了训练,以确保数据集中不存在知名人物或产品。该公司还与贡献者分享部分利润,为对该模型做出贡献的创作者创造了新的收入来源。

使用 Edify 生成资产

可以对 Edify 进行训练,以生成各种图像类型,包括图像、3D 素材和 360 度 HDRi 环境光贴图。

Edify Image 可在约六秒内生成四张高质量 1K 图像,性能比之前的模型提高一倍。还可以通过生成式放大器添加其他细节,将图像转换为 4K 格式。

Getty Images 4K 图像生成使用安全商用创意库在 NVIDIA Edify 上进行训练。

得益于高级提示依从性,图像实现了高度可控,摄像头控制可指定焦距或场景深度,同时 ControlNets 将指导生成。ControlNets 包括 Sketch 和 Depth,前者允许用户提供要依从的草图或复制图像的构图,后者用于复制图像的构图。

也可以使用 Edify Image 来编辑图像。InPaint 允许用户在图像中添加或修改内容。Replace — 一个严格 InPaint — 可以更改衣服等细节。并且 OutPaint 可以扩大图像以匹配不同的宽高比。所有这些操作都可通过 Segment 进行简化,这是一项只需要一条文本提示即可遮罩对象的功能。

Edify 还可以创建艺术家级别的 3D 网格。这些网格采用基于四边形的清晰拓扑、高达 4K 的 PBR 材质和自动 UV 展开,便于更轻松地进行纹理编辑。快速预览模式可在短短 10 秒内提供结果,然后将其转换为完整的 3D 网格。

这类网格非常适合原型设计场景、为布景生成背景对象,或作为 3D 雕刻的开端。

Edify 360 HDRi 将生成自然景观环境图,可将其用于场景照明、反射甚至作为背景。该模型可根据文本或图像提示生成高达 16K 的 HDRi 图像。获得所需背板后,用户就可以创建自定义 HDRi 来进行匹配,而不必花费数小时寻找。

根据文本提示生成高动态范围 360 度全景图。

多模态功能为 Edify 所独有,能够实现组合不同素材类型的高级工作流。例如,与智能体结合使用时,Edify 允许用户在几分钟内使用简单的文本提示进行完整场景原型设计 — 就像在 NVIDIA 研究团队 SIGGRAPH 演示中那样,该演示展示了由 NVIDIA Edify 提供支持的模型和 NVIDIA Omniverse 平台的辅助性 3D 世界构建功能。

https://images.nvidia.cn/cn/youtube-replicates/AJWTUvXA0Wc.mp4

另一个用例是将 Edify 3D 和 360 HDRi 与 Image 结合起来使用,以便用户完全控制图像生成过程。通过以 3D 格式生成场景,艺术家可以四处移动物体并设定他们想要的镜头,然后使用 Edify Image 将原型转化为逼真的图像。

https://images.nvidia.cn/cn/youtube-replicates/g8AwMCLP6ws.mp4

Generative AI by Getty Images

Getty Images 是创意视觉效果、编辑摄影、视频和音乐领域的大型内容服务提供商和供应商之一,也是人们最初搜寻、购买和分享来自世界上的优秀摄影师和录像师的精彩视觉内容的地方之一。

Getty Images 使用 NVIDIA AI Foundry 来训练 NVIDIA Edify Image 模型,以支持其生成式 AI 服务。该服务通过面向企业的 Generative AI by Getty Images 以及面向小型企业和业余创作者的 Generative AI by iStock 提供,允许用户使用由 NVIDIA Edify 提供支持的模型来生成和修改图像。

Generative AI by Getty Images(或 iStock)提供了一系列已授权内容。

Getty Images 和 iStock 最近已更新到最新版本的 Edify Image,以便更快生成内容,实现更高的提示依从性并公布摄像头控制。

已更新 Generative AI by Getty Images 中的摄像头控制。

用户现在还可以在预拍创意内容时使用生成式 AI 工具,这便于他们编辑和修改 iStock 的视觉效果库,以快速迭代和美化内容。这些相同的功能将于不久后在 Gettyimages.com 上发布。

请在 ai.nvidia.com 上试用 Generative AI by Getty Images。

请订阅《解码 AI》时事通讯,我们每周都会将新鲜资讯直接投递到您的收件箱。

###

 

标签:

猜你喜欢

鱼耳APP跨次元联名《狐妖小红娘》 引领语音行业跨界联名新风潮
南方石化集团有限公司召开2024年“八一”建军节座谈会
《代号鸢》:一部被误解的乱世女性成长诗
万兴科技旗下亿图图示V14发布 上线个性化模板推荐系统及1400+贴纸资源
胡润百富高净值人群睡眠最佳解决方案揭晓:HEKA AI床垫引领智能睡眠革命
恒友汇《2024下半年宏观经济展望及资产配置策略指引》重磅发布
速来!玄瞳上新「智慧100v9.1.1」
IDC 报告:SmartX、安超云、青云,位列中国超融合软件市场前三
模块革新潮丨引领新个护,2024宇凡微模块新品发布会
KIDNOW凯蒂诺风靡海外,脂质体谷胱甘肽小白片受追捧
苹果进入AI时代,果粉要换新手机了?
一站服务,心系患者|2024帕金森病专科中心建设经验分享 及学术交流会(重庆)成功举办
中国电力发展促进会电力电子器件专业委员会成立大会在宁召开
「楼下超好逛」8月17日起,来春熙路探秘成都人的city生活
地址数据科技:创新引领,解决“送达难”难题
热门剧集,为何频频遭遇“黑手”?
20家500强头部汽车企业使用越疆机器人铸就高端品质!覆盖5大核心生产工艺
真诚服务致敬150年工匠精神|2024威能服务技能大赛 总决赛收官
为患者提供更舒适体验 时代天使持续升级矫治器激光切割技术
“上海之夏”消费火爆,上海抖音团购消费环比增长92%
《代号鸢》:一部被误解的乱世女性成长诗
泰国数字经济部首次公开解读“Cloud First”战略,领军企业纷纷选择华为云
筑牢国产化算力底座,天翼云为数字政府建设保驾护航
搭载创新AI的掌中宝盒 三星Galaxy Z Flip6吸引女性用户有心得
大数据“实时湖仓”技术未来五年将大爆发,腾讯云为该领域“领导者”
自在一夏,乐在云端,华为云空间家人共享加赠使用时长
文远知行受华夏时报记者专访,澄清公司核心业务方向
华为:fgOTN,构建新型电力系统新质生产力
关注气象敏感行业,墨迹天气帮助物流、航空企业智慧防汛
感恩回馈进行时,升级HarmonyOS NEXT Beta版有机会获得超值好礼!