Firefly的“进化”速度似乎比想象中更快。
本周一(4月17日),Adobe再次宣布:将对旗下这款当下火爆的生成式AI应用工具Firefly开展一系列升级计划。
Firefly背靠图像及视频生产软件Adobe和人工智能计算公司英伟达。上个月,Adobe首次公布了Firefly。借助这款生成式AI应用,用户可以通过自然语言的提示进行包括音频、视频、插图和3D模型的创建和转换。
除了Firefly,Midjourney与Stable Diffusion最近也动作不断,从这一现象,我们可以瞥见AI绘画正处于爆发式增长的阶段。与此同时,“谁将成为未来行业的主导者?”成为越来越多人关心的话题。未来,三强鼎立、“赢家通吃”的格局能否出现?
01 Firefly升级:进一步降低视频生产门槛,但训练数据受限
Firefly最近的这次升级,Adobe宣布将Firefly接入Creative Cloud视频和音频应用程序。新增功能将在2023年晚些时候加入Firefly的测试版程序。
Adobe表示,新增功能能够帮助专业视频编辑减少他们的繁琐工作,比如,仅使用几个单词就能进行颜色分级、添加音乐和声音效果,以及创建带有动态字体、图像和徽标的标题卡片等。更令人惊喜的是,Firefly甚至承诺:未来将实现“自动将导演脚本转换为分镜头脚本和预览效果”。这一功能如能实现,将极大降低视频创作的门槛,提升一批内容创作者的效能。
不过,Firefly的数据目前只能在有限数量的公共领域图像,或Adobe Stock服务中进行训练,和能够使用庞大的公开数据的Midhourney和Stable Diffusion对比,顿时有些相形见拙。
2022年3月面世的AI绘画工具Midjourney,可以通过在Discord的在线机器人提供绘图功能。用户在Discord服务器上,通过机器人参数进行文字输入进而生成图片。另一款图像生成模型Stable Diffusion,基于Stability AI开源而创建,可以进行图片生成。目前支持在Google的Codelab或者本地部署搭建在webui等生产图片内容。
02 “两强”相争:Stable Diffusion被 Midjourney“ 吊打 ”?
整体来说,这两款应用在功能实现上,可以达到相同的目的,因而形成了直接的竞争关系。但是,如上所述,由于产品的生图方式和扩展性等原因,尤其在版本升级之后,各有偏重。
四月初,Midjourney V5问世,与之对应,其专门的漫画模式Niji也升级到V5版本。升级后,画质的真实性与细节有了质的飞跃。如果操作者的指令足够精准,Midjourney甚至可以模仿任何知名画家、动漫风格生成图片内容,达到以假乱真的效果。
相比于 Midjourney, Stable Diffusion则更依赖其图像模型 。 虽然 Stable Diffusion的模型容量仍然无法与Midjourney相提并论。最新公测的Stable Diffusion XL在关键词的识别度、画质精细度、手部绘制、文字制作等方面比之前版本有了非常大的提升,但经过测试,图片呈现出的实际效果与MidjourneyV5相比,仍存在一定距离。
但也不能因此而下结论:Stable Diffusion被Midjourney“吊打”。实际上,Stable Diffusion的开源环境和可自由定制的模型,同样吸引了众多玩家。相较于Midjourney的一次成像,Stable Diffusion可以在同一个图片里,进行各种细微调整。一些扩展插件也能协助对人物的动作形态进行更加细致的刻画。而且,其直出图片的精细度与质量,也比Midjourney更加高清。
由此可见,虽然它们已经作为人们广为乐谈的AI绘画领域的翘楚,可仍然具备相当的局限性。目前AI绘画领域还存在的并未解决的“通病”是无论使用哪个产品,都无法生成两张一模一样的图片,即使是两张图片已经非常相似,仍然会在细节方面产生差异。
03 未来:“赢家通吃”或不存在,JUNLALA等一批玩家正“逐鹿”
不管是Firefly、Midjourney,还是Stable Diffusion,放在整个AIGC时代的维度来看,他们仍然属于的少数“1%”。实际上,行业里存在几十种顶级图像生成AI,这还不算未公开发布的潜在实力玩家。
对于普通用户而言,与其将焦点集中在三家谁更强或者局部功能优化上,不如从整个行业庞大的“AI图像应用池”来选择适合自己需求的那一款,毕竟,在模型的规模、适用的针对性上,这些应用都有很大差别。毋庸置疑,目前AI图像生成领域的绝对龙头,并未出现。
实际上,生成式AI在图像领域,尚远远不是“赢家通吃”的格局,未来或许也不会出现。
AI技术爆炸式进化的当下,各种应用持续升级新版本,而且每一次都引发了广泛的关注,新功能往往具备一定的颠覆性效果。未来,风起云涌的市场,或许将带来一轮接一轮基于技术驱动的行业格局“洗牌”。
那么,谁将走得更远?
从生成式AI行业发展所处阶段来看,生成式AI大模型已经进入到辅助内容生产的阶段,除了ChatGPT“人机对话”之外,对于图像处理等细分领域需求提升,而且对大算力的要求正在日益严格。
大语言模型的建立是一个在长坡累积厚雪的过程,大算力也有赖于长期积累。作为最早开始关注并长期投入在AI领域的实力玩家之一,JUNLALA在技术层面“埋头苦干”多年后,近期开始活跃在人们的视线中。据了解,过去七年里,JUNLALA致力于AI图像处理技术的钻研,除此之外,其在大语言模型LLM也实现了重大突破。
JUNLALA正在积极拥抱时代变革,正在将精力聚焦为全球客户提供高质量的AI产品和服务之上。未来,和Firefly,Midjourney与Stable Diffusion并肩,在AI技术发展呈现井喷之势的当下,逐鹿AI图像赛道。这个坚持“长期主义”的专业团队,在巨头尚未形成垄断之际投身其中,面对变革、勇于创新,致力于为用户带来不一样的使用体验。
随着JUNLALA等一批科技公司的入局,人工智能技术的应用落地,将在这批坚守“科技向善”的核心价值观的引路人的带领下,为一代人带来专属于AI时代的“创造红利”。