春节期间横空出世的Sora,引爆了人们关于通用型人工智能的大讨论。在Sora强大的视频生成能力背后,是相比文生文,文生视频更广阔的应用场景,以及给视频产业带来的变革,而在国内真正可以吃到“Sora红利”的或许是视频产业链上下游,以及早已出发的视频大模型玩家。
在AGI视频生成领域,Sora并非孤军奋战。1 月 2 日,以文生图工具闻名的 Midjourney 宣布在未来几个月加快训练文生视频模型;1 月 23 日,谷歌推出了文生视频模型 Lumiere;Runway 的文生视频模型 Gen-2 在 2023 年年末完成了一次重要更新,大幅度提升视频生成质量。
2024年,视频大模型赛道无疑会更加热闹,去年ChatGPT掀起的“百模大战”主战场或将来到视频生成领域。在美国视频大模型风起云涌时,中国似乎也并未缺席。
此前业界盛传,字节跳动将推出首个中文版Sora,不过随即被官方否认。当前,字节已有文生视频大模型项目在研发中,目前已公开的项目是“Boximator”,定位为创新性视频生成大模型。
不过,技术的颠覆从不遵循论资排辈的逻辑,如果字节未能抓住AGI浪潮,“颠覆者”随时可能出现。
另一个视频AIGC的重磅玩家是新壹科技,前身是曾打造秒拍、小咖秀和一直播的国民级短视频直播应用的一下科技。2023年7月,新壹科技推出了国内首款聚焦视频领域的大模型,公开信息显示,其基于视频大模型的平台及服务,已在保险金融、数字政务、传媒营销等多个垂直场景实现商业化落地,服务B端和C端用户。
值得关注的是,其旗下定位于智能内容辅助创作平台的一帧秒创,致力于为用户提供全流程AI生成视频服务,通过对文案素材、AI语音、字幕等进行智能分析解构,助力创作者快速成片,零门槛产出视频,目前已拥有超300万用户,每天产出数十万分钟AI视频。
随着Runway、Sora在内的产品给AI生成视频素材带来质和量的提升,这类定位于整合前沿AIGC技术,提供“傻瓜式”解决方案的平台,或许更符合国情选择。
在新壹科技CEO雷涛看来,Sora取得的技术新突破给未来视频行业创造的更多是机遇,比如Sora的文本到视频生成能力进一步降低了个性化视频定制门槛,像企业营销视频、企业宣传片、教育培训、微短剧,甚至个人娱乐领域,用户都可以根据自身需求,通过文本描述进行视频内容个人定制。同时,Sora能极大地激发视频内容的创新,打破传统视频制作的限制,推动视频内容向更多元化、个性化的方向发展。
实际上,场景落地正是中国视频大模型厂商的最大优势。中国本土科技企业一直都很接地气,善于洞察用户需求进行产品落地,在互联网应用层出现小程序、移动支付、共享单车、共享充电宝、短视频、直播带货等创新应用足以说明这一点。
或许,相较于打造“中国版Sora”而言,基于Sora背后的AGI能力,打造To C、To B的创新应用,将是中国科技公司特别是视频大模型公司更实际的机会。