近日,国产大模型在AI视频生成领域取得了令人瞩目的进展。4月27日,生数科技联合清华大学在中关村论坛未来人工智能先锋论坛上发布了中国首个Sora级别的视频大模型Vidu,引发市场热议。4月28日,AIGC软件A股上市公司万兴科技(300624.SZ)宣布其国内首个音视频多媒体大模型万兴“天幕”正式公测,受到市场广泛关注。
公开信息显示,Vidu采用了Diffusion与Transformer融合的U-ViT架构,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界,还拥有丰富的想象力,具备多镜头生成、时空一致性高等特性。从演示视频中可以看出,Vidu视频生成的效果达到了较高水平,例如在生成的游泳的柯基视频中,Vidu对柯基游泳时腿上毛发漂浮的细节处理得较为精细。
而在4月28日举办的万兴天幕大模型公测体验暨「AI重塑视频创作」创新论坛上,万兴科技已宣布正式逐步向公众开放的万兴“天幕”,并将向部分第三方开放API接口。据现场体验过的参与者反馈,效果也令人满意。
有参与现场体验的创作者认为,从业者正迫切追求文生视频能力,万兴“天幕”能通过简洁的文字描述生成富有创意的视频内容,提升创作效率并降低成本,对视频制作、电影制作和广告业等市场带来全新推动力。同时,营销行业的体验者看好万兴“天幕”的多媒体内容生成能力,认为天幕将成为“一站式”AI内容生成平台,简化工作流程,提升创作效率和创意表达力。
据了解,万兴“天幕”是国内首个专注于数字创意领域的音视频多媒体大模型,依托15亿用户行为数据和百亿本土化音视频数据,采用先进的音视频生成式AI技术,为全球创作者提供全链路的创作支持。该模型已通过中央网信办备案,具备近百项音视频原子能力,并已在旗下产品如Wondershare Filmora、Wondershare Virbo中实现规模化商用,其中文生视频能力实现不同风格、丰富场景及主题的连贯性,一键生成时长率先支持60秒+。
(万兴“天幕”文生视频《男孩的探险之行》)
从Sora到万兴“天幕”、Vidu,AI大模型正在加速推动音视频领域的技术变革。据Gartner研究预测,到2030年,90%的数字内容都将是AI生成,预计2032年,全球AIGC市场规模有望达1.3万亿美元。此外,目前全世界有3.05亿视频创作者,43亿视频覆盖群体,每天200亿次以上的视频播放量,音视频领域的市场潜力巨大。
当前,随着全球AI领域企业的财报密集发布,前瞻布局的企业正在广阔市场的带动下,迎来业绩加速释放的新时期。例如,微软第三财季报告显示,微软云Azure的收入增长达到31%,其中人工智能增长7个百分点。
国内,万兴科技2023年财报显示,公司全年实现营业收入14.81亿元,同比增长25.49%;归母净利润8620.57万元,同比增长113.20%,扣非净利润8968.31万元,同比大增817.45%。公司投入研发费用4.03亿元,加速AI技术研发、产品功能创新、产品矩阵扩张,借力先进AI技术打造多元化的创意软件产品与服务。
此外,美图公司发布的2023年财报显示,2023年总收入27亿元,净利润3.7亿元。财报中特别强调,收入和利润的双增长得益于AI的推动。其中,AI驱动下2023年美图公司影像与设计产品业务全年收入13.3亿元,同比增长52.8%。目前,美图用户每天处理数亿份图片和视频,约83%都用到了泛AI功能。