9月5日,2023百度云智大会-智能计算&大模型技术论坛在北京落下帷幕。包括新壹科技CTO张华伟在内的多位大模型生态企业嘉宾齐聚一堂,围绕“大模型发展创新之路”进行了精彩分享。张华伟表示“提升生态效能,是我们做视频大模型的一个初衷”。
2023百度云智大会-智能计算&大模型技术论坛现场
今年7月下旬,新壹科技发布了国内首款聚焦视频领域的人工智能大模型——新壹视频大模型。该模型是以视频生成为核心的AIGC模型,拥有从脚本生成、素材匹配、素材生产、智能剪辑、配音到数字人播报的全流程AI视频生产能力。
据张华伟透露,新壹科技是国内最早一批做生成式视频大模型的企业,2021年团队就启动了这个项目。“我们的核心目标是辅助创作者“降本增效”(快速、高效、低门槛地产出优质内容),这一诉求目前对创作者和平台而言都十分强烈。”
新壹视频大模型是聚焦多模态输入输出视频方向的模型,核心能力在于对视频的理解和生成。从创作者的视角,能够帮助他们快速完成创作打磨、润色文稿及生成视频的一体化流程。
新壹科技CTO张华伟在当天论坛上分享观点
他强调,新壹视频大模型体系下,平台 独创了填空式视频编辑器,这让视频生成使用门槛进一步降低。从PGC、UGC、PUGC时代迈入AIGC时代,虽说AIGC的发展还处于初始阶段,但对用户而言已经极大提升了效率。
当被问及“跨模态大模型当前有哪些技术挑战以及当前的应用效果如何?”张华伟表示,目前阶段已可以帮助用户完整从视频生产到文稿输入到成片的过程,但要做到还原,像真人创作、真人出镜这种效果挑战还是蛮大的,需要整个生态及产业链的共同成长及打磨。
他以新壹视频大模型举例,虽然聚焦视频生成垂直场景,但其针对不同行业不同方向内容,诸如像营销行业、金融保险、知识类价值输出等每个领域都需要定制化文本训练、模型训练,甚至对每个领域做定向调优,达到符合这个领域特点的效果……当中挑战也是蛮大的,需要投入大量资源进行磨合,也包括时间和算力成本的大量投入。