生成式人工智能(AIGC)的蓬勃发展被认为是一场不可逆转的技术革命,为千行百业开启了崭新的想象空间。今年,人工智能文生视频大模型Sora的出现又引发大家对大模型变革的思考,技术的日新月异会给金融行业带来什么?
马上消费金融人工智能研究院相关负责人介绍,从画面上来看,Sora的效果细腻度和连续性远超Pika、Runway等知名同类产品,它有一条创新的技术思路。之前的视频生成产品用的都是扩散模型,而Sora是把大语言模型和扩散模型结合在一起,提出了一个“世界模拟器”的概念。Sora理解了人类语言的基础之后,模拟了我们这个世界的模型,了解了我们这个世界的知识,从而使得大语言模型和扩散模型结合在一起,能够模拟物理世界的物理定律。比如,在Sora生成视频里,它能像人一样理解纸飞机碰到树会掉下来,汉堡被人咬了一口会剩下半个汉堡。
Sora将大大加快AGI(通用人工智能)的进程。OpenAI训练Sora应该会利用多模态的能力来理解和压缩海量的视频,多模态的能力和大语言模型能力相结合,它对视频的理解就不仅仅是一些画面的叠加。马上消费金融观察,Sora在模型训练中,“观看”并“理解”了所有的互联网视频和电影。一幅图胜过千言万语,而视频传递的信息量远远超过一幅图,所以Sora训练需要的算力规模以及它内部压缩的知识量应该会远远超过GPT-4。
Sora大幅提高生成视频的质量,在金融业务上可以降低营销、培训视频的生成成本。Sora还能驱动数字技术的更新换代,带来更好的客户体验,为全行业带来降本增效的效果。
更重要的是,我们在金融市场更要学习的是Sora这种深入研发、深入应用的决心和勇气。Sora的成功不仅是技术的成功,也是一种创新思维的成功。它告诉我们自然语言指令标注和有业务属性的优质数据之间的有机结合,能够打通各类客户交互和业务需求的联系,对金融业务和场景进行全面的模拟,产生新的智能产品和新的智能场景,在通用人工智能的道路上走得更远。
行业大模型并非单纯追求技术突破,而是顺应各行各业的特性,积极探索成本效益的最佳优化方案。马上消费金融对技术的探索要聚焦于解决具体问题,通过技术创新突破场景困境,正是这种实践将赋予大模型在金融行业未来无限的可能。