傅盛谈Sora:基于大语言模型引领视频制作新纪元

2024-02-23 14:14:02     来源:

2月21日晚上,傅盛在混沌学园直播间,围绕Sora的话题和混沌学园课程主任韩笑展开了一场深度对谈。

以下直播文字梳理由傅盛的团队小伙伴用两个不同的AI工具完成,你们觉得哪个版本更好?

AI工具1生成的笔记

1、Sora的突破性进展让人们感到震撼,超出了大多数人的认知,也为更多创新铺平了道路。

2、Sora在产品层面上是划时代的,但从技术角度来看,对于物理世界的完美模拟还有一定距离。

3、关于AI对物理世界的理解,是一个哲学问题而非科学问题。AI生成的视频表现出了对光影、阴影等物理概念的理解,但与大型语言模型相比,视频引擎对物理世界的理解还有很大差距。

4、AGI在某种意义上将变得更加强大,其基础能力已经在今天开始显现,填补了视频、物理世界互动和自动驾驶等领域的“空白”。

5、人工智能已经成为底层创新的驱动力,无论期待与否,人工智能都会来临,不努力就会被淘汰。

6、认为AI不会毁灭人类,而是成为我们的强大放大器。AI可能成为新型人类的一部分,而不是取代人类。思维本身可能是限制未来发展的最大因素。

7、随着技术的发展,将会出现超级个体,这些人体能够利用各种工具和技术创作精美的作品,不再受限于传统思维。普通年轻人通过自学和工具使用已经能够创作出优秀的作品,甚至拍摄真正的电影。

8、在大语言模型出现之前,很难看到机器人领域的潜力和可能性。

9、大变革的时代对于普通人来说机会大于挑战。在这样的时代,普通人才有机会崭露头角,因为只有在变革中,那些原本就出色的人才更难保持优势。

10、初创公司虽然在视频方面的效果可能不如预期,但它们获得了大量融资,表明文生视频是可行的。

AI工具2生成的笔记

1、视频已成为现代人获取信息的主要形式,因此Sora的出现引起了广泛的关注和热潮。它的影响不仅仅在于技术上的突破,更在于它满足了大众对高质量视频内容的需求。Sora相当于打开了一扇门,让大家看到了AI在视频制作领域的巨大潜力和可能性。

2、虽然Sora在技术上可能并没有带来太大的突破,但它在产品形态和用户体验上带来了巨大的突破,这种突破更符合大众的认知和需求,因此其影响是震撼级的。

3、Sora的出现将对视频制作行业产生深远的影响,随着AI技术的不断发展,未来的视频制作可能会更加高效、智能和便捷。这将对行业的生态和从业者的工作方式带来挑战和机遇。

4、对于AI技术的突破,人们常常关注其是否能够与真实世界保持逻辑连贯,如果AI生成的内容在逻辑上看起来与真实世界一致,人们会认为它更强大,更接近通用人工智能(AGI)。

5、从技术上讲,能够生成视频并不是最本质的差异,关键在于这些视频是否能够严格符合物理世界的规律。文生视频的重要性在于它们推开了一扇门,即让AI能够理解和模拟真实世界。

6、虽然某些AI产品在体验上可能是划时代的,但从技术角度来看,它们可能并没有带来根本性的变革。真正的技术进步需要严谨、客观和深入的研究,而不仅仅是基于感官或热闹的刺激。

7、在技术发展中,许多看似无关紧要的前期积累实际上是非常关键的,就像莱特兄弟发明飞机之前,空气动力学等各方面的技术条件已经成熟。因此,我们不能仅仅因为某个产品带来了强烈的冲击就认为它是划时代的,而应该更深入地了解背后的技术和积累。

8、语言模型对世界的理解是基于逻辑的,而不仅仅是通过图像。人类对世界的理解高于动物,主要归功于语言的使用,而非图像。语言使人类能够抽象化世界,形成各种逻辑和层次。

9、尽管Sora的视频制作精美,但这并不意味着它使人工智能对世界的理解真正上了一个大台阶,Sora可能更多的是为大语言模型提供了一个将世界理解视频化的能力,而不是真正提高了其对世界的理解水平。

10、相比影视导演,物理学家对这个世界有深刻认识,因为真正对世界的理解和深刻的理解一定是在逻辑层,而不是仅仅通过影像或视觉表现,simulator作为一个影像实时生成的工具,能够将人们脑海中的想象转化为符合感官的视频,帮助人们更好地理解和观看。

11、人们首先选择学习写字而不是画画,但小孩拿到笔的第一件事通常是画画,这表明画画是一种基于直觉的行为,而写字则需要后天学习,这说明人们可以直觉地复刻他们看到的图像,但理解世界的层次和规律需要进化到语言层面,这种理解是深刻且基于逻辑的。

12、Sora在技术层面实现了重大突破,特别是在时间轴处理方面,它能够生成每秒钟多帧的连续图像,使得视频的变化更加自然和符合常识。

13、0penAl的成功在于具有强烈的技术信仰,GPT的成功使他们更有动力去尝试并创新。

14、0penAl的大语言模型为其提供了底层能力上的优势,使其能够解析视频并形成大量文字,为视频引擎提供丰富的数据源。可以想象GPT可能首先为给定的文本生成一段脚本或剧本,然后再由引擎生成具体的镜头。

15、0penAl在创新过程中,通过自我循环的方式,使用过去的成功经验来推动新的项目,如文生视频。

16、文生视频技术的突破将引发海啸般的变化,多家公司将跟进并推出类似产品。

17、随着视频时代的到来,创意将成为竞争的核心,因为每个人都能制作精美的视频仅依赖熟练技能在职场上越来越不值钱,创意、对用户和市场的理解以及好奇心成为关键。不受思维限制的人将有更大的机会。

18、Sora虽然是二维影像,但其在图像和视频处理上的技术进步具有启示意义,推动了对具身智能的理解和发展。

19、机器人领域的春天正在到来,随着技术的进步,人们期待智能机器人能够更快地诞生,帮助人们完成日常任务。

20、AI的发展遵循摩尔定律,算力和数据量的进展是指数级的,而一些依赖于机械结构的技术改进则是线性的,需要长时间的研发和打磨。

21、0penAl是强者,但并不意味着它会垄断整个行业,其他公司仍有发展机会,包括配套设施、私有化模型等,但需要避免同质化思维。科技企业需要找到适合自己的特点,并关注用户需求,以在行业中脱颖而出。

22、对于数字生命和缸中之脑的概念,无法证明也无法否定,因此有些人认为这是一个哲学问题。对于无法证伪的事情,我选择不相信,因为这种相信对个人没有实际价值。

23、在大变革的时代,机会通常大于挑战,变革时代会打破原有的社会结构和规则,使得普通人有机会脱颖而出。

24、勤奋和努力是成功的关键,人们应该积极学习新技能,从基层开始做起,积累能力和经验,不必过度忧虑未来的大趋势,应该专注于当下,做好自己的事情。最终踏实努力的人可能会成为变革的受益者。

标签:

猜你喜欢

钉钉总裁叶军亚布力发言:AI+钉钉会带来三个变化
激活区域数字化发展引擎 北京电信织就京津冀算力“一张网”
为情人节加点色彩,小红书联动东风奕派诠释优雅生活新腔调
Flexport 飞协博推出 Convoy 平台,将领先的卡车货运技术推向市场
理赔额突破200亿,这家互联网险企如何将“支付+服务”价值最大化?
微美全息(NASDAQ:WIMI)研究基于区块链的可追踪IP版权保护算法
再启新章!特易资讯获颁上海数交所数据供应方认证,数据产品正式挂牌
合作共赢!唯柯医疗D-shufo™新一代卵圆孔未闭封堵器启动招商
数据上线,评测开启!2024 6G无线通信AI大赛正式开战!
AppLovin发布《2024年效果驱动型广告趋势报告》
国资委明确:加快建设一批智能算力中心
领先再进一步!永洪科技荣获敏捷BI领域连续六界冠军
破解专业气象服务缺失“痛点”墨迹天气“护航”物流行业高效、安全运输
知道创宇荣膺第十届CNCERT国家级网络安全应急服务支撑单位
86集商:2024勇往直前——不想认命·就去拼命
华南理工大学与华为云签署校企合作协议
满血性能加持 用三星Galaxy S24 Ultra驰骋游戏世界
借势央视龙年春晚IP,国民品牌兵兵再度出圈全民种草
上海率先推行政务民生类应用鸿蒙化 正式启动“随申办”鸿蒙原生应用开发
文生视频迎来里程碑时刻,微盟集团有望受益短视频营销降本增效
合思与东方新华共同探讨企业如何采用弹性敏捷工具,应对复杂的交叉管理场景
作为敏捷的财务收支管理平台,合思荣登“德勤中国明日之星”榜单
能效电气汪进进:新能源充电桩行业的七大细分市场
稳中有涨的SMT该怎么“卷”?
华为云GaussDB支撑农行超级网银业务,性能和稳定性备受认可
繁花丛中鸿蒙帆起!上海广播电视台加速推进鸿蒙原生应用落地
老挝交通部部长助理兼司长本塔•沃那翁一行到访海信
助教促学,勇夺第一!iReal 3D扫描仪精准采集汽车油泥模型数据
钉钉与乐播投屏达成合作,电脑、手机一秒投屏上电视
汇量科技再获SOC2 Type2 、SOC3鉴证报告 数据安全能力屡受权威认证