大模型价格战打响。
7月5日,2024世界人工智能大会(WAIC)期间,百度智能云宣布文心大模型4.0 Turbo(ERNIE 4.0 Turbo)面向企业客户全面开放,并宣布文心旗舰款模型ERNIE 4.0和ERNIE 3.5大幅降价。
自2022年年末聊天机器人ChatGPT一炮走红后,2023年国内涌现出两百多个大模型,被称为大模型元年,一时间掀起“百模大战”。而此次百度智能云的全面降价这意味着对于大模型之战来说,除了技术优势,成本优势也成为另一显著竞争力。对于技术、成本双驱动的首战,百度是如何打得?
自6月28日,文心4.0 Turbo对外发布以来,上下文输入长度从4.0版的2K tokens升级到了 128K tokens,能够同时阅读100个文件或网址,AI生图分辨率也从512*512提升至1024*1024。与ERNIE 4.0的生成效果对比,在相同的提示词下,4.0 Turbo的生成速度明显更快,生成内容也更具条理性。
此外据悉,WAIC期间百度副总裁谢广军表示,文心一言4.0 Turbo面向企业全面开放,定价是输入0.03元/千Tokens,输出0.06元/千Tokens,“若按照3:1输入输出长短统计下,相较于文心一言4.0的通用版本降价幅度达70%。”
同时,ERNIE 3.5-8K、ERNIE 3.5-128K、ERNIE4.0-8K也均迎来降价,其中ERNIE 3.5-8K、ERNIE 3.5-128K的输入价格以厘计。两款主力大模型ERNIE Speed和ERNIE Lite保持免费,进一步帮助客户降低大模型使用门槛和试错成本。
准确来说大模型价格战从5月已经开始,且战愈演愈烈。在今年的WAIC大会上,也有不同企业的多位嘉宾就该话题展开讨论。有嘉宾认为,价格走低十分正常,公司因此受益。也有嘉宾认为,这种现象并不能持续。
价格会是客户考虑的第一因素吗?若大模型厂商持续降价,百度还能赚钱吗?
对此,百度智能云市场部总经理曹海涛表示,没有人不关心持续降低成本的能力,放长周期看,手机、电脑、汽车等价格的降低是行业进入深水区重要的驱动力,技术、产品、能力都足够强的企业才能拼价格,若是亏钱干,补贴不能长久,每个厂商都要考虑自身盈利的能力与成本。
曹海涛指出:“价格,我们不能把它当作单点来看,降的是API,它会带动其他相关核心产品的收入,整个基础设施、云等附加产品也在提供价值,就像我们不能用单个芯片评价英伟达这家公司,它的并行计算平台和编程模型CUDA也是它的壁垒。”
谈及大模型价格战,曹海涛认为短时间内是好事,可以让鱼龙混杂的厂商先淘汰,他判断大模型的价格战至少还会持续一年,会有三类企业被淘汰。一是套壳类的企业,二是云基础设施做得不好的企业,三是没有数据飞轮能力的大模型厂商,“没有能力拿到用户的反馈,没有一定的用户规模,效果越来越弱,用的人自然就没有了。剩下的企业会活下来,会盈利,并占有一定的市场份额。当市场格局趋于成熟和稳定,有的企业从客户层面真正进入深水区、进入核心业务流。”
除了价格,外界也在关注为何大模型没有杀手级应用出现。
在4日的产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏抛出自己的观点,他表示,业界应避免掉入“超级应用陷阱”,认为一定要出现一个DAU 10亿的APP才叫成功,“这是移动时代的思维逻辑,其实不一定,AI时代,‘超级能干’的应用比只看DAU的‘超级应用’要更重要。只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。”
曹海涛则表示,他认为,短期最大的机会在To B,互联网行业是落地最快的,因为该行业原来整体基础比较好,互联网金融、在线教育等行业也都在积极尝试。“To C端,也许现在就有某些应用是杀手级应用,只是我们还不知道。比如,抖音刚出的时候,也没人觉得它是杀手级应用,当它DAU过亿后,大家才意识到。”