自2022年11月起,OpenAI开发的ChatGPT在全球范围内引起了广泛关注。每次技术革命都会引发各种连锁反应:一些人积极接纳,一些人担心被取代,另一些人在其中寻找商业机会和价值。类似于创业经历的优胜劣汰,现在由ChatGPT引领的AI新革命浪潮是否真的是充满机会的蓝海市场呢?未来会出现垂直模型吗?会出现新的超级巨头吗?大模型会重塑各个行业吗?2023年7月20号,在“行行AI访谈”节目中,拥有10亿级AI数据预处理经验的波特时空创始人刘大鸿以“LLM(Large Language Model)大语言模型原理”为主题,谈论了大模型风口下的机遇和挑战。刘大鸿的观点如下:
大模型是互联网的映射
刘大鸿认为,“大语言模型”的“大”包含“覆盖广泛”和“工程浩大”的意思。语言是一个非常复杂的网络,语言模型需要具备广泛的知识和语义理解能力,才能够在概率接龙游戏中准确地生成与前一个项目相关的下一个项目。如果语言模型的知识覆盖范围有限,它可能无法理解或推断出正确的关联,并生成合适的数据。
目前,国内许多所谓的“大型语言模型”严格来说并不算大语言模型,更像是简体中文的垂直模型,其覆盖范围有限。要实现真正的大型模型效果,需要涵盖更多的领域和语言,这需要大量高质量的数据来支持;同时,国内高质量的内容大多集中在私域而不是公域网上,且一些网络数据需要脱敏和过滤处理,这些都将影响大模型的训练结果。
数据处理是个“浩大工程”,需要耗费大量的人力和时间进行积累。OpenAI起步时也是如此,它们刚训练出来的内容“不忍直视”,后来经过大量的RLHF的训练(reinforcement learning from human feedback,译为“以强化学习方式依据人类反馈优化语言模型”),对内容进行符合人类偏好的处理,模型逐渐得以进化。国内的大型语言模型也将经历类似的过程,从最初的内容生成,到不断进行强化学习,再不断接收人类反馈进行优化,这是一个逐步成长的过程。尽管国内的大型模型可能会相对较快地经历这个过程,但与OpenAI的经历相比,时间差距可能不会太大。
在刘大鸿看来,大型语言模型像互联网的映射,它的规模和质量取决于我们所拥有的互联网。因此,要构建一个真正强大的大模型,需要我们拥有广泛的数据和相应的工程能力,这是一个漫长的构建和积累过程。
将出现个人和企业垂直模型
刘大鸿认为,行业垂直模型不成立,企业垂直模型和个人模型是未来的显性需求,刘大鸿倾向于将企业垂直模型和个人模型统称为小模型。未来,几乎每个在互联网上发布内容的企业和个人都可能拥有自己的模型,不仅仅是语言模型,人们可以利用这些模型来生成、优化和个性化内容连接需求和服务。
目前,企业垂直模型很难脱离大型语言模型的支持独立成型。小模型仍然依赖于大型模型的语言能力。今天的大型模型是基于语言模型的,而小模型很难具备同样的语言能力,尽管可能会有部分内核训练出来。
《大演算》这本书上提到过一个设想:未来是一个模型社会,每个人、每个企业都有模型。比如,某人找工作时,这个人的模型先和招聘的公司的模型进行了初次交互,若双方感觉合适,此人再去公司正式面谈,就像业内说的数字人,未来都会内嵌一个小模型。
大模型是一种智能云,像百度的文心一言、阿里的通义千问和OpenAI的ChatGPT等,为各类应用提供底层的智能化服务。企业或个人拥有大量数据,其中一部分数据是私有的,无法直接提供给大型模型。因此,未来需要制定协议,明确大模型所允许采集和不允许采集的数据类型,并通过加密算法对数据进行脱敏处理,然后再提供给模型,这方面有很多创新的空间,但可以断言的是,未来,每个公司都会有自己的模型和数字人,像当初的网站一样,现在过于把模型神秘化了,对于市场,要看如何下沉到用户需求。2022年,刘大鸿团队开发了一款个人AI商务助手“快秘书”,国外有一个比“快秘书”晚诞生但相似的产品叫“Pi”,“快秘书”可以理解为中国的Pi。刘大鸿说:“‘快秘书’的初心是给像我这样追求时间效率和信息准确的人提供便捷高效的AI服务,有很多人在意自己的时间效率,被一些用户称为‘手机中广受喜爱、有用的三款产品之一’”。
大模型的应用将催生新巨头
OpenAI已到10亿月活,除了应用做得好,更得益于AI技术的突破,让信息获取的成本大幅降低。OpenAI创始人Sam Altman和LinkedIn联合创始人Reid Hoffman在某次对谈中,提到一个词——“单位智能(Unit Intelligence)”,如果获取人工智能的成本和资源只需以前的千分之一,过去做一个人工智能的产品,假设成本是1千块,现在只需1块钱,而用户的付费意愿是1千倍,即单位智能获取的费用很低,把过去的获取成本乘以现在用户付费意愿,是10的6次方,即一百万倍,这种百万倍的变革力量很快就会渗透到各行各业。
刘大鸿认为,当前互联网巨头都在做自己的大模型,但一个大模型的真正挑战者未必就是另一个大模型,每家成熟公司都有它既有的商业责任,为现有的用户提供更好的服务来巩固既有的成熟业务是它们的首选任务,但是随着新技术的出现,一些过去未被满足的需求现在被满足了,这会催生一个新兴市场和新的商业模式出现,而这时候这些成熟的大公司既有的运营模式往往不太匹配新兴市场,这些新兴市场的新公司新产品,可能在未来形成新的规模。刘大鸿说,市场细分是决策的核心部分,人们常常会惯性地认为,市场细分就是从现有的存量市场中切一小块蛋糕,再慢慢做大,但互联网是有网络效应的,很多时候这种做法不成立。在研究很多成功案例之后,刘大鸿发现不论是实体企业还是互联网企业,创新者常常不是切蛋糕式的,而是从边缘的新兴市场切入,做了一个小产品,随着新技术和新产品的渗透,这种新产品带来的便捷和结构性成本优势,会推动边缘化的新兴市场不断扩大,甚至成为主流市场,AI也会遵从这样的规律。
比尔盖茨认为,未来产品的交互方式就是AI助手,谷歌和亚马逊会被替代。刘大鸿认为,盖茨的观点并不是说谷歌和亚马逊就不需要了,而是有部分服务会被接入AI助手,亚马逊会成为基础设施。因此,刘大鸿判断,一到两年内,基于大模型为代表的新一代AI集基础底座,会长出一些新兴的全民应用。
交互方式改变是行业变革的触发点
陆奇在奇绩创坛中说“大模型值得让所有行业重新再做一遍”,刘大鸿认为这个观点对“大部分行业”是成立的。但行业发生变革有先后排序,数字经济领域首先开始,再逐步扩展到制造业、电商、外贸等行业。未来,尽管不是每个公司都需构建大模型,但每个公司必须有自己的小模型。随着ChatGPT的出现,人机交互方式经历了革命性的变化,类似于手机从诺基亚转变为iPhone的过程。未来,所有产品的交互方式都是基于“Chat“的底层运用,实现交互效率的社交化、自动化、智能化,这将是所有行业变革的触发点,交互方式的改变将推动所有行业的重塑。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。