AI大模型在中国经过了半年的发展,经历了哪些技术的变化?泡沫破灭了吗?什么样的AI应用更有商业前景?我们用提问的方式,围绕国内AI创业者在市场选择、融资策略、商业模式、未来判断等问题,邀请波特公司创始人刘大鸿谈谈观点。
低估了AI的想象空间,高估了AI的能力边界
1. 问:你第一次用AI大模型是什么时候?当时有什么感觉?
刘大鸿:2022年12月。当时很震惊,感觉计算机突破了一个边界。过去,计算机主要用于语言理解,回复的范围也有限。现在大模型似乎能够回答任何问题。我觉得这个技术变革比区块链技术的突破带来的颠覆力更大,一个新时代要开始了!人可以和机器在一个对话窗口展开对话,还可以对接后端的业务,解决人们的某些具体问题。我当时觉得大模型会取代搜索引擎,现在我觉得不能用搜索引擎或者问答类的产品形态来与之类比。
2. 问:上半年AI经历哪些技术变化?
刘大鸿:上半年,我们一边做应用一边训练自己的AI模型。回头再看大模型技术,我觉得它有更大的想象空间,但也有能力边界。它在解决语言交互、索引、给内容打标签、切换不同语言等方面有优越性,还能把人的意图转换成另外一种指令……大模型已经慢慢融入了我的生活,就像水、电一样,AI也成为我日常生活依赖的“能源”,电厂输出电能,大模型输出智能。
从“人与人对话”到“人与机器对话”,其中有巨大的想象空间,通过给AI赋能,拓展出“人和物”的对话协议,AI的对话接口可以接到电视机、冰箱、机器人,甚至万物皆可接入AI……可是,它也有自身的局限,比如,目前它还是一个语言模型,不是“数学家”或“物理学家”,它不具备解数学题和物理题的能力,多模态尚需要时间来做工程叠加,因此,大模型暂时还没有推理能力。
3. 问:你什么时候决定用大模型技术跟自己的产品做结合?
刘大鸿:2022年5月,我们团队研发过一个AI语音交互人机对话模块,是用第三方技术集成的,不太好用,那半年,我们一直在改进AI的技术准确度和交互。我们当时面临两个难题,一是机器很难理解人的语言和意图,当时市面上还未有能解决这个问题的技术;二是机器无法输出一个像样的答案。然而,大模型来了,我突然感觉,大模型是一个技术上的突破,我们也不需要再做技术自研发,用好大模型的技术能力就行,所以在产品技术战略思考的时候,我们列了一些不做清单(stop doing list),第一条就是不做大模型。
4. 问:你做的产品是如何结合大模型技术应用的?
刘大鸿:我们将产业的需求抽象归纳成一个产品的交互,让AI成为人机交互的接口,通过它可以实现多重事情的交互和处理,让系统能够理解人的意图并提供相应的服务。这种模型可类比为一个魔盒,你告诉它,你需要什么,它会将信息翻译到数字世界,并将结果反馈给你。至于魔盒内部是怎么实现的,用户可能不那么关心。我有时候觉得人类对出现的新技术和新世界,有孩童般的好奇心,我曾看过一个孩子不停地按灯的开关,他按一下,灯亮了,再按一下,灯灭了,孩子很开心,在我看来,这就是人机交互,这个孩子在跟世界交互,现在,开关和灯泡由AI来驱动了。一千年前,点亮世界是魔法,今天AI技术的突破,所有的机器和设备或许都可接入AI接口,人对机器的“操作”变为人和机器之间的对话,万物有灵,机器能按照人的意图完成任务,甚至能读懂人的表情,这是很好玩的事情。
“一花百放”和“百花齐放”
5. 问:上半年,你觉得中国的大模型取得了哪些实质进展?
刘大鸿:目前国内的大模型方向,在技术上有两类,一类是以百度“文心一言”为代表的大模型技术,它在文字和语言模型处理方面取得了非常大的进展。比如,内容的精准度,上下文的关联性等方面,中文语料库比国外大模型的数据更齐全。
第二类是腾讯这类提供大模型基础服务的公司,它们做了非常多向量数据库等基础工具,给开发者们使用。像腾讯这种以产品驱动的公司,一定会推出自己的大模型,我猜,腾讯这类公司将诞生某个“杀手级”的应用。
单纯的大模型未来会成为一种智能云,类似阿里云、华为云、亚马逊云等产品。
6. 问:据你所知,上半年,美国的大模型有哪些实质进展?
刘大鸿:美国的大模型发展呈现出纵深发展的特点,涉及不同领域,中国和美国在互联网技术、基础设施和生态方面存在差异。美国大模型是“百花齐放”,而中国是“一花百放”。例如,美国有以Transformer为基础的GPT语言大模型、谷歌选择Bert方向,并结合了综合语义分析等技术、Facebook开源了llama 2大模型基础构架,与更多人共建生态系统,Pi团队专注于模型的情感理解,给人提供情绪价值。此外,在图像、视频生成和聊天机器人等领域,美国也取得了创新突破,相对更加多样化,生机勃勃。
7. 问:中国“一花百放 ”和美国“百花齐放 ”,你觉得是什么原因导致的?
刘大鸿: 文化差异。在中国,从资本和应用市场来看,很少有公司或财力雄厚的资方愿意在基础性研发或探索性业务上投入,在中国,“一花百放”是非常普遍现象,美国人对此是难以接受的。这种文化差异表面上看是饱和竞争,而饱和竞争的好处在于将应用市场打透,我觉得中、美这两种市场形态各有利弊:国内这种方式的好处是可以快速科普,为市场培养一批立即能上手的人才,做应用的人也要懂模型的技术原理;坏处是这样催熟的技术,积累不够,后续无法激发出新的创新表现。
8. 问:美国Pi公司的应用跟快秘书相比,快秘书有哪些本土优势?
刘大鸿:Pi的梦想是互联网式、科幻式、终极梦想式的,“快秘书“是个AI工具,它们的应用层面不一样。Pi像电影《Her》里的情节一样,要打造出一个懂你、给你提供情绪价值的机器人;“快秘书”是个Copilot(副驾驶)角色,帮助你把事情做得更好。因此,“快秘书”将重点放在商业化应用上,提升效率、降低成本,使个体在商务活动中更强大。快秘书主要服务于追求高效能的人士,帮助他们提高工作效率和简化商务事务,这种普遍性的消费升级,与国内的文化和人均可支配消费都有很大的关系。
从“信息找人”到“人找机器人”
9. 问:在你看来,移动互联网时代和AI时代的根本区别是什么?
刘大鸿:在PC互联网时代,人们通过“搜索”生产信息;移动互联网时代,手机成为人的延伸,可通过手机随时获取、处理和发送信息。这种信息找人的推送和推荐模式,衍生出了许多业务流程。在AI时代,人机交互方式变为人找机器人,移动互联网时代的许多业务在AI时代仍会存在,只是会下沉为AI调用的基础设施和服务。
举例来说,你要去上海,在移动互联网时代,你要通过搜索多个产品和平台获取信息,再做决策,在AI时代,AI可以帮你安排好前往上海的一切事宜。
10. 问:在你看来,移动互联网完全跨入到AI时代大概需要多久,会经历哪些阶段?
刘大鸿:这种过渡并不会有明确的分水岭,它是一个渐进的变化过程,可能某一天会突然出现一个现象级的产品或应用,推动和加速AI时代的到来。我预计再过两、三年,AI市场将会非常成熟。
看好大模型,更看好应用层
11. 问:经过上半年,目前,你觉得中国大模型的泡沫破灭了吗?
刘大鸿:中国大模型是否会破灭与资本直接相关。我想起过去的团购竞争中出现的"千团大战",据说当时有三千多家团购产品,最后胜出的就那么几个。但大模型有些不同,它的技术和人才在转型和应用过程中仍有用武之地。经过上半年,尽管热度有所下降,但并未破灭或浪费,是正常的发展阶段。
中国的大模型发展,需要具备一些先天条件——巨大的数据集、充足的财力支持和技术积累。这并非是临时召集一些人就能干成的事,需要远见,提前布局。有些公司有技术,但没有相应的数据集;有些公司有数据,但缺乏技术支持;还有理解和认知的局限等因素。因此,并不是所有公司都具备大模型创业的能力。
12. 问:现在中国市场对大模型的误读是什么?
刘大鸿:最大的误读是认为它无所不能。大家会觉得“你看这个问题,它都无法正确回答。”那是因为它没有受过足够多的训练,它需要被赋能。
13. 问:你们的AI产品是如何赋能的?
刘大鸿:我们将大模型赋能到具体的业务场景中。针对具体的业务,使用小模型进行训练,使其具备相应的能力,再与大模型对接,利用大模型的能力,解析出结果并呈现给用户。若小模型已经具备了某项能力,无需再进行模型训练,只是一个业务需求,企业高管的事务安排,产品售前售后,就可以直接调用。在用户端的第一页,每个人、每个企业对每个业务都有不同的需求。我需要为这些企业训练自己的垂直小模型,让小模型在用户界面上进行交互。简单说,我们更像是一家提供新型“劳动力”输出的公司,租赁数字员工,经过AI赋能,让一支50人的团队,产出200人甚至500人的效能。
2B还是2C?最终都是赋能人
14. 问:你觉得什么样的AI应用更有商业前景?
刘大鸿:我认为,我们最终交付方是2C。它的商业价值是让人在信息世界中更高效地实现他们的诉求。其差别是,看所选的市场是具有可延伸、可扩展的大市场?还是垂直、局限的小市场?大市场和小市场的技术模式是相通的。若把AI组成网络来看,人类与信息世界的对话,通过AI网络实现个人需求的高效服务,这个网络连接着不同公司的接口,最终让每个人都能获得强大的AI赋能,就像拥有自己的AI助手或员工,让个人成为一家强大的公司。
15. 问:在这种场景下,你认为AI市场中,2C和2B哪个业务走得更快一点?
刘大鸿:没有2B。马云曾问卫哲:“B2B是什么?”卫哲说“不就是Business To Business吗?”马云说“不对,B2B其实是Business People To Business People。”B2B不是企业对企业,而是商人对商人。我赞同马云的这个观点,做B2B,无论是产品还是服务,首先要想到去满足企业的需求,而企业的需求,无论产品或者服务,落到根上,肯定还是商人的需求。
由于中国经济市场的特殊性,有些个人消费者对AI应用缺乏支付意愿和支付能力,但企业主作为2C的一部分,他们具备支付能力和意愿。许多AI公司为了生存转向企业服务,采用垂直模型,开发数字人作为数字员工,实现更快的盈利。我们相信通过AI的赋能,能让企业变得更强大、更高效,同时也能使每个人受益。
找到真实需求,小即是大
16. 问:投资人问你最多的几个问题是什么?
刘大鸿:首先他们最关注政策问题。政策合规涉及算法备案等方面,审核的较为严格。第二会关注产品的可行性和持续发展能力。第三是商业模式和盈利方式。第四是未来的变数,市场变了,你做的事还会不会存在?目前来看,创、投两方都处于一种焦虑和紧张的状态,投资人会看创业者是否有清晰的认知和预判能力。
17. 问:你如何看待投资人对你提到以上问题?
刘大鸿:我觉得投资人提的是常识性问题,只不过对比移动互联网的黄金10年来看,投资人和创业者都更理性了,投资人似乎多了几分迷茫和担忧。
在产业结构转型、新技术刚露头的特殊阶段,细分和下沉场景的讨论要多过宏大叙事,去解决一个小场景的具体需求,自我造血大于宏大梦想。
18. 问:上半年,你跟AI创业者交流多吗?他们有什么想法?
刘大鸿:交流频繁。市场中存在两类AI应用的机会:一类是学习并培训AI相关技能,将其应用于自己的领域;第二类是将AI赋能于现有业务中。总之,他们都在细分市场中做着自己想做的事。
创业嘛,只要政策支持,有干劲的人总还是有的,在很多人大喊“躺平”的氛围下,我看到很多AI创业者带着激情在战斗,这很可贵。
19. 问:你怎么理解AI时代的“市场细分 ”?
刘大鸿:这是个很深刻的问题,我想了很久。我甚至觉得细分策略是战略中的核心部分,堪比军事策略中“打城市还是先占农村?”的细分方法论。
我觉得无论何时,都可以把市场分为存量市场和增量市场,创新者在多数情况下要去寻找增量市场,即使那是边缘市场,或者是存量市场中细分出的一个增量市场,总之一定是因为新技术的出现,过去不好解决或不能解决的问题,在今天解决它的成本大幅降低,效率大幅提升,变得容易解了。
我复盘了IT行业这几十年的产品更替的历史,我认为不能再用存量市场的划分方法来细分市场,从PC软件、PC互联网到移动软件和移动互联网,再到今天的AI软件和AI网络,每个阶段市场细分方法其实都是不一样,每个阶段的技术特性都不一样,电脑和手机的特性不同,出现了不同特性的媒体市场细分,AI也会出现新的具有AI特性的市场细分。
AI多模态大模型的突破,人机交互发生了根本性的变化,我认为可将需求分为两种:一是关注人类本身的物质购买需求,即人对信息和商品的需求。这类需求有非常成熟的供应链,市场已经饱和;另一种是关注人与人之间的服务需求,这存在巨大的发展空间。在“人对物的需求”中存在AI赋能的空间,也在存量市场的火力覆盖范围内。而“人对人”(包括机器人)的需求,今天突然变的不一样了。举个例子,当你时间有限、在海量信息市场中无法做出决策或专业判断时,人工智能可以复刻人类的能力,成为你的数字助手,帮你订购便宜、合适的机票,或者为你收集信息,撰写报告。在现实世界中,我们通常要靠助手、秘书或专业机构来完成这些任务,而现在可以通过AI来实现这些任务,用户从一个繁琐事务的执行者转变为决策者和监督者、照看者的角色。
多年前,我们几个企业家读书会的朋友非常热衷于研究“颠覆式创新”,随着我们在创业中的经历多了,吃亏也多了,我们慢慢领悟到一个共识:不论是哪种形式的创新,只要是在文明社会,就不会是以”抢地盘、夺人财物“的方式完成。绝大部分都是因为新技术和新模式的出现,找到了在存量市场外的一个新兴的边缘市场,且随着技术的进步和普及,边缘市场也会逐渐扩大,甚至成为主流市场。所以,”颠覆性创新”是细分方法论的颠覆,背后是技术更替和时代更替出现的时代推动。
今天的大模型技术的出现使得过去无法规模化、批量复制服务事务有了可工业化的可能,因此,会出现很多边缘化的新兴市场,这就是AI时代的细分市场。所以我觉得在这个阶段只要找到真实的需求,哪怕是小需求,不怕小,都是切入AI市场的好点子。
20. 问:你认为,中国AI行业真正的大机会在哪里?
刘大鸿:我现在做一件事时,不太计算它是不是真正的大机会,而是考量它是否有用,能否帮人们解决一个实际的问题。
说到“大机会”,从工业革命到互联网再到移动互联网发展史,服务人类肉身,解决“衣食住行”的问题是一直永恒的”大机会”,如今,新的AI技术也是在围绕这些事重构,为个体人提供业务赋能,帮他更简单、更高效地解决问题。还有一些机会是效率革命升级,它跟消费升级不是一个概念,技术突破之后,一些文化、娱乐精神追求的需求变得更大,像“穿越到数字世界中体验不同的人生角色”这类设想,在不久的将来会看到更多的类似的应用出现。
无需用户准备好
21. 问:你觉得,中国的企业主做好接受AI应用的准备了吗?
刘大鸿:我觉得不存在用户准备好这回事。首先,企业主并不需要了解AI技术的传输方法或语言模型的工作原理,它需要的是一个封装好的产品,就像按开关就能控制灯光一样能简单的使用。因此,需要我们将AI技术打包成可用的产品,解决他们在具体场景中的问题。其次,需要有资本支持研发公司来推广和迭代这些产品,满足用户的需求。就像在智能手机出现之前,不存在用户为智能手机的到来做好准备,当智能手机简单又易用,用户就会接受并使用它。
不可替代的人类
22. 问:关于人工智能对就业、生产力和生活质量的影响的讨论一直非常热烈,你对此有什么看法?
刘大鸿:人工智能的发展引发了一种人们普遍焦虑的情绪,很多人认为人类将被AI取代。我曾经也有这样的想法,甚至觉得自己读很多书没用处,因为AI能比我更快地获取知识,并解答问题。我曾想将AI看作我的外脑,但后来我改变了这种狭隘的观念,我现在相信阅读和思考仍然很重要,若不读书、不思考,我甚至无法提出好问题。人类仍然需要学习,而不是仅依赖人工智能。
图灵奖得主Raj Reddy认为"未来十万年内,AI无法取代人类"。人工智能在逻辑、计算、记忆力和反应速度等方面,可能比人类更强大,但我们对其认知仍然非常有限。人类和其他生命形式之间存在差异,如果将整个生命的形态放置在生态链中观察,你会发现自然界中存在着众多生命形式,人类对它们的思考方式和行为动机知之甚少,但它们却能很好地生存。
我们应该将人工智能视为一种工具,能够帮助人类变得更强大、自由,解放人的时间和精力,它可以帮助人处理逻辑计算、记忆、复制、推理、演化和多种可能性的探索等方面的任务,让我们能够更多地发挥创意、想象力和直觉,进行创新和艺术创作。
想象一下,如果有大量的人工智能助手帮助人完成复杂、繁琐和重复的工作,人只需动用大脑去思考、想象和享受生活,这将是人类的福音。我对人工智能的发展持乐观态度,认为它能帮助更多的人变得更强大、延长寿命并提高健康水平,将改变人的生活方式和能力,让我们在自己独特的生态位中发挥作用。