头部大模型公司进京赶考,向量数据库成为应考神器

2023-06-12 13:53:25     来源:

日前,「模型思辨」国内大模型产业生态研讨会在北京举办,Zilliz 与 360 集团、阿里巴巴、昆仑万维等来自大模型产业链的头部公司及投资机构参会,会上 Zilliz 创始人兼首席执行官星爵、 360 集团创始人周鸿祎、昆仑万维创始人方汉等重量级嘉宾更是从不同角度分享了对大模型的独到见解,精彩观点的交织与碰撞背后,是众人对于中国大模型未来的积极探索与期待。

其中 ,值得关注的是对于向量数据库的探讨, 星爵从大模型存储的角度为大家详解向量数据库之于大模型的重要意义。

星爵认为:

●移动应用时代程序开发经历了从复杂到简单的过程,AI 浪潮的来临却从侧面提高了程序开发的成本,大模型时代之下 CVP Stack 这种新范式的出现改变了这一现状,在其加持下,人人都可能是 AI 时代的工程师。

●大模型的发展离不开存储这一关键点,其中以 Milvus 和 Zilliz Cloud 为代表的向量数据库扮演着大模型记忆体的角色,可以让大模型们进行知识增强。

●下一个杀手软件会是智能体,它同样需要向量数据库的存储和检索能力。可以预见,向量数据库将迎来快速的市场规模增长,未来可期。

图为Zilliz创始人兼首席执行官星爵

以下是星爵演讲的精彩观点:

从移动应用时代到大模型时代

当下的时代常被冠以很多花里胡哨的称谓,然而早在十年前,硅谷便感受过同样的热情。当时硅谷的每个周末或者任何一座大城市都有一群人在兴奋地探讨 iOS 和 Android。十年,我们见证了移动技术的成长,改变了生活的方方面面。

十年前,之所以有那么多移动开发者涌入这个赛道,原因是安卓和 iOS 极大地简化了移动开发的工具栈,降低了手机程序应用开发的难度。回到 AI 领域,尽管在过去十多年的时间里它一直处于不断升温的状态,但实际上整个领域的 Stack 比重相当高。这意味着,如果你想开发一个完整的 AI 程序,需要在不同板块中至少选择 1-2 个项目,并将这几十个项目串成自己要做的解决方案。

大模型出现以后,工具栈变得更加简化,开发者可以在一个周末的时间做出一个不错的 demo。而这并非是天方夜谭,CVP Stack 模式就可以实现。其中,C 的意思是以 ChatGPT 为代表的大模型,它在 AI 程序中充当中央处理器的角色;V 代表 Vector Database,即以 Milvus 为代表的向量数据库,充当 embedding storage 的角色;最终会通过 prompt 的方式进行交互。

总结来看,在大模型时代下,无论你是否写过代码,只要你有一个 ChatGPT 账号、会写 prompt、找到一个 embedding 的数据库为模型提供相关领域的知识,甚至说为其提供一个缓存层,具备以上条件,你可以轻而易举地成为一个很好的工程师。举个例子,我们的同事用了两天就做出了一个ChatGPT + Milvus 向量数据库的应用,他的名字叫 OSSChat(https://osschat.io),用于解决开源项目文档冗长、不易查找等问题,目前已经支持几十个主流的开源项目,每天都有很大的访问量,用户甚至可以去生成开源项目的代码。

存储比计算更便宜,大模型也不例外

大模型更新的时间比较长,知识也具有一定的滞后性(例如 ChatGPT 的知识只停留在 2021 年底),如果用现在的数据库存储方式,可以把最新的知识提供给向量数据库,对大模型进行知识增强,可以得到更好的答案。不止如此,大模型的训练成本高昂也是不争的事实。

这次我想重点谈谈成本问题。在计算机发展史中,最经典的架构是冯·诺伊曼架构,最核心的贡献就是实现存储与计算分离,即把所有信息、所有计算归为计算问题和存储问题。存储与计算分离有各种各样的好处,传统的冯·诺伊曼架构是把信息用二进制代表,实现存储和计算分离。

大模型的本质是复杂的神经网络,在这个神经网络中任何数据的传输都需要 embedding 作为中间介质,可以说,embedding 就是传输信息的基本单元。因此,embedding 是在传统的抽象之上覆盖了一层适合 AI 或大语言模型进行语义抽象的数据表示。

而向量数据库负责的是 embedded 语义数据的存储与检索。我们要把大语言模型和向量数据库分为两个模块,就是存储与计算分离,正如冯诺伊曼架构一样。这样做的好处就是历史上存储价格永远比计算价格便宜几个数量级以上,大语言模型也不例外。假设有一个大模型可以做 100 KB Token,同样条件下,给到大语言模型运算的成本远大于做向量召回。如果这个大模型要做 1000 Token 呢?运算成本将更加昂贵。虽然大语言模型未来会有越来越大的 Token 窗口,但我们本质上不会把所有信息都分到大模型里面,且大模型不能覆盖全世界所有信息。

未来向量数据库应该会成为大语言模型存储的标配,传统的数据库之所以不适合为大模型做存储,是因为它们没有语义表达且不能提供语义存储。如果说现在有一种数据库方案和存储方案,能够提供语义检索的话,只能是向量存储。

下一个 Killer App

讲完过去一年半年的机会,我们来聊聊下一个机会是什么?

老周和轶航的对话有讲到智能体越来越被认为是下一代 Killer App,对此,我很认同。大模型还需要人不停地给予提示,智能体就是希望通过做任务和场景拆解,解决无限复杂的问题,最终实现和人一样的自我演进的能力,或者形成自己独特观点和演化的能力。

智能体需要记忆。人类的大脑有一个区域叫做海马体,负责长期记忆。记忆是人类智能很重要的部分,不可能今天把昨天的事情忘记还说自己很聪明。行业里面的正在尝试用向量数据库为智能体存储长期记忆,因为向量数据库的成本是很可控的。

未来如果每个人都能够有几十个智能体帮助我们生产生活,像向量数据库这样具有语义检索的存储市场会迎来很大的增长。Zilliz 开始做世界上第一款向量数据库的时候,内存应用场景根本不是大语言模型,更多的是图片搜索、视频搜索,包括个性化的搜索引擎,但本质上都是用神经网络做成向量嵌入。大语言模型开发门槛的降低让这个领域成为面向开发者友好的 Killer 领域,所以我们认为向量数据库这个领域未来几年将迎来快速的增长与更加庞大的市场规模。

大模型时代,未来可期,而作为大模型记忆体的向量数据库,同样值得期待!

标签:

猜你喜欢

为体育事业赋能,“墨迹天气杯” 铁人三项赛报名火热开启
桃心云手机RedHeard OS:多终端协同实现革命性云服务场景解决方案
实力夺冠!天翼云在国际AI顶会大模型挑战赛中脱颖而出
网易云音乐第七届全国校园歌手大赛开幕 专业扶持助力梦想启航
OBS和Argo里藏着哪些海洋的科学奥秘?一场致敬好奇心的深海之旅在海洋二所进行
2023 GAIIC-算法挑战赛︱巅峰对决,完美收官
昆仑海岸亮相上海国际水展 物联网技术赋能环保领域创新发展
聚焦行业共性难题,陈智乐现身小鹅通艺术教育行业训练营
企业培训行业如何实现数字化升级,梯队金课堂张国庆做客小鹅通直播间
致力马传染病研究 助力现代马业崛起
实现碳中和 三菱电机在行动
以爱之名|关注血糖健康,以品质健康好礼臻启“父亲节”
特易资讯开展2023全国巡讲·杭州站,海量数据赋能外贸企业
中国超级英雄正在诞生与崛起,“解放者联盟”系列IP展示大国风采与实力
证券时报电子报实时通过手机APP、网站免费阅读重大财经新闻资讯及上市公司公告
华为深耕基础软件开源,使能千行百业创新
618京东3C数码品类日 荣耀高管为用户派送20周年定制礼盒
高性能笔记本电脑新品AMD高管送货上门 618京东联合AMD为用户送惊喜
618京东联合品牌推出20周年礼盒 OPPO高管上门送一加Ace2手机
三星电视惊艳亮相2023核聚变游戏节,展现电视产品的“硬核”游戏实力
万兴科技旗下万兴播爆推出Windows桌面端 支持双端权益互通
田新远:创新引领行业 TDR构筑数字安全基石
十六城投影画质盲测活动落幕,坚果投影发布公开信
苹果如期发布XR头显,力争定义行业| 属于XR产业的新时代已然到来
腾讯云与云南大理州签署战略合作协议,共建RCEP云上跨境生态产业园
凭借“隐形自拍杆”火遍滑雪圈后,影石Insta360广州融创茂官方体验店开业迎客
歙采缤纷 邀您共享! 歙县文旅招商推介会在深圳举办
直击大运会:电信劳模火炬手 勇攀科技创新高山
ASKO × 设计上海 | 以自然之名 开启百年品牌新章
AI浪潮席卷,时空壶为何能成为AI翻译时代的破局者?