头部大模型公司进京赶考，向量数据库成为应考神器

日前，「模型思辨」国内大模型产业生态研讨会在北京举办，Zilliz 与 360 集团、阿里巴巴、昆仑万维等来自大模型产业链的头部公司及投资机构参会，会上 Zilliz 创始人兼首席执行官星爵、 360 集团创始人周鸿祎、昆仑万维创始人方汉等重量级嘉宾更是从不同角度分享了对大模型的独到见解，精彩观点的交织与碰撞背后，是众人对于中国大模型未来的积极探索与期待。

其中，值得关注的是对于向量数据库的探讨，星爵从大模型存储的角度为大家详解向量数据库之于大模型的重要意义。

星爵认为：

●移动应用时代程序开发经历了从复杂到简单的过程，AI 浪潮的来临却从侧面提高了程序开发的成本，大模型时代之下 CVP Stack 这种新范式的出现改变了这一现状，在其加持下，人人都可能是 AI 时代的工程师。

●大模型的发展离不开存储这一关键点，其中以 Milvus 和 Zilliz Cloud 为代表的向量数据库扮演着大模型记忆体的角色，可以让大模型们进行知识增强。

●下一个杀手软件会是智能体，它同样需要向量数据库的存储和检索能力。可以预见，向量数据库将迎来快速的市场规模增长，未来可期。

图为Zilliz创始人兼首席执行官星爵

以下是星爵演讲的精彩观点：

从移动应用时代到大模型时代

当下的时代常被冠以很多花里胡哨的称谓，然而早在十年前，硅谷便感受过同样的热情。当时硅谷的每个周末或者任何一座大城市都有一群人在兴奋地探讨 iOS 和 Android。十年，我们见证了移动技术的成长，改变了生活的方方面面。

十年前，之所以有那么多移动开发者涌入这个赛道，原因是安卓和 iOS 极大地简化了移动开发的工具栈，降低了手机程序应用开发的难度。回到 AI 领域，尽管在过去十多年的时间里它一直处于不断升温的状态，但实际上整个领域的 Stack 比重相当高。这意味着，如果你想开发一个完整的 AI 程序，需要在不同板块中至少选择 1-2 个项目，并将这几十个项目串成自己要做的解决方案。

大模型出现以后，工具栈变得更加简化，开发者可以在一个周末的时间做出一个不错的 demo。而这并非是天方夜谭，CVP Stack 模式就可以实现。其中，C 的意思是以 ChatGPT 为代表的大模型，它在 AI 程序中充当中央处理器的角色；V 代表 Vector Database，即以 Milvus 为代表的向量数据库，充当 embedding storage 的角色；最终会通过 prompt 的方式进行交互。

总结来看，在大模型时代下，无论你是否写过代码，只要你有一个 ChatGPT 账号、会写 prompt、找到一个 embedding 的数据库为模型提供相关领域的知识，甚至说为其提供一个缓存层，具备以上条件，你可以轻而易举地成为一个很好的工程师。举个例子，我们的同事用了两天就做出了一个ChatGPT + Milvus 向量数据库的应用，他的名字叫 OSSChat（https://osschat.io），用于解决开源项目文档冗长、不易查找等问题，目前已经支持几十个主流的开源项目，每天都有很大的访问量，用户甚至可以去生成开源项目的代码。

存储比计算更便宜，大模型也不例外

大模型更新的时间比较长，知识也具有一定的滞后性（例如 ChatGPT 的知识只停留在 2021 年底），如果用现在的数据库存储方式，可以把最新的知识提供给向量数据库，对大模型进行知识增强，可以得到更好的答案。不止如此，大模型的训练成本高昂也是不争的事实。

这次我想重点谈谈成本问题。在计算机发展史中，最经典的架构是冯·诺伊曼架构，最核心的贡献就是实现存储与计算分离，即把所有信息、所有计算归为计算问题和存储问题。存储与计算分离有各种各样的好处，传统的冯·诺伊曼架构是把信息用二进制代表，实现存储和计算分离。

大模型的本质是复杂的神经网络，在这个神经网络中任何数据的传输都需要 embedding 作为中间介质，可以说，embedding 就是传输信息的基本单元。因此，embedding 是在传统的抽象之上覆盖了一层适合 AI 或大语言模型进行语义抽象的数据表示。

而向量数据库负责的是 embedded 语义数据的存储与检索。我们要把大语言模型和向量数据库分为两个模块，就是存储与计算分离，正如冯诺伊曼架构一样。这样做的好处就是历史上存储价格永远比计算价格便宜几个数量级以上，大语言模型也不例外。假设有一个大模型可以做 100 KB Token，同样条件下，给到大语言模型运算的成本远大于做向量召回。如果这个大模型要做 1000 Token 呢？运算成本将更加昂贵。虽然大语言模型未来会有越来越大的 Token 窗口，但我们本质上不会把所有信息都分到大模型里面，且大模型不能覆盖全世界所有信息。

未来向量数据库应该会成为大语言模型存储的标配，传统的数据库之所以不适合为大模型做存储，是因为它们没有语义表达且不能提供语义存储。如果说现在有一种数据库方案和存储方案，能够提供语义检索的话，只能是向量存储。

下一个 Killer App

讲完过去一年半年的机会，我们来聊聊下一个机会是什么？

老周和轶航的对话有讲到智能体越来越被认为是下一代 Killer App，对此，我很认同。大模型还需要人不停地给予提示，智能体就是希望通过做任务和场景拆解，解决无限复杂的问题，最终实现和人一样的自我演进的能力，或者形成自己独特观点和演化的能力。

智能体需要记忆。人类的大脑有一个区域叫做海马体，负责长期记忆。记忆是人类智能很重要的部分，不可能今天把昨天的事情忘记还说自己很聪明。行业里面的正在尝试用向量数据库为智能体存储长期记忆，因为向量数据库的成本是很可控的。

未来如果每个人都能够有几十个智能体帮助我们生产生活，像向量数据库这样具有语义检索的存储市场会迎来很大的增长。Zilliz 开始做世界上第一款向量数据库的时候，内存应用场景根本不是大语言模型，更多的是图片搜索、视频搜索，包括个性化的搜索引擎，但本质上都是用神经网络做成向量嵌入。大语言模型开发门槛的降低让这个领域成为面向开发者友好的 Killer 领域，所以我们认为向量数据库这个领域未来几年将迎来快速的增长与更加庞大的市场规模。

大模型时代，未来可期，而作为大模型记忆体的向量数据库，同样值得期待！

标签：

猜你喜欢

为体育事业赋能，“墨迹天气杯” 铁人三项赛报名火热开启

桃心云手机RedHeard OS：多终端协同实现革命性云服务场景解决方案

实力夺冠！天翼云在国际AI顶会大模型挑战赛中脱颖而出

网易云音乐第七届全国校园歌手大赛开幕专业扶持助力梦想启航

OBS和Argo里藏着哪些海洋的科学奥秘？一场致敬好奇心的深海之旅在海洋二所进行

2023 GAIIC-算法挑战赛︱巅峰对决，完美收官

昆仑海岸亮相上海国际水展物联网技术赋能环保领域创新发展

聚焦行业共性难题，陈智乐现身小鹅通艺术教育行业训练营

企业培训行业如何实现数字化升级，梯队金课堂张国庆做客小鹅通直播间

致力马传染病研究助力现代马业崛起

实现碳中和三菱电机在行动

以爱之名|关注血糖健康，以品质健康好礼臻启“父亲节”

特易资讯开展2023全国巡讲·杭州站，海量数据赋能外贸企业

中国超级英雄正在诞生与崛起，“解放者联盟”系列IP展示大国风采与实力

证券时报电子报实时通过手机APP、网站免费阅读重大财经新闻资讯及上市公司公告

华为深耕基础软件开源，使能千行百业创新

618京东3C数码品类日荣耀高管为用户派送20周年定制礼盒

高性能笔记本电脑新品AMD高管送货上门 618京东联合AMD为用户送惊喜

618京东联合品牌推出20周年礼盒 OPPO高管上门送一加Ace2手机

三星电视惊艳亮相2023核聚变游戏节，展现电视产品的“硬核”游戏实力

万兴科技旗下万兴播爆推出Windows桌面端支持双端权益互通

田新远：创新引领行业 TDR构筑数字安全基石

十六城投影画质盲测活动落幕，坚果投影发布公开信

苹果如期发布XR头显，力争定义行业｜属于XR产业的新时代已然到来

腾讯云与云南大理州签署战略合作协议，共建RCEP云上跨境生态产业园

凭借“隐形自拍杆”火遍滑雪圈后，影石Insta360广州融创茂官方体验店开业迎客

歙采缤纷邀您共享！歙县文旅招商推介会在深圳举办

直击大运会：电信劳模火炬手勇攀科技创新高山

ASKO × 设计上海 | 以自然之名开启百年品牌新章

AI浪潮席卷，时空壶为何能成为AI翻译时代的破局者？

热点图片

要闻

智慧高速到智慧铁路，德冠隆在智能交通行业再续辉煌
智慧铁路发展背景近年来，国务院、交通运输部等单位围绕交通强国及交通新基建，陆续出
Hello，设计上海2023！追寻众多设计大咖，开启一场墅适生活之旅
不觉间设计上海2023已然跨入第三天，世博展览中心依然人潮涌动，三大展馆的强大阵容、
空气觉醒，日立水墅适VF领潮墅境生活空间
每个人心中都有关于理想居所的畅想。心中无界，人生有境。当墅质空间成为人们追求至臻
海信家电迎来乒乓球选手陈梦？冠军品质备受认可
冠军品质，乒出实力！6月9日，乒乓球选手陈梦刚刚结束德班世乒赛，勇夺女双冠军、女单
全球首发光效再突破华普永明超高光效LED模组正式发布并实现量产
6月10日上午10时，杭州华普永明光电股份有限公司（以下简称：华普永明）超高光效LED模
就业不迷茫！iQOO毕业季特别直播，学生购机还有更多福利
iQOO毕业季特别直播活动来了!6月12日，直播间有职场高手传授就业心得，看直播还有机会
生成式AI（AIGC）的出现，让跨境电商进入发展变革的新阶段
目前生成式AI在商业上的应用非常广泛、使用企业也很多。其商业化形式包括但不限于文本
洞察更多生命细节，几何科技携叁颂SYNSOL新品亮相KBC展会，助力居家健康管理能力再升级
2023年6月10日，第27届中国国际厨房、卫浴设施展览会(以下简称KBC厨卫展)在上海新国际
存储主控赛道究竟有何魅力？听听“黑马”英韧科技怎么说
近年来，半导体行业受到各方市场关注，而在狂飙突进的两年之后，整个行业都陷入深水区
助手中心升级上线，讯飞星火助你定制“私人管家”
各类场景，一键解决，星火小帮手来了。6月9日，讯飞星火认知大模型升级发布会召开，讯

头部大模型公司进京赶考，向量数据库成为应考神器

相关阅读

猜你喜欢

热点图片

要闻