数据是AI的根基
最近半年,行业非常火的一个主题是生成式AI大模型。现在我们已经步入了智能化时代,AI一词在过去十年里被提到很多次,今天大模型的算法、神经网络在三十年前就提出来了,只不过今天的算力等各方面在非常快速地进化,给我们产生了更多机会。
回归到进化主题,从1980年左右,我们整体经历了六个不同的IT进化阶段。
首先是80年代(中国是90年代),个人电脑的出现给每个人带来巨大赋能。当时我买了第一台个人PC,上面有Office等各种软件,专业人士就获得了计算能力,只不过在当时只有少部分人有,估计全球也只有不到1亿的人能使用个人电脑。
90年代开始出现互联网,那时候还是PC互联网,让人类有机会接触历史中产生的各种信息。以前获取信息是非常困难的,查一个电话号码还要找非常厚的电话簿。
同时,互联网还给我们带来一个巨大的机会,就是人与人之间的沟通与交流变得非常便利,以前人与人交流,特别是远程只能打打电话,当时打电话还非常贵。有了互联网以后,我们可以随时随地打电话,线上交流变得无所不在。
到了2008年、2009年以苹果为代表的智能手机出现了,把以前PC给我们这些科技从业者的“特权”变得普惠普世,每个人在任何时间、任何地点都能享受科技带来的信息红利。
移动时代之后是云计算的出现,企业的系统能24小时在线,处在全球各个角落的每一个专业人员都能连接自己的系统与服务器。
以前在数据仓库中,如果不在内网或机房附近,流程相对来说是封闭与断裂的,有了云以后,特别是企业服务软件的出现,让企业和员工在任何时间地点都能办公。
我们现在在讨论的AI时代要结合硬件IoT来看,这个时代在中国至少扎实落地四五年时间了,只不过今天生成式AI给我们带来的期待太大了。
再下边是元宇宙、虚拟人阶段。Facebook在这个领域投了很多钱,甚至把自己公司名改成了Meta,但前两天我见了几个投资人,他们说元宇宙现在太早了,把每个人的生活完全搬到线上,将整个人虚拟化还需要一些时间。
经历了这六个时代,加上过去七八年的创业积累,我们发现今天所有生成式AI的根基还是数据。
AI降低技术门槛,推动数据普惠
人类历史的发展,让我们现在有了海量数据。数据的类型不外乎为:文本、代码、图像、语音、视频,还有虚拟现实、3D场景的构建。
这些数据通过AI加持形成了很多业务场景。
比如在文本上,我们可以用文本进行营销内容的运营,帮助销售提升效率,帮助客服更好理解客户需求,进行更个性化的服务。
在图像上,现在很多营销创意可以直接通过生成式AI来形成,你可以让AI画一幅莫奈和张大千结合的画,再结合营销热点,很快进行推广营销。而以前我们需要雇佣大量设计师,通过各种软件来绘制图像。
在语音上,前几天孙燕姿刚发布了一个文章,谈自己怎么看AI孙燕姿将AI和自己结合在线上唱歌。以前歌曲创作需要大量制作人,现在将AI和歌手结合已经形成一种新的娱乐现象。
在代码上,过去20年我一直做数据分析方面的工作,数据库有一种语言是SQL,分析师和数开工程师通过写SQL的方式进行数据分析。
但今天你直接对AI说一段话,比如有一个数据库,有两张表,字段是什么,我想知道销售业绩和平均客单价,然后AI就会写一段代码出来。
我个人认为生成式AI写的代码水平跟有两年工作经验的数据分析师差不多,非常干净、逻辑条理清晰,代码规范比普通人写得更好。
因为底层有了海量数据,今天通过新的AI加持会产生更多变化,所以这其中有很多创造价值的机会。
回到我们公司,在数据上,我们奇点云有一个愿景是数据普惠,行在和我在创业的时候都希望将以前只有超大型科技企业才具备的数据分析或洞察的能力,带给更多企业。
一直以来,GrowingIO和奇点云的产品团队在努力将软件设计得越来越简单易用。过去我们已经将数据的处理分析在无代码化、低代码化上做了很多工作,下面AI加持下产品会有更多无代码、低代码能力出现。
因此我们对领域专家和行业专家的门槛要求会降低,再往前看数据应用场景会大幅增加。
以前我们需要雇很多数据科学家、资深数仓工程师,或是资深数据分析师来帮助很多企业工作。今天技术门槛降低了,有了更多使用数据的场景,就可以让数据的价值做到普惠。