在当今这个充满变革的时代,人工智能正以前所未有的速度推动着各行业的发展。而在这一变革中,大模型扮演着至关重要的角色。但企业在选择大模型时,往往会陷入困惑,是参数越大越好吗?企业应该选择什么样的大模型呢?猎豹移动董事长兼CEO、猎户星空董事长傅盛给出了他的见解。
在猎户星空为企业应用大模型做服务过程中,有客户就询问能不能帮助做私有化部署。比如其中一家是某地方的政务客户,主要是希望通过AI大模型服务老百姓,回答诸如公积金、社保等问题。因为涉及到数据安全,对于使用公有大模型心怀疑虑。
在不少人看来,大模型参数越大,智能效果越好,千亿参数大模型自然比小参数量的大模型更好用。但是,一个千亿参数大模型一年私有化授权费用动辄几千万。如果用它私有化部署以后,光买服务器让他跑起来,最低成本就要160万元。客户们使用大模型,原本的目标就是降本增效。如果,光部署服务器就需要巨大的费用,这显然与初衷背道而驰。
“我们其实就想用大模型做一个客服,一年要投个几千万那划不来。”客户的负责人反馈说,再高深的技术,最后都得算账,有没有又便宜又不损失性能的方案。
这也给了傅盛启发,千亿参数可以涌现智能,百亿参数可不可以呢?百亿参数的智能在有一些情况可不可用呢?
2023年2月,LLaMA的出现让instructiontuning(对指令进行调优,以改善技术系统的性能和效率)这个方向变得火热。3月,Alpaca又让大家看到从成熟的模型 distill(蒸馏,将大模型的学习结果,作为小模型的学习目标)小模型成为还不错的 ChatBot 的可能性,从而引发LlaMa系(羊驼系)模型寒武纪大爆发,小参数模型的性能快速崛起。而在一些评测级上,百亿参数在某一些能力上已经接近了GPT,千亿参数不再是唯一选择。
随着开源社区的出现,猎户星空也更加坚定了自己的思路,聚焦百亿参数,强化微调套件,结合自身服务能力,最终发现,用百亿参数的模型,加上客户的私有数据,再加应用的打磨,在专业领域问题的问答上,就可以达到甚至大于千亿参数大模型的结果。
傅盛认为,企业在选择大模型时,首先要考虑的是大模型的实用性。不能仅仅看其参数大小,更要关注其在实际应用中的效果。因为,只有真正能够解决企业实际问题的模型,才是有价值的模型。