大模型不仅要能用,还要好用、易用,什么样的大模型,能够真正让大家玩起来,用起来?
根据国家互联网信息办公室发布的《生成式人工智能服务已备案信息》,截止至今年 3 月,我国已有 117 家大模型成功备案。
除了部分面向 B 端的行业大模型之外,过去一年,不少通用大模型已经开始面向 C 端提供服务,诸如科大讯飞的讯飞星火、百度的文心一言、字节跳动的豆包、月之暗面的 Kimi 等诸多大模型应用都已在应用商城上架。
如此众多的大模型产品,到底哪款才更好用、更易用、更受用户欢迎?
市面上关于大模型的评测榜单五花八门,但这些榜单的评判标准不同、测试纬度不一,添加了太多限制条件,很难真正比较出大模型易用与否。
应用的下载量或许是最直接的指标,能够直观反映出用户的喜爱程度。据七麦数据显示,截止至今日,讯飞星火APP在安卓端的下载量已经超过9600万次,在国内工具类通用大模型APP中排名第一;星火 APP 在苹果 App Store 上的评论和打分也在国内同行中领先,星火 APP 的用户规模稳居行业第一阵营,广受用户欢迎。
为什么讯飞星火可以在一众大模型应用中脱颖而出?科大讯飞做对了什么?
模型底座能力是基础。讯飞星火今年更新的 V3.5 版本是首个基于全国产化算力平台“飞星一号”训练的全民开放大模型,整体能力接近 GPT-4 Turbo,语言理解、数学能力均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。
但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道如何使用大模型这一痛点,就上线了星火助手功能,可以一键生成专属于自己的个性化 AI 助手,甚至还可以直接对外发布,人人可用。
在星火 APP 的助手页面,你可以看到各式各样的 AI 助手,有工作场景的,比如 PPT 大纲助手,SWOT 分析助手,周报助手甚至是小红书文案助手;也有服务于编程的,Python、C++、java 等等编程语言应有尽有;趣味性的助手更多了,高情商助手、电影剧情大事、废话文学乃至冷笑话助手,让你能用也能玩。
时下大热的长文本功能讯飞星火也没错过,甚至比同类产品更进一步。科大讯飞 4 月 26 日发布的讯飞星火 V3.5 更新版本中,除了支持长文本,还支持长语音、长图文,这是业内首个同时支持长文本、长图文及长语音的大模型产品。不仅可以解决文字性的内容的整理,你在工作学习中随手拍的会议纪要、PPT照片乃至课堂录音等都可以发给讯飞星火。讯飞星火还针对性地推出了星火合同助手和科研助手,解决用户在工作生活场景中的刚需痛点。
科大讯飞董事长刘庆峰表示,一段时间以来,讯飞星火的开发者和用户都高度关注知识的获取和学习问题。在这个过程中和不仅要解决长文本的问题,能够把各种信息来源的海量文本快速的学习和问答,特别重要的还是在各种企业和专业行业应用的准确率问题,尤其在金融、在汽车、在政务等等非常关键的领域,大模型的回答要足够准确。
更关键的是,在保证准确的基础上,讯飞的长文本能力同时兼顾了效率问题。基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都是业界最优的。
生活中,打工人遇到租房合同时经常头大,讯飞星火的长文本能力不仅可以上传电子合同,还可以实现随手拍纸质合同,一键帮你审核合同漏洞风险。讯飞星火赋能的的合同助手,可以实现风险审核、合同比对、摘要总结以及合同生成等功能。生活中遇到纠纷问题,也可以先问问“星火法律咨询”助手,工作中遇到暴力裁员应当如何应对?过年期间劝酒违法吗?这些疑问讯飞星火都能给出专业的法律解答。
专业能力过关,讯飞星火同时更有温度。早在今年 1 月,讯飞星火就首发了超拟人合成语音功能,让 AI 不再是冷冰冰的播音腔,同时具备超强的情绪感知能力,能像“知冷知热”的朋友一样带入情感互动,更具人情味。
这一技术的提升背后不仅得益于讯飞星火V3.5在语义理解、指令跟随和多轮对话的演示中展现的优异能力,还有在情绪感知和拟人合成方面的出色表现。
讯飞星火 V3.5 此次的更新版本中,这一功能再度加强,首发多情感超拟人合成功能,进一步提升了合成声音中情绪表达感知能力,情绪可感知度达到 85%以上,可以实现包括高兴、抱歉、安慰、撒娇、困惑等多种情感语气表达。
正如刘庆峰说,“技术在不断的进步,我们希望在安全可控的前提下,能够带来这个社会更有温度的人工智能的体验,能够真的帮助到那些特别需要帮助的人。今天这个世界更需要有温度的科技。”
不仅能用,还要好用、易用,这或许才是部分大模型应用在同质化竞争中脱颖而出的关键因素。科技不是冷冰冰的存在,AI 时代的科技更要能力与温度兼顾,方能收获大众的欢迎。