6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及在医疗、教育、商业等多个领域的人工智能应用,文本生成、语言理解、知识问答、逻辑推理、数学等能力完超GPT-4 Turbo,整体性能国内领先,在8个国际主流测试集中排名第一。同时面向万物互联时代,星火语音大模型再突破。
科大讯飞董事长刘庆峰在发布会现场表示:大模型给人们的工作、生活带来诸多便利的同时,也存在各家生成内容差不多、生成内容较泛、不够实用等情况,要解决这一问题,必须让大模型能基于用户画像进行个性化表达,基于使用历史进行记忆学习,基于个人资料进行增强学习。
基于此,讯飞星火APP及桌面版全新升级改版,率先发布“个人空间”,用户可以上传自己的工作、学习、生活、健康等各类资料,形成专属知识库,再结合人设,让大模型生成更个性化内容。
据公开信息显示,自去年9月份正式全民开放后,讯飞星火APP在安卓端已经累计下载1.31亿次(安卓能够统计到下载量,苹果不公布下载量)。在所有下载的大模型相关的APP中,下载量位居工具类第一。
此外在此次发布会上,科大讯飞还同步升级了星火医疗大模型,覆盖1600种常见疾病、2800种常见药品、6000种常见检查检验,满足用户在看病前、用药时、检查后的核心场景健康需求。
同时针对教育端,在业内革命性地推出星火智能批阅机,从发布会现场科大讯飞研究院院长刘聪的实操演示来看,星火智能批阅机不仅支持多学科多题型智能快速批改,原先需要90分钟才能批改完的作业,现在只要5分钟。
而且还能即时生成多维学情报告,针对班级中普遍存在的共性问题,及个体学生知识链条中存在的薄弱、缺失环节,给出详细、明确的教学建议,大幅度节省了老师批改作业及分析学情占用的时间,原先分析学情需要60分钟,现在只需1分钟。
近期,科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目,获得国家科学技术进步奖一等奖。刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。
针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,两人混叠场景准确率达到91%,三人混叠场景准确率达到85%以上,在-5dB的高噪场景,识别准确率仍能达到85%以上,远超包括whisper-V3在内的其它竞品。
基于全球领先的多语种语音识别技术,科大讯飞现场发布了软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。