精准学引领:全球首个开源语音端到端教育大模型问世

2024-09-11 14:24:59     来源:

近日,教育科技公司精准学对外公布了其自研的语音端到端垂直教育大模型“心流知镜-s(V02)”。可直接实现语音输入-语音输出的交互,将传统ASR+LLM+TTS带来的交互延迟降低至毫秒级。同时也更好地改善了纯文本模型损失的情感节奏等丰富信息,打造更接近真人老师级别的语音交互体验。

与此同时,公司在8月已面向全球开发者社区开放了基础模型供给学术和非商用合作伙伴。

值得注意的是,这是国内首个,也是截止目前为止全球范围内首个开源的语音端到端垂直教育大模型。

语音端到端大模型带来教育变革

当前,大模型正不断向多模态应用和垂直场景内掘潜力。基于LLM的生成式语音大模型关键在于突破语料和交互数据的障碍,打通交互壁垒。而教学教辅类赛道是重点适配场景之一。

基于教育“千人千面”的育才特征,精准学在过去六年中积累了大量个性化交互语料数据,构建在辅学场景之上的大模型能力相比于通用大模型,对于学生的语气、情绪等信息的收集和解析更为精准。此次精准学所推出的“心流知镜-s(V02)”,其端到端语音结构,将传统ASR+LLM+TTS带来的交互延迟降低至毫秒级,接近还原“真人老师”级别的自然流畅的教学体验。

同时,语音端到端大模型带来的交互模式贴合人际自然交谈,也会增强“虚拟AI老师”的个人魅力和亲和感,给到学龄儿童积极的心理感受,助力辅学教育的目标达成。

多模态开放赋能,教育垂直大模型全球掌旗

当前,通用大模型加速落地各行各业,精准学所专注的教育垂直大模型,依托垂直海量交互数据,将大模型技术优势与细分场景打通,开源语音端到端大模型落地行业应用,让中国AI大模型教育引领世界。

据了解,发布语音大模型之余,精准学还将向行业合作伙伴开放“心流知镜-s(V02)”的基础模型,以供教育、学术领域的非商用技术研究和应用。“心流知镜-s(V02)” 将成为全球范围内首个面向技术社区开发的语音端到端大模型。

从纯文本到语音的“多模态”交互,从封闭到开源赋能,精准学开源计划将对垂直大模型领域的AI Native应用落地助益深远,同时也将在全球视野里塑造教育大模型中国造的深深烙印。

9月,精准学将在阿里云栖大会上展示其最新应用。届时,用户可以在AI辅学机上实际体验这一技术突破,从产品终端感受更为自然流畅的教辅服务。

 

标签:

猜你喜欢

OceanBase杨冰:现代数据架构需要具备可扩展性、多模融合等五大特性
共筑网络安全防线:华为云统一云上云下安全防护,为企业筑牢云上“安全网”
开源网安斩获CCIA中国网络安全创新创业大赛全国总决赛三等奖
多维优化,价值深挖,360智慧商业助力招聘行业秋招季转化暴涨
2024互联网岳麓峰会举行,惠农网等共同发起“万亿中流”倡议
曼孚科技完成数亿元B++轮融资,以大模型重构人工智能生产新范式
西邮智仓再登央媒,被《人民日报》报道
共创828数字化营销新模式,ITShare“享聚”数智创新私董会(杭州站)圆满落幕
把家变成动物园?《帝国神话》国服驯养动物
绿智并举,施耐德电气赋能有色金属行业创造可持续发展影响力
828 B2B企业节:以医药大模型为抓手,华为云构筑医药新质生产力创新高地
各小众、垂直细分领域遍地开花,抖音电商成“同行者”创业沃土
森亿智能张少典:人工智能助推医疗产业应用现代化
核桃编程公益捐赠筑梦科学教育 为孩子的梦想插上科学的翅膀
星纪魅族与博士眼镜战略合作,共绘智能眼镜发展新蓝图
微博2024“人人公益节”拉开帷幕,冰桶挑战回归引发全网热“益”!
华为云开源治理策略助力企业高质量发展
L4级RoboVAN:文远&江铃携手,领跑无人驾驶新时代!
新学期启航,杭州铭师堂开学季活动精彩上线,助力学子健康成长
户外营销这件事,“野人计划”越跑越丝滑
多种嵌入式系统开发需求阻碍平台工程发挥最大价值
破解大面积场景清洁难题,普渡推出AI智能扫地机器人PUDU MT1
36岁小伙雇AI当员工,开了6家网店
科大讯飞AI开发者大赛×富光路演圆满落幕,共绘未来制造业新场景
凌云光视觉+AI加速“一键智能时代”到来
CASETiFY 全新 iPhone 16 系列:够强韧,够任性
AI实时互动方案:10分钟打造一个企业专属云上智能体
顺丰科技发布物流垂域大语言模型“丰语”,全业务流程助力顺丰小哥
面向高性能的智能制造研究与创新 是实现制造强国的唯一技术途径
800 iEMIS:完善的企业管理信息服务及系统解决方案