7月26日,教育科技公司网易有道(NYSE: DAO)举办了“powered by 子曰”教育大模型应用成果发布会。会上重磅推出了国内首个教育领域垂直大模型“子曰”,并发布了基于“子曰”大模型研发的六大创新应用——“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”。
“一个好的技术有没有价值、能不能发挥巨大的作用,很多时候关键在场景和应用的选择以及细节的打磨。通过软件、硬件、AI技术的结合,做出精品是我们现在做的事”。发布会现场,网易有道CEO周枫多次强调“场景拉动”的重要性。他表示,“子曰”大模型在教育行业的应用,不仅可以帮助学生更好地学习,也可以帮助老师更好地教学,借此实现因材施教的教育理想。
国内首个教育大模型“子曰” :引领教育个性化革命
作为国内领先的教育科技公司,网易有道深刻地认识到AI大模型正在为各行各业带来新的可能,并将颠覆性地改变教育的面貌。
大模型的出现能给教育带来的最大机会是什么?
周枫在发布会上表示:“我认为,是助力因材施教”。据介绍,之所以叫‘子曰’,是因为孔子是我国的教育先贤,又是因材施教教育理念的奠基者。‘夫子教人,各因其材’,我们希望子曰大模型可以朝着这样的教育理想去做。”
周枫向在场观众分享了大模型“因材施教”的三大优势。首先,大模型能为学生提供个性化的分析和指导;其次,大模型能够实现引导式学习,与教师一样,提出问题并引导学生自行探索答案;最后,大模型具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容,大模型能随时满足学生的动态需求,帮助孩子培养更综合的能力。
相比于通用大模型,“子曰”大模型从一开始就定位为是一个“场景为先”的教育垂类大模型。它能够作为基座模型支持诸多下游任务,向所有下游场景提供语义理解、知识表达等基础能力。基于此,有道研发团队在“子曰”大模型的基础上,为不同学习场景设计了定制化的模型,以实现模型与场景的高度契合。
“我们的目标很明确,就是以实际的教育场景驱动,用技术创新助力教育创新。”周枫表示,希望技术和产品的深度融合,可以根据学⽣不同能⼒和需求,提供因人而异的个性化教学。
六大创新成果发布,虚拟人口语教练惊艳现场
在发布会上,网易有道展示了“子曰”大模型在多个场景中的应用成果,覆盖口语训练、作文批改、习题答疑等六大教育的细分领域,充分展现了“子曰”大模型在自然语言处理领域的技术实力和教育领域的广泛应用前景。
最为瞩目的便是大模型时代的英语口语练习神器——虚拟人口语教练Hi Echo。
发布会现场,有道词典业务负责人与 Echo 进行了多组随机对话。Echo 能迅速理解场景和上下文,并给出迅速反馈。她的面部表情和口型生动而自然,发音也非常地道,重音、弱读、升降调等细节处理得非常到位,现场观众纷纷赞叹。
在对话过程中,Echo能够像真人老师一样循循善诱,启发式进行对话引导,还能进行实时反馈。对话结束后,Echo会从发音、语法等维度给予建议和润色,能有效解决长期困扰英语口语学习者无话可说、不知从何说起、害怕说错等问题。
“中国人在说英语时往往面临开口难、不敢说、不知道该从何说起的困境,其中的关键就在于缺乏语言环境。” 有道词典业务负责人表示,Echo恰恰能为用户带来这种真正贴合实际的“语境”,帮助他们更好地练习英语口语。
场景驱动、技术赋能,有道不仅关注用户在英语学习中“不敢开口说英语”的痛点,还覆盖了多种学习场景,借助“子曰”大模型的支持为用户提供多种高效学习方案。
例如,在写英语作业时,学生们不仅有解决具体问题的需求,还需要学会举一反三。 “子曰”大模型赋能的“语法精讲”功能可以为学生提供针对性的解题思路和方法,还能推荐同类型的考题,帮助学生触类旁通,真正理解考纲中的考点。
此外,有道在发布会上推出的“AI作文指导”应用不仅具备“作文批改”功能,还具备“作文指导”功能。据介绍,该应用旨在解决“学生不会写”和“老师没时间改”的问题。针对学生在写作、前、中后过程中面临的题目主旨难确定、写作素材匮乏等难题,该应用都能够给予指导,帮助学生“下笔如有神”。批改环节中,AI作文指导还会从表达、结构、内容深度、情感丰富度四大维度全面提供改进建议。
场景拉动,“AI+教育”技术沉淀与创新
不难发现,网易有道在策略上的关键词是“场景拉动”——依托在智能学习领域的深耕,积累了很多教育领域的业务数据和理解。通过深入调研和分析用户在不同场景下的需求,网易有道成功利用大模型的力量,在教育领域打造了诸如虚拟人口语教练、语法精讲、AI 写作指导等丰富的解决方案。这一策略不仅体现了网易有道对教育场景的深入理解,还为用户提供了更加个性化和高效的学习体验。
为什么有道能做成教育行业首个垂直大模型,成为国内率先将AIGC技术落地到教育场景内的企业?高光的背后,是多年来的技术积累与产品布局。
早在2008年,有道就推出自主研发的国内首家统计机器翻译线上引擎。经过15年技术迭代,有道神经网络翻译(NMT)已经进化成行业领先的“最强大脑”。根据QUESTMOBILE最新数据,到目前有道词典月活用户已经超过1亿,是国内词典翻译市场的第一名。
从2016年开始,有道协同构建AI基础能力,同步组建语言、视觉、声音等团队,目前积累了有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算(HPC)四大底层技术能力。
自2017年,有道就与主流技术Transformer“双向奔赴”,将AI能力统一在大模型之下,并尤其重视在端侧的落地应用。有道词典笔2代2019年首次搭载离线Transformer NMT。2022年,有道词典笔P5中搭载了自研的离线ASR,也已升级为Transformer技术。技术的持续赋能奠定了有道学习硬件在行业内的领先地位。
底层技术不断革新的同时,有道还在不断研发细分场景下的“黑科技”。如虚拟人口语教练实现语音识别能力、虚拟人驱动技术和内容生成和对话能力等多项技术能力的突破。
例如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让Echo在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者,不仅能判断用户说话的起始,还能让用户随时打断,智能触发后续流程。
在AI虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,实时驱动虚拟人的面部表情和语音同步的口型变化,使虚拟人能够贴近真人,以更加自然和生动的方式与用户一对一交互,从而显著提升对话的真实感和用户体验。
在当下大模型浪潮中,网易有道凭借其对教育场景的深入理解和对商业化的理性思考,为行业树立了垂直大模型的典范。