九章大模型“高考数学”表现亮眼:客观题正确率超90%

2025-06-09 10:47:47     来源:

2025年高考刚刚落下帷幕,考生们还在紧张等待成绩。人工智能的“考生”们交出的答卷也成为社会和技术领域的关注热点。

在高考中,数学则是最能体现大模型推理能力的学科。以教育垂类最有代表性的大模型为例,用学而思旗下的九章大模型针对2025年高考数学全国卷(Ⅰ卷、Ⅱ卷)的选择题和填空题进行测试,结果显示:在Ⅰ卷的14道选择填空题中,九章大模型答对12道;在Ⅱ卷的14道选择填空题中,更是全部答对,展现出强大的逻辑推理和数学计算能力。

值得说明的是,测试聚焦于选择题和填空题,这两类题型有明确的客观答案,便于评估AI的准确率;而解答题、证明题涉及步骤分、逻辑表述等主观评分因素,对于AI输出结果的判断存在差异,因此未纳入本次测试范围。

正确率超90%,AI得分能超不少考生

整体情况如图,在两套全国试卷中的28道选择题中,九章大模型做错了全国Ⅰ卷的6、9两题,在共28道主观题当中,共做对26题,整体正确率约93%。

值得一提的是,单选、多选的最后一题一般为该题型下最难的题目,大模型也都顺利完成了思考和计算,给出正确答案:

正确率高,教育大模型的“解题规范”也在提升

除了答题正确率,九章大模型在公式书写规范性、解题思路清晰度等方面也表现优异。

以文本输出见长的大模型,在面对数学公式、特殊符号的表达时,往往会采用"代偿性表述"——例如用"a的平方加b的平方"代替"a²+b²"。而九章大模型作为教育垂类专用模型,其训练数据中包含了大量教材、教辅资料的专业表达,使得它在输出时能直接使用数学符号。

这种专业性的背后,是模型对教育场景的深度适配。九章大模型在解答后会附加"考点分析"和"易错点提示”,这种结合知识图谱的结构化输出,更接近学生和老师使用大模型辅助学习的真实场景。教育领域的AI不仅要"做对题",更要"讲好题",更可以实现根据学生薄弱点,针对性地讲题、训练的“精准学”。

AI如何赋能教育?专家:目前更适合做“超级辅导老师”

大模型在高考解题上表现出色,但AI的价值当然不是“高考刷分”,而是利用AI技术更好地赋能学习场景。

专家认为,目前大模型在限定领域的客观题上表现优秀,但在开放性、创造性题目上仍有很大空间。现阶段AI赋能教育的体现,更多是在对老师的教学辅助和对学生的个性化学习辅导上。

随着大模型的数据挑战结果不断突破,教育智能化趋势加速。随着大模型产品进一步优化模型在复杂推理、多模态交互等方面的能力,“答题工具”向“学习伙伴”也将加速实现。

 

标签:

猜你喜欢

六大国产大模型高考作文实测:讯飞星火夺冠
全国爱眼日 | 大明眼镜专业验光师送上护眼"锦囊"
全国爱眼日 天马在行动:五大维度定义护眼“好屏”新标准
天马独供屏!苹果HomePod下周公开
【招募令】四九城的声,混不吝的劲:“音悦家”宝华韦健&马兰士全国体验会北京站预告
赠梦者——来看看小艺写的高考作文能得多少分
全国产AI的胜利:六家主流大模型写高考作文,讯飞星火实测第一
小艺深度解题智能体上线!AI互动讲解层层引导答高考作文
GAITC 2025:曙光AI基础设施全栈亮相
深化生物科技与医美医疗创新联动,巴西代表团上海访问圆满结束
2025高考语文解析:固本培元,以文育人!高考改革深入推进,水手S300以科技力量实现精准备考
京东PLUS会员日开启:会员可领超3000元超级补贴,苹果系列产品低至5.4折起
在时光中诠释空气契约 约克VRF中央空调首秀“设计上海”
研发、量产、迭代循环,福瑞泰克精准卡位“技术平权”窗口期
6月9日锁定京东3C数码采销直播间 专家带来志愿填报干货讲解
科脉云帆驱动数字革新,赋能零售供应链高效协同荣膺金翼奖
海归海餐饮集团抖音探索“精致餐饮”经营之道,双月直播GMV环比增159%
《三国:谋定天下》一周年庆典将启:明星主播齐聚 豪礼福利加码!
京东发布2025年企业办公采购趋势:智能化、数字化、多场景化、国产化成主流
2025天枢杯青少年AI安全创新大赛颁奖仪式成功举办
2025年耳夹式耳机推荐及选购攻略,从百元到千元的声学盛宴
大卫·贝克汉姆空降上海:宝华韦健以本真之声,续写经典永恒
破解餐饮企业工伤困局,今元集团旗下「康康ODS」提供智能风控保障
官宣!华为云618焕新季正式开启,中小企业AI智选华为云
龙环汇丰全国城市服务中心:深耕客户需求,打造金融服务新标杆
鸿日山海跑 鸿日汽车集团三十周年庆圆满举办
浙商“AI+”TOP100榜单揭晓,“杭州六小龙”领衔!下一批龙呼之欲出?
BCS2025国际关键信息基础设施网络安全论坛在澳门隆重举行
从水风险管控到循环经济:TCL科技构建水资源管理全链条
传神语联任度·归藏大模型发布:深度学习决定起点,长期记忆定义终局