{中美AI“考生”东大入学考:英语超群数学短板,能否预示AI未来?)

来源:互联网 时间: 2025-04-09 08:42:22

近期,据日经新闻披露的一项联合研究成果显示,中美两国的新型生成式人工智能(AI)已经展现出令人瞩目的学术能力,成功跨越了日本顶尖学府——东京大学理科3类入学考试的门槛。这一突破性进展是通过对比测试美国OpenAI的“o1”模型与中国AI初创企业DeepSeek的“R1”模型得出的。

测试内容涵盖了2025年度的东京大学入学考试科目,由AI初创公司Life Prompt提供答案输出,并由知名预备学校河合塾的专业讲师进行评分。结果显示,在两个基础模型的表现中,o1获得了374分,R1紧随其后,取得了369分,均超过了东大理科3类合格的最低分数线368.7分。

值得注意的是,尽管R1在理科1类和理科2类的共通考试中未能达到合格线,但在其他类别,包括文科在内,它与o1均成功“合格”。这一表现不仅展示了AI在跨学科应用上的潜力,也反映了其在学术评估中的广泛适用性。

在具体的考试科目中,英语成为了AI模型的强项。o1和R1在英语部分的得分率均超过了75%,河合塾的英语讲师久恒秀雄对此评价道:“这两个模型在英语表达上几乎没有单词和语法的错误,其水平远远超过了东大考生的平均水平。”

然而,在数学科目上,尽管AI模型能够正确解答出不少最终答案,但在图形处理和论证问题上却频繁出现论述错误和说明不足的情况。在满分为120分的理科数学考试中,o1得了38分,R1得了49分,这一成绩显著低于合格者的平均分。负责数学评分的香坂季京讲师指出:“AI在数学论证上的表现还有待提高。”

对于这一研究成果,自2011年起便致力于“机器人能否进入东京大学”项目的国立信息学研究所新井纪子教授给予了高度评价:“这是AI成长历程中的一个重要里程碑。然而,我们也必须认识到,AI有时会给出令人困惑甚至错误的答案。因此,培养能够正确判断并熟练使用AI输出的人才显得尤为重要。”

近期热点 +
  • 04-09
    公天天躁爽我爽快涨: 如何在忙碌中找到快乐的自我 在当今快节奏的社会中,许多人在忙碌的工作和生活中丧失了自我,快乐似乎成为了一种奢侈品。面对日益繁重的任务和压力,如何在这样一个环境中找到内心的宁静和快乐成为了一
  • 04-09
    反雷电将军特训,难言的挑战与热血的冒险 各位游戏迷们,你们是否已经陷入了与雷电将军的特训挑战中无法自拔?我们就来聊聊这个让人头疼不已的特训任务。一踏入这个特训关卡,你就能感受到一股强烈的电流在空气中跳
  • 04-09
    宿舍穿越时空的奇幻之旅,攻略篇 各位游戏迷们,今天要给大家带来的是一份神秘的攻略——宿舍穿越攻略!没错,你没听错,就是从我们熟悉的宿舍出发,开启一场说走就走的时空之旅,就让我带你走进这神秘的穿
  • 04-09
    百将录手游攻略,从新手到高手的蜕变之路 各位热爱策略游戏的玩家们,今天我们要聊的是当下火爆的《百将录》手游,这款游戏以其独特的武将收集、策略战斗和丰富的游戏玩法,吸引了无数玩家的目光,如何在这片战火纷
  • 04-09
    天天酷跑画中仙,如何轻松入手? 各位酷跑爱好者们,你们是否在寻找那传说中的神秘角色——画中仙?就让我们一起探索一下,在《天天酷跑》这款游戏中,如何获得这位仙气飘飘的角色。一、画中仙的魅力何在?
产业资讯 +