主页 > 生活聚焦 >中国高考数学难,人类考生拿状元、人工智慧输一分只能拿榜眼 >

中国高考数学难,人类考生拿状元、人工智慧输一分只能拿榜眼

中国高考数学难,人类考生拿状元、人工智慧输一分只能拿榜眼

这是一个普通的高考考场:考生就坐,準备就绪,开始答题。

但这又不是一个普通的高考考场:这里不够安静。在一个大约三百平方的大厅里,循环大声播放着一首钢琴曲,时不时还有女主持人和男性嘉宾的对话。大厅一排排的椅子上坐着兴奋而略带焦躁的观众,人们窃窃私语,似乎都对他的解题过程充满兴趣。

面对音乐和乾扰,考生表现出了卓越的心理素质。他全神贯注的解题,速度与质量没有受到外界的丝毫干扰。他解开每一道题的速度为 7 到 15 秒。据熟悉他的人介绍,这是他放慢了六倍的结果。

他放慢的原因是:他不仅需要把题目做对,还需要给大家展示他是如何做到的。根据高考要求,他不能直接说话。他也没有多余的手来为观众进行演算。一切只能通过礼堂前部的大屏幕来展示:左边是一个由无数蓝色光点组成的大脑,每算一道题,蓝色大脑里就会跳出若干以红色、黄色、蓝色节点构建的知识链。每个节点旁边有一行白色的字,标注着这道题涉及了哪些知识。

屏幕的右边是正在演算的题目。蓝色光标在题目末端闪烁,过一段时间打出一行字:那是他给出的答案。答案闪现的飞快,一些观众乾脆从椅子上站起来,想看清楚题目以跟上他思考的速度,但往往还没有把题目读完,就已经到了下一道题。

时间开始是六点四十:这比高考要晚了近五个小时。不过,在这场为他专门準备的考试里,才开始了不到八分钟,而他已经快把题目做完了。

最终,他答完了题。用时 9 分 47 秒。几乎在他答完题目的同时,在两千公里外的成都,另一个与它类似的考生,也已完成了题目。他们使用相似的屏幕输出,做一样的北京市高考数学卷,只不过那一位成都的考生用时要比他稍长些:22 分钟。

经过数学特级老师、奥赛教练韩兆勇的评审,他的分数最终公布:134 分。

为了衡量这个分数的价值,有三组高考状元陪他一起进行测试:状元一组得分,119 分。状元二组得分,140 分。状元三组得分,146 分。最终结果是,他的分数以 1 分之差,惜败于最精英的人类「做题家」。(《TO》备注:应是有六名人类状元组,平均起来赢 1 分。)

在另外一边, 成都的考生也得出了结果。它的成绩是 105 分。这一分数不如北京的考生一样显眼。但对他而言,无疑仍是个的进步——仅四个月前,它的成绩只有 93 分。4 个月的时间里,他就提升了 12 分。

这是两位特殊的考生,正是中国历史上,第一次正式参加高考的人工智能。北京的「考生」是学霸君推出的智能教育机器人 Aidam,而成都的「考生」则是由成都準星云学科技有限公司开发的人工智能係统 AI-Maths 。在恢复高考的第四十年,他们来了。

中国高考数学难,人类考生拿状元、人工智慧输一分只能拿榜眼

为何要让人工智能参与高考?人工智能有可能通过高考吗?

在李世石和柯洁先后惨败于围棋 AI Alpha go 之后,「人机大战」成为了许多媒体在报导机器人的过程中常常出现的词语。或许由于此,在机器人宣布参与高考之后,网民的评论也日趋两极化。一种声音认为,人工智能参与高考,很可能是在「蹭 Alphago 的热度」, 或是认为人工智能进行高考,如计算器计算数学题,有何意义? 而更多的人,即便承认人工智能参与高考有价值,也认为以高考的难度,人工智能要获取好成绩,仍属不可能。

甚至在知乎「如何评价国产机器人将参加 2017 年高考?」问题下,有一个高票答案断言「当今人工智能的发展,机器是不可能在非西藏,新疆等省份考入一本的,在新疆西藏考文科还有个一搏,理科是会死路一条。」对数学的估计是「估计 60~80 比较靠谱」。

在两位人工智能参与高考的前一天(6 月 6 日),科大讯飞轮值总裁吴晓如及讯飞研究院院长胡国平接受媒体採访,对这些问题做出了回应。

据吴晓如披露的内容和相关资料综合,机器人参加高考,并不是所谓的「人机大战」后才出现的噱头。在国家层面,「高考机器人」是国家 863 计划信息技术领域「基于大数据的类人智能关键技术与系统」项目的重要研究目标之一。该项目由科大讯飞联合 30 多家科研院校和企业共同参与,早在 2015 年便已立项。

「高考机器人」有多方面的意义:聚集国内的一些比较顶级的研究机构和科学家,一起来攻关现在人工智能领域相关的一些重要的技术问题;替代传统测试人工智能水平的「图灵测试」,全方面测试和应用与人工智能相关的多个领域;最后将这些领域攻关所取得的技术成果,运用到相关行业和领域,如翻译和车载控制等。

目前「高考机器人」仍在开发和完善之中,要 2019 年才会正式参加考试。但今年参与考试的「考生」之一準星云学 AI-Maths ,与该项目有着密切关係。资料显示,準星云学的核心团队于 2015 年参与了「基于大数据的类人智能关键技术与系统」,并主导子课题“ 初等数学问题求解关键技术及系统” 。后者正是 AI-Maths 技术的重要来源。同时,準星云学还拥有智能推理解题判卷技术,即将数学知识体系全部串联成知识网,能够像人类一样逐步思考、推理,最终对解题过程进行判定。

而另一个「考生」Aidam,则来源于学霸君。以拍照搜题为最初产品的学霸君,其产品已经有 6000 万注册用户,答题搜索次数超过 60 亿,老师在线答疑超过 500 万次。

这一庞大的题库和数据积累为 Aidam 的发展打下了基础,「我发现,原来在我们的题库里面我们记录了大量的关于状态之间可跳转、可推演、可演算、可关联的信息。」

两位机器人考生,两种不同思路

在讲解 Aidam 的背后逻辑的时候,学霸君的首席科学家陈锐锋使用了围棋作为比喻。类似于围棋棋盘可以被分为无数横轴和纵轴。人的思维模式和解题模式也可以被具象为棋子,棋子的纵轴与横轴分别代表起始的状态和下一步的状态,这样,每一次题目的可能解法,就相当于在一个庞大思维矩阵里下棋的过程。而学霸君此前积累的庞大的题库与数据记录,恰恰类似于无数张围棋棋谱,为人工智能自主学习提供了可能性。

儘管目标类似,但不同的背景决定了二者的不同的解题思路,甚至在一定程度上截然相反:準星云学的 AI-Maths 与 863 计划的高考机器人的思路一致,强调「不联网、不连接题库、无人工参与」。

在只有少量训练样本的情况(只有约 500 套试卷、1 万道题的训练量)以机器建立类似人类的複杂逻辑推理能力与联想能力。试图让机器在较少样本和较少资源耗费的情况下,拥有「举一反三」能力。

而学霸君的思路则强调大题库(已经有超过 7000 万的巨大题库),通过海量的题库,用户行为数据,以及 Ai 自我博弈,从海量题目中找到适合共通的知识元件和解题模式。从某种角度说,这两种模式的区别类似于 Alphago 早期版本的学习过程,计算机可以通过规则自己对弈,也可以学习棋谱。从此前的测试中看,Aidam 的成绩要好于 AI-Maths, 但如果以纯粹人工智能的难度和多行业的延展性,AI-Maths 要略高一筹 。

中国高考数学难,人类考生拿状元、人工智慧输一分只能拿榜眼

理解数字很简单,不过要「看懂」考卷却很难

不过,儘管距离人类只有「1 分之隔」,但无论是 AI-Maths 还是 Aidam ,仍然有很长的路要走。

在四个月前的那次首次亮相中,AI-Maths 仅得了 93 分。事后,準星云学 CEO 林辉在接受记者採访时,认为它失分的重要原因来源于「无法理解题意」,它们缺乏人类生活的常识,它们无法理解「投资」、「理财」这些概念。

在现场,AI-Maths 的研究人员举了一个例子:它可能能够解决複杂的数学问题, 因为 1-9 的数字对它理解起来非常很容易。但是人工智能要理解「苹果是什幺」却很难 ,因为一个具象苹果,需要非常多的描述。人类可以从小从生活经验里习得,而 AI 则不能。这也导致了,在语言相对更複杂,概念更多的应用题领域,AI 的难度要比人类解题大得多。

仅在解决「如何将几何语言转化为机器语言」这一难题上,开发者就花费了整整一年的时间。此次的题目也是由人手工输入,在一定程度上降低了 AI 解读的难度。

但从整个 AI 行业而看, AI 对语言的理解,乃至对于主观题的判断,又比人们设想的更加迅速。据吴晓如在访谈中介绍,目前科大讯飞的智能阅卷产品,已经可以实现对主观题,甚至对语文、英文的这样一个作文题都可以实现自动的评分,包括给出详细批语,甚至可以对学生们用的好的一些优秀的排比句,和名人名言给予针对性的鼓励和评点。

另一方面,微软小冰在 2017 年 5 月 19 日出版的诗集《阳光失了玻璃窗》获得好评,被认为比起去年的高考作文有了很大的进步。

从以往的技术发展进度看。人工智能从第一次走进高考考场,到最终攻克应用题和语义理解难关,获取较为优异的高考的各科分数,到最后考入清华和北大,只是时间问题。 或许真正的问题是,之后人们如何与人工智能相处,乃至借助 AI 的力量,让教育变得更有质量、更个性化,也更加公平 。

例如此次的两家公司:学霸君和準星云学,其技术都包括了自动批改、智能评测、学习诊断等功能,这也逐渐成为目前的「AI + 教育」类产品的标配。

这不禁让人联想,2017 年 6 月 8 日,是中国恢复高考制度 40 週年。这 40 年,高考制度成功的打破了原有的社会壁垒,改写了无数中国人的命运。那幺下一代,AI 走入教室和考场,是不是能改变人的命运?

——

如何面对恐惧?艾玛华森:接受它,别让它阻止你说想说的话

如何面对恐惧?艾玛华森:接受它,别让它阻止你说想说的话

艾玛华森,联合国妇女署全球亲善大使、英国演员她不只是《哈利波特》中的小妙丽、或是时尚精品的模特儿,三

如何面对父母的期待?我不改变你们,也请你们尊重我的想法

如何面对父母的期待?我不改变你们,也请你们尊重我的想法

面对父母的期待,水面上与水面下剧团艺术总监张嘉容想告诉你,也许我们不必期待父母的赞同,应该学习为自己

如何面对生活中遇到的无礼之人?

如何面对生活中遇到的无礼之人?

用优雅,征服这野蛮的世界! 一个人真正的强大,不是知道该如何反击,而是懂得在微笑中优雅回应,以行动

如何面对超高龄的现在式?Vision2025高龄趋势论坛

如何面对超高龄的现在式?Vision2025高龄趋势论坛

面对全球高龄化趋势与台湾超高龄社会来到,高龄问题不应该只是卫生福利单位的任务,而是所有政策、所有产业