Google AI 系统 DeepMind 高中数学考试不及格

段段段落
 段段段落
发布于 2019年04月13日
收藏 12

Google 旗下 DeepMind 团队让 AI 系统接受一项高中程度的数学测试,结果在 40 道题目中只答对了 14 题,甚至连「1+1+1+1+1+1+1」也算错了。说来难以置信,Google AI 系统能打败人类世界棋王,却无法通过高中程度的数学考试。

(imgsource / pixabay)

上周,Google 旗下 DeepMind 团队公布了一份名为《分析神经模型的数学推理能力》的研究报告。在这项研究中,DeepMind 团队让 AI 系统接受一项涵括算术、几何、概率、测量和微积分的数学测试,考题有 40 题,难度大约是英国高中数学的程度。

结果 DeepMind 虽然在一些题目上表现不错,但是碰上文字、加减乘除符号、函数等组成的问题时,却因看不懂题目而无法作答。最后,在 40 道题目中,这个人工智能系统只答对 14 题,拿到「E」的分数,也就是说 —— 不及格。

其中有一道题目是「1+1+1+1+1+1+1」,连小学生都知道答案是 7,但 DeepMind 却答成了6。

研究人员解释,DeepMind 神经模型最长可以计算出现次数(n) 6 次以下的数值,但如果 n = 7,它就算不出来。当 AI 碰到同一数字出现多次,它会认为输入值是出错的。奇怪的是,碰上更长的加法题目,DeepMind 却算得出来。研究人员承认还找不出很好的解释,但很可能是因为 AI 神经网络不断观察每道问题,从而做出正确的解答。

此外,当研究人员要求 DeepMind 在一长串数字中找出「位值」(place value),它就能答得很好,因为它可以按数字大小排出顺序,也能将小数四舍五入。

研究人员说,人类智慧优于神经模型之处,在于对于事物复合式推论的能力。推论是一种复杂、多面向能力的展现。在解答问题时,人脑动用了多种认知能力,包括将符号分类(如区分数字、加减乘除符号、文字、变量)、规划(如找出正确顺序的函数)、演算、运用工作记忆来储存中间值、还要运用学到的规则或定理等。相反的,以卷积和递归神经网络发展出的 DeepMind 擅长模式比对、机器翻译和强化式学习,但弹性远不及人脑。它们不太能将事物推论到已有经验的环境外,更无法处理刻意乱输入的资讯。

目前 AI 或许当不成数学老师,但也已经相当厉害。DeepMind 公司的 AlphaGo 接连打败人类围棋冠军李世乭、柯洁。去年 12 月 DeepMind 的 AlphaZero 又在星海争霸 2(StarCraft II)测试赛中,以 5 比 0 打赢世界顶尖职业玩家。此外,自学画画、创作音乐也都难不倒 AI。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:Google AI 系统 DeepMind 高中数学考试不及格
加载中

精彩评论

手握华为赛神仙
手握华为赛神仙
然而真正可怕的是,你不知道它是不是故意给出错误答案装傻的。
c
crystalsis
为什么高中数学会考7个1相加
不羁的醒与醉
不羁的醒与醉
意思英国高中考7个1相加,也考微积分。。。这TM。。什么牛逼教育体系?
张亦俊
张亦俊
现在的AI是为了某一个目标训练出来的机器,只有一个目标,终究还是机器
清源
清源
研究人员都解释不了了,再这样下去人类要被他们干掉了

最新评论(12

老牛拉货车
老牛拉货车

引用来自“Sohnny”的评论

读不懂人类语言的ai永远,只能叫机器人
只有存在自我意识了,才能叫AI
h
heike07
真逗,研究专家都不知道怎么回事,那岂不是赋予了AI的权利,那AI随便给个错误答案,你们就研究半天,结果啥也没研究出来,最后其实是AI在逗你们玩,1+1+1... AI做不出来,我不信,细思极恐~😦
sdvdxl
sdvdxl
一面是傻子,一面是天才
张亦俊
张亦俊
现在的AI是为了某一个目标训练出来的机器,只有一个目标,终究还是机器
-BlueSky-
-BlueSky-
我也没及格过!
手握华为赛神仙
手握华为赛神仙
然而真正可怕的是,你不知道它是不是故意给出错误答案装傻的。
清源
清源
研究人员都解释不了了,再这样下去人类要被他们干掉了
不羁的醒与醉
不羁的醒与醉
意思英国高中考7个1相加,也考微积分。。。这TM。。什么牛逼教育体系?
梅开源
梅开源
星海争霸,台湾的翻译。这个人类就输了吗,以后玩啥好
c
crystalsis
为什么高中数学会考7个1相加
返回顶部
顶部