谷歌的机器视觉技术已成功破解自己的CAPTCHA

2014年04月20日

谷歌成功破解了CAPTCHA。本周谷歌的研究员们发表了一篇论文, 文中指出谷歌已研发出一种以高达99.8%的准确率破解CAPTCHA验证码的算法。CAPTCHA验证码即识别网站上那些模糊不清但人眼又可以识别的字 母数字组合,这些字母和数字用来判断输入者是人类还是计算机。CAPTCHA码的设计初衷是区分人类和计算机,这个算法显然威胁到了它。新系统研发的目的 是帮助谷歌自动分析街景相机拍摄到的那些难识别的符号和门牌号,从而使其可以正确匹配地图上的位置图像。

captcha-460

新算法已经成功通过了这些CAPTCHA测试

尽管当这个系统在做CAPTCHA测试时已经近乎完美,它甚至可以通过很多人都无法通过的测试,但是它对于街景图像的分析准确度还不是很高,文字识别的准确率只有90%多点。不过当它只用于识别门牌号时,其准确率马上升到了96%以上。

当然,由于谷歌在街景和reCAPTCHA服务方面所做的工作,使得它特别适合做这种先进的自动文字分析。即便如此,谷歌仍表示已经找到保护自己的reCAPTCHA服务免于被其他计算机破解的方法。

reCAPTCHA的产品经理Vinay Shet在Google Online Security 官博上发文(《新算法让谷歌街景和reCAPTCHA技术更加智能了》)称:“多亏这项研究,我们知道了仅仅依靠扭曲文字来生成验证码是不够的。” Shet同时解释说,这部分工作会分析用户与CAPTCHA系统的所有交互行为,而不仅仅关注答案正确与否。

原文链接: Jacob Kastrenakes   翻译: 伯乐在线 - Elaine
译文链接: http://blog.jobbole.com/65524/

展开阅读全文
60 收藏
分享
加载中
最新评论 (43)

引用来自“LeeNux”的评论

google的验证码也能识别?这不科学啊!

google自己写,当然能认。就算是闭着眼睛也能读写。
2014-12-04 16:42
0
回复
举报

引用来自“羊半仙”的评论

还是随机字符加数字靠谱,纯单词数量毕竟有限

引用来自“webit”的评论

从数量上加上数字多不了多少,反而个别子母和数字太容易混淆 做验证码没有意义

引用来自“羊半仙”的评论

那咋区别人和机器?

引用来自“webit”的评论

a-z0-9 这种反而机器的识别率更高,程序本身只不过是在a-z 这几个字的字形字典中再加了0-9这十个字典,对程序来说更容易注意其细微差别

引用来自“羊半仙”的评论

额 也是,那怎么办,用中文验证码么

用 flash 验证码。
2014-05-08 09:28
0
回复
举报

引用来自“酒逍遥”的评论

我觉得不停在图形的复杂度上做文章是错误的...这方面机器远比人类强大..随着算法的进步,最终复杂的图形只可能难住人类自己而不是机器..
还是要从人类和机器的本质区别去着手解决..比如利用逻辑思维判断..
比如 给出一张 苹果的 图片...让用户去填 apple 这个词...远比把apple这个词反复扭曲模糊更有效一些

机器学习就是从样本开始的,只要有样本,就能学习。
2014-05-08 09:17
0
回复
举报

引用来自“酒逍遥”的评论

我觉得不停在图形的复杂度上做文章是错误的...这方面机器远比人类强大..随着算法的进步,最终复杂的图形只可能难住人类自己而不是机器..
还是要从人类和机器的本质区别去着手解决..比如利用逻辑思维判断..
比如 给出一张 苹果的 图片...让用户去填 apple 这个词...远比把apple这个词反复扭曲模糊更有效一些

引用来自“watzds”的评论

这个不是机器视觉中的物类识别吗,机器一样能行啊

图灵测试……感觉像个悖论,电脑电脑,最终发展的方向肯定是达到甚至超过人类的智力,图灵测试本来是为了区别电脑与人脑,反过来却让电脑越来越和人脑难以区分
2014-04-28 23:13
0
回复
举报

引用来自“羊半仙”的评论

还是随机字符加数字靠谱,纯单词数量毕竟有限

引用来自“webit”的评论

从数量上加上数字多不了多少,反而个别子母和数字太容易混淆 做验证码没有意义

引用来自“羊半仙”的评论

那咋区别人和机器?

引用来自“webit”的评论

a-z0-9 这种反而机器的识别率更高,程序本身只不过是在a-z 这几个字的字形字典中再加了0-9这十个字典,对程序来说更容易注意其细微差别

额 也是,那怎么办,用中文验证码么

2014-04-21 12:32
0
回复
举报

引用来自“酒逍遥”的评论

我觉得不停在图形的复杂度上做文章是错误的...这方面机器远比人类强大..随着算法的进步,最终复杂的图形只可能难住人类自己而不是机器..
还是要从人类和机器的本质区别去着手解决..比如利用逻辑思维判断..
比如 给出一张 苹果的 图片...让用户去填 apple 这个词...远比把apple这个词反复扭曲模糊更有效一些

这个不是机器视觉中的物类识别吗,机器一样能行啊

2014-04-21 10:46
0
回复
举报

我觉得不停在图形的复杂度上做文章是错误的...这方面机器远比人类强大..随着算法的进步,最终复杂的图形只可能难住人类自己而不是机器..
还是要从人类和机器的本质区别去着手解决..比如利用逻辑思维判断..
比如 给出一张 苹果的 图片...让用户去填 apple 这个词...远比把apple这个词反复扭曲模糊更有效一些

2014-04-21 10:35
0
回复
举报

应该出一个更好的验证机制,现在传统验证码严重影响到用户体验了

2014-04-21 09:47
0
回复
举报

引用来自“akirakazu”的评论

TMD人都认不出来,做这个CAPTCHA还有什么意义

引用来自“幸福线”的评论

不能同意更多

引用来自“拜仁慕尼黑”的评论

can't agree more

引用来自“mnisummer”的评论

could not agree any more

bu neng tong yi geng duo

2014-04-21 09:29
0
回复
举报
更多评论
43 评论
60 收藏
分享
返回顶部
顶部