验证码到底有啥用

2016-02-20 17:38彭茜
读者·校园版 2016年5期
关键词:图灵字符古籍

彭茜

在年底的网络购票高峰期,中国铁路客户服务中心12306网站的图形验证码系统,被很多购票者“吐槽”。人们不禁要问,如此复杂的验证码系统,到底有什么用?

其实,验证码存在的最大意义,就是区分在页面上进行输入操作的是人还是自动化的软件。就拿12306网站的验证码来说,它的“进化史”就是一部不断与黄牛和抢票软件“斗智斗勇”的历史,从一开始的简单数字、字母、加减法,再到闪烁变形字母、干扰线变形字母……由于数字和字母组合可被抢票软件自动分析识别,自2015年3月16日起,12306网站又启用了图形验证码。

验证码有一个充满科学气息的学名——“全自动区分电脑和人类的图灵测试”(简称CAPTCHA)。众所周知,图灵测试通过让被测试者回答人类提出的一系列问题,以鉴别对方是人还是机器,而验证码则是一场机器向人提问的“反图灵测试”。

随着计算机技术的进步,验证码被设计得越来越复杂是必然趋势,这也显示出人工智能的不断进步,程序员正在与破解者进行着一场仿佛没有终点的“拉锯战”。美国斯坦福大学的一项研究发现,近两年来,互联网的验证码正变得越来越难以识别,并且每个网站平均有1/5的用户因为验证码过于复杂而离开网站。

不过,验证码在进化过程中也有了新的应用意义。美国卡内基梅隆大学的路易斯·冯·安等人设计出了reCAPTCHA系统,将验证过程用于古籍的数字化。古籍经扫描后,会出现一些难以准确辨识的字符,人工核对工作量巨大。对电脑前的单个人来说,辨认验证码字符所花的几秒钟也许微不足道,但如果把全球数以亿计的网民辨认的字符收集起来,情况会怎样呢?

于是reCAPTCHA派上用场了,把无法识别的古籍文字制成验证码,派发给网站用户验证,根据不同用户反馈回来的单词答案,就可以轻松得到模糊字符的正确结果了。这样一来,每一次烦人的验证都在为人类典籍数字化做贡献。reCAPTCHA后来被谷歌买走,谷歌还把这个概念应用到谷歌街景的门牌号识别中。

2014年年底,谷歌推出了全新的验证码识别系统“No CAPTCHA reCAPTCHA”,繁杂的验证码系统被一个简单的复选框所取代,用户只需勾选“我不是机器人”这个选项即可。其实,通过收集用户在单击前的鼠标轨迹,谷歌就可以辨识出人与机器之间的细微差异。

这一新系统会在“不经意间”收集用户的IP地址等变量,然后根据这些数据,对比用户当前的行为是否与在互联网上的历史行为一致,由此来判定究竟是人还是机器人在操作。

猜你喜欢
图灵字符古籍
Python实现图片转字符画
西藏大批珍贵藏文古籍实现“云阅读”
古籍修复师的巧手与匠心
正则表达式快速入门
图片轻松变身ASCⅡ艺术画
人工智能之父:图灵
新英镑
江苏完成九成以上古籍普查
人工智能简史
视频监视系统中字符叠加技术的应用