输入验证码,为人类文明添砖加瓦

2020-11-18 01:58差评君
读者·校园版 2020年23期
关键词:街景真人按钮

差评君

这些年来,验证码的形式越来越丰富,不少网友“吐槽”,没有足够的知识储备,连验证码都看不懂了。不知你有没有想过,这种明显让用户体验不佳的东西,存在的意义到底是什么?

其实,验证码的用处可以用简单的一句话来解释清楚:区分计算机和真正的人。

2000年年初,互联网的浪潮刚刚在全世界掀起,当时最让用户苦恼的一件事就是垃圾邮件太多。甚至有一些家伙还特意设计了程序,可以终日无休止地大量注册新邮箱账号,用来发送垃圾推广邮件。一位名叫路易斯的天才程序员就想到了法子,他发现计算机程序很难认清手写的文本,而人类可以轻松看懂。所以,可以在注册账号的时候设一道门槛——必须输入“歪曲”的文本才能完成注册,用来识别计算机和真人。验证码由此而生,无数的黄牛、垃圾邮件、爬虫程序就这样被验证码挡在了门槛外面。

有网友计算过,全世界的网民每天要输入近2亿次验证码,每次输入按花费10秒计算,人类每天花在验证码上的时间已经超过55万小时。

或许有人会说:“浪费时间就是浪费生命!验证码浪费了人类大量的生命!”不过说起来你可能不信,实际上输入验证码的时间并没有全被浪费。每一次输入验证码,你都可能在为人類的文化事业或者为人工智能贡献一分力量。

还是那个发明了验证码的天才路易斯,他发现许多公益组织在把旧书扫描成电子版,对计算机来说,那些斑驳的文字太难识别了。他想,书籍的内容大部分是文本,验证码也是文本,把扫描版的书籍文本对接到验证码上,让用户来识别不就行了?于是,一个叫作reCAPTCHA的新式验证码系统诞生了。

reCAPTCHA会提供两个单词让用户识别。这两个单词都是书籍扫描版的一部分。计算机其实已经知道第一个单词是啥了,不过第二个单词计算机暂时还没能力认出来。面对第二个单词,一旦有10个人输入了同样的答案,那么这个答案就会被当作正确答案。靠这种方法,reCAPTCHA每年能让230多万本旧书转化为电子版。

除此之外,你输入的验证码,还可能成为人工智能训练的养料。有一类街景验证码,是让人们选小轿车、路牌或者自行车等图片。在费眼又费脑地输入它们的时候,你其实在为谷歌的人工智能免费打工。因为这些图片大都来自谷歌街景,其中的一部分图片是AI(人工智能)已经识别出来的,用来识别你是否为真人,另外还会夹杂着几张AI难以识别的街景,需要借助于你的劳动力。而这些数据,最后都会被用于培训人工智能。在各位的“辛勤喂养”之下,运用了谷歌AI技术的无人驾驶汽车Waymo,已经在自动驾驶领域处于遥遥领先的地位。

如今,收购了reCAPTCHA的谷歌已经把大部分验证码升级成了reCAPTCHA v3。用户只要点击一下“我不是机器人”的按钮,就能轻松通过验证。但即便如此,验证码还是能从你身上吸点油水。因为在你点击按钮的同时,谷歌会监控你的行为。鼠标的运动轨迹,甚至你打开的网页都可能被收集,这些数据会被用来判断你是否为真人,并且帮助验证码系统进化。目前国外有超过65万个网站用reCAPTCHA v3,每点击一次验证按钮,就等于打卡告诉谷歌你来过这儿,谷歌就会根据你去过的网站来给你推送定制的广告。

随着OCR(光学字符识别)技术和AI的发展,验证码也在不断被破解,过去简单扭曲一下的字母,已挡不住现在的程序了。但无论验证码怎么进化,只要你是真真切切的人,验证码这一关都不可能真正挡住你。就像reCAPTCHA一直所倡导的那样:Tough on bots,easy on humans(对机器人困难,对人类简单)。

(李金锋摘自微信公众号“差评”,视觉中国供图)

猜你喜欢
街景真人按钮
美术作品《青岛街景系列一》《漂泊》
“咔嚓”,定格的街景
城市街景
真人秀F2
死循环
变色龙
3D街景
COCO×读者 真人亲身拍摄体验
发明速递
内心不能碰的按钮