验证码:互联网极客善恶斗争的目击者。
首先需要区分概念。 短信验证码和网站的图形验证码不是一回事。
cqdgs在手机上注册APP账户,点击获取验证码后,在网站后台生成验证码的内容,并将你的手机号和验证码的内容发送给短信服务商。 他们判断验证码的内容是否符合合规,手机号码是否正确,并将内容提交给短信服务商。 最后用邮件发送到你的手机。
邮件的验证码判断了你是否是你。
但是,网上网站的验证码没有那么简单。
首先,让我解释一下为什么需要验证码。
2000年啊。 那个还没有出现各种各样的社交网络。 人类总是通过伊妹交流,真正实现了海洋中的知己,天涯海角。 但是,没有死的骗子们统一注册邮箱,发送大规模的群发诈骗邮件。 请考虑一下。 打开邮箱,画面上到处都是卖泰坦和壮阳药的广告,会很不舒服吧?
甚至在邮箱服务公司,雅虎也分不清注册邮箱的是人还是幽灵。
来自危地马拉的计算机天才wsddt(LuisVonAhn )提出了划时代的解决方案,并在登录邮箱时设置了判定环节。 也就是说,让用户输入一串沾满油污的文字和数字。
这个工作,人类可以简单地做,但当时的机器做不到。
该系统被称为CAPTCHA,是将机器和人类完全自动化的公共图灵测试。 严格来说,验证码应该称为“逆图灵测试”。 因为其本质是机器判断你是否是人。
阻止骗子恶意注册的问题暂时解决了,但带来了新的问题。 填写验证码太花时间了。 我们简单地结账。 假设填写一次验证码需要10秒,那么所有人每天都要浪费20亿秒以上的时间。 也就是说,是63.4年。 有这个时间做什么好呢?
XDL还开始考虑是否可以有效利用这个时间。 他把目光投向了急需电子化的大量书籍。 如果用人工输入这些书,确实很花时间,电子扫描也几乎都糊了。
为了解决这个痛点,他又重新设计了一个叫reCAPTCHA的验证码系统。
这个系统由两部分组成。
第一部分和以前一样,是自动生成的内容,用于检测你是否是人。 第二个是机器无法识别的文本。 如果第一部分输入正确,机器将假设第二部分也正确,验证通过,并将输入结果返回给主机。
不要担心。 主机将第二部分的内容发送给多个用户,以进行交叉验证并确保无误。
所以,其实我们在无意识中,为人类文明做出了巨大的贡献! 上市以来,reCAPTCHA系统已经数字化了1300万篇文章,2500万本书。 今天,全世界每天约有2亿个字符在reCAPTCHA上注册。 这相当于高级打字员,相当于上24
小时的班,连上2年半的工作量。然而,在人类通过验证码创造价值的同时,骗子也没闲着,他们想出各种办法对付验证码。
第一个办法,就是把填验证码的工作外包给大量的人类劳工。比如说在印度,每填写1000个验证码可获得0.8-1.2美元的收入。如果你一天能填3000个,报酬就差不多和印度南部一些流水线加工厂的日薪持平了。
而更为高级的办法,就是使用人工智能。
2017年,美国人工智能公司Vicarious就提出用人工智能技术,破解验证码。这套方法,也叫递归皮质网络。翻译为人话,就是给机器看一定数量的图片,它就可以自己总结出规律,识别验证码中变形的图案。
所以,极客们不得不再想出更厉害的验证码。
在谷歌收购了reCAPTCHA系统后,他们推出了一种没有验证码的验证码,即“I'm not a robot”。
这套验证码背后,同样有强大的人工智能做支撑。cqdgs在移动鼠标的时候,它们会收集大量的信息,包括IP地址,来判断你平时的浏览习惯,包括反应时间、拖拽鼠标的速度和轨迹等等。
以此来判断你到底是不是人。
那你一定要问了,既然技术这么厉害了,为什么还会碰上下图这些验证码呢?
其实,这是为了训练人工智能。
人类识别的这些图片,会变成标注好的数据,用来给人工智能用作训练算法模型。数据标注越准确、数量越多、模型的效果也就越好。所以,人工智能需要海量的标注数据,最好的办法,自然是让人类一起参与这一工作,也叫“众包”。
比如给车辆、摩托车、自行车打边框,这类图片就是用来训练智能摄像头的识别能力。
再比如分辨建筑物的边缘,就是用来提升自动驾驶系统对周边环境的认知能力。
任何一种天才的设想,都代表着人类无穷无尽的创意和智慧。技术给了我们新的便利和可能,却也会让恶者破坏生态和美好。但人类总是能用创造性的手段,把文明拉回正确的赛道。这才是我们生而为人的骄傲。
编辑:xsdcg
编导:清新的煎蛋A
排版:新桐
参考资料:
1:新闻实验室:《验证码的故事:互联网的一个缩影》;
2:硅星人:《你以为自己在填验证码,其实是在给谷歌做义务劳动》,2018年;
3:造就Talk:《人人都讨厌验证码,但我们为什么离不开它》,2019年;
4:新浪科技:《是谁设计了让人亦爱亦恨的验证码》,2015年;
5:新浪科技:《人工智能:真的需要不少“人工”》,2017年;
6:CAPTCHA - Wikipedia;
7:The Surprisingly Devious History of CAPTCHA | Mental Floss;
8:CAPTCHA: The story behind those squiggly computer letters;
9:CAPTCHA: A brief history - HeX Productions。