该怎么形容目前的人机验证呢?
应该是失望吧?
为了确保资源服务于人类,而不是爬虫等程序,人机验证的存在是必要的。大概在 2005 年前后,互联网上的人机验证机制就比较常见了。当然,最早我们在 Google 那种风格的登录窗口上可以看到,会给你显示两个英文单词,一个写的很清晰,一般是正式的印刷体,另一个比较潦草,也是印刷出来的,但有一定的扭曲。作为用户,正确的输入这两个单词,就代表你是一个正常的人类。这种验证方式背后还有一项很“浪漫”的目标——这两个单词是从扫描纸质的印刷物的过程中取出来的。有些部分扫描质量很好,机器可以辨认出来,有些部分扫描的质量较低,比如靠近装订的那一部分。把两种类别的单词放在一起,用户正确的输入可以清晰识别的那个单词,证明了他是人类,然后输入用户辨认的不清晰的那个单词,在大数据的作用下,辅助人们将不好辨认的英文单词人工来校对。