据我了解,验证码是由于过滤器,噪声和其他杂项算法的应用而失真的文本。因此,要确定该人的阅读能力是否是该人的阅读能力,可以将他们的答案与已知答案进行比较。
现在,在阅读ReCaptcha时,它说显示的单词是OCR无法翻译的单词。另外,recaptcha被用来翻译那些图像。如何判断您的阅读确实正确还是正在编造东西?
如果知道说的是什么,就不会将其用作翻译材料。如果不知道该说什么,那么它将如何验证您的答案?
我猜想这可能是基于概率的分析,在将任何内容标记为已翻译之前,会使用大量样本。
有人知道答案在哪里吗?
3
有趣的是《 Time》民意测验中的4chan /匿名恶作剧。“大理石蛋糕,也是游戏”,它利用了第二个单词的众包验证中的缺陷。
—
DanBeale 2011年
骇客@Dan mentioend:musicmachinery.com/2009/04/27/moot-wins-time-inc-loses
—
BlueRaja-Danny Pflughoeft