是否存在任何文本验证码挑战都可以愚弄AI,但不能欺骗人类?


10

是否存在生成文本验证码(因此用户需要输入正确的文本)挑战的现代技术,这些挑战可以通过一些视觉混淆方法轻松地欺骗AI,但与此同时人类可以毫不费力地解决它们?

例如,我在谈论识别图像中嵌入的文本(不考虑任何外部插件,如Flash或Java,图像分类等)并重新键入已写文本或类似内容的简单能力。

我猜想添加噪音,渐变,旋转字母或更改颜色不再是可靠的方法,因为它们会很快被破坏。

有什么建议或研究吗?


4
这不是倒退吗?通常情况下,首先有人制造了一个他们认为可以欺骗机器人的验证码,然后其他人开始自动解决它。您可能想到的任何新内容都会很快过时。
分解潜伏者

尝试思考人类可以比计算机做得更好的地方。我们可以推理,我们(母语人士)将几乎了解所有习语。请参阅此以获得更多想法。我认为,就文本而言,最好的办法是让用户输入经过NLP分析的文本,以匹配声明的情绪或表达某些内容。计算机不是很擅长起草清晰,结构合理的句子(但我想大多数人也不是很擅长)。
JakeD

通常,文本CAPTCHA用于表示CATPCHA以文本形式显示,而不是要求的用户输入必须是文本。例如TextCaptcha
Theraot '16

Answers:


5

关于什么使人与众不同,这是一个有趣的问题。休伯特·德雷福斯Hubert Dreyfus)有一本很好的书,题目是“计算机不能做什么”

计算机(至少到目前为止)无法处理的一项任务是对重要事物进行排名。例如,CAPTCHA要求您按重要性排序随机排列的物品列表(一件小物品,五件或六件物品)。这种特殊的练习需要AI根据人类的判断来做出决定(并非总是理性的)。


5

一种可能可行的方法是利用视觉上的错觉,例如在走廊上的两条线是相同的,但在人眼看来似乎更长的一种,然后可以通过选择有关线的状态的问题来提示它们。我们的眼睛看起来更长,但是到电脑上,线的长度仍然相同。当然,总有一个问题是视力障碍者无法完成这些任务,但是可以使用不同的幻觉来解决这一问题。


2

让用户标记视频中突出显示的对象,而当前的分类器无法解决

创建最新的视频分类器。最好在Google的YouTube-8M视频培训数据上进行培训。但是,您也希望不断地将其原始视频输入。

为分类器添加尽可能多的对象标签。让它隔离可以识别为对象但不能标记的对象。

让它输出概述对象的视频。最好是GIF,它可以轻松地以表格形式嵌入。

对于其中的100个,请询问100个用户什么是对象。如果90%的用户同意某个对象的名称,则将该视频添加到验证码集中。将此称为预训练集。

每次用户需要进行身份验证时,请向他们展示视频中突出显示的对象之一,而不是来自预先训练的视频集中的对象。如果图像显示次数少于100次,请记录标签并为用户提供预先训练好的标签。如果他们做对了,请让他们通过,否则,请给他们另一个经过预训练的组合。

一旦未经预训练的视频有超过100场演出并且超过90%的验证码用户同意,则将该视频添加到经过训练的视频集中。

随着时间的流逝,请慢慢移除预先训练好的设定。在训练后的视频集中为每个视频设置到期时间,并在到期后将其删除,以免浪费太多时间。

理想情况下,此过程将不断改进视频分类器,使其保持最先进的状态,并且在其他分类器方面稍有领先。也许它也可能偏爱不太常见的单词和宾语,而偏爱更深奥的事物,从而使该分类器与其他分类器相对应。

图像标记也可以这样做,但是随着AI的发展,视频分类器的效用可能会持续更长的时间。

严格来说,尽管没有一些量子手段,但没有一个验证码系统不会一天被外部AI系统解决。

(编辑:哦,我刚刚注意到您专门说了“文本验证码”。如果这就是您的意思,那么我认为文本分类还没有什么神秘之处。计算机现在可以比人类更好地提取图片中的文本。但是从技术上讲,上述验证码系统中的输入是文本输入。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.