是否存在生成文本验证码(因此用户需要输入正确的文本)挑战的现代技术,这些挑战可以通过一些视觉混淆方法轻松地欺骗AI,但与此同时人类可以毫不费力地解决它们?
例如,我在谈论识别图像中嵌入的文本(不考虑任何外部插件,如Flash或Java,图像分类等)并重新键入已写文本或类似内容的简单能力。
我猜想添加噪音,渐变,旋转字母或更改颜色不再是可靠的方法,因为它们会很快被破坏。
有什么建议或研究吗?
是否存在生成文本验证码(因此用户需要输入正确的文本)挑战的现代技术,这些挑战可以通过一些视觉混淆方法轻松地欺骗AI,但与此同时人类可以毫不费力地解决它们?
例如,我在谈论识别图像中嵌入的文本(不考虑任何外部插件,如Flash或Java,图像分类等)并重新键入已写文本或类似内容的简单能力。
我猜想添加噪音,渐变,旋转字母或更改颜色不再是可靠的方法,因为它们会很快被破坏。
有什么建议或研究吗?
Answers:
关于什么使人与众不同,这是一个有趣的问题。休伯特·德雷福斯(Hubert Dreyfus)有一本很好的书,题目是“计算机不能做什么”。
计算机(至少到目前为止)无法处理的一项任务是对重要事物进行排名。例如,CAPTCHA要求您按重要性排序随机排列的物品列表(一件小物品,五件或六件物品)。这种特殊的练习需要AI根据人类的判断来做出决定(并非总是理性的)。
一种可能可行的方法是利用视觉上的错觉,例如在走廊上的两条线是相同的,但在人眼看来似乎更长的一种,然后可以通过选择有关线的状态的问题来提示它们。我们的眼睛看起来更长,但是到电脑上,线的长度仍然相同。当然,总有一个问题是视力障碍者无法完成这些任务,但是可以使用不同的幻觉来解决这一问题。
让用户标记视频中突出显示的对象,而当前的分类器无法解决
创建最新的视频分类器。最好在Google的YouTube-8M视频培训数据上进行培训。但是,您也希望不断地将其原始视频输入。
为分类器添加尽可能多的对象标签。让它隔离可以识别为对象但不能标记的对象。
让它输出概述对象的视频。最好是GIF,它可以轻松地以表格形式嵌入。
对于其中的100个,请询问100个用户什么是对象。如果90%的用户同意某个对象的名称,则将该视频添加到验证码集中。将此称为预训练集。
每次用户需要进行身份验证时,请向他们展示视频中突出显示的对象之一,而不是来自预先训练的视频集中的对象。如果图像显示次数少于100次,请记录标签并为用户提供预先训练好的标签。如果他们做对了,请让他们通过,否则,请给他们另一个经过预训练的组合。
一旦未经预训练的视频有超过100场演出并且超过90%的验证码用户同意,则将该视频添加到经过训练的视频集中。
随着时间的流逝,请慢慢移除预先训练好的设定。在训练后的视频集中为每个视频设置到期时间,并在到期后将其删除,以免浪费太多时间。
理想情况下,此过程将不断改进视频分类器,使其保持最先进的状态,并且在其他分类器方面稍有领先。也许它也可能偏爱不太常见的单词和宾语,而偏爱更深奥的事物,从而使该分类器与其他分类器相对应。
图像标记也可以这样做,但是随着AI的发展,视频分类器的效用可能会持续更长的时间。
严格来说,尽管没有一些量子手段,但没有一个验证码系统不会一天被外部AI系统解决。
(编辑:哦,我刚刚注意到您专门说了“文本验证码”。如果这就是您的意思,那么我认为文本分类还没有什么神秘之处。计算机现在可以比人类更好地提取图片中的文本。但是从技术上讲,上述验证码系统中的输入是文本输入。)