是否存在任何文本验证码挑战都可以愚弄AI，但不能欺骗人类？

10

是否存在生成文本验证码（因此用户需要输入正确的文本）挑战的现代技术，这些挑战可以通过一些视觉混淆方法轻松地欺骗AI，但与此同时人类可以毫不费力地解决它们？

例如，我在谈论识别图像中嵌入的文本（不考虑任何外部插件，如Flash或Java，图像分类等）并重新键入已写文本或类似内容的简单能力。

我猜想添加噪音，渐变，旋转字母或更改颜色不再是可靠的方法，因为它们会很快被破坏。

有什么建议或研究吗？

image-recognition research ocr

— Kenorb
source

4

这不是倒退吗？通常情况下，首先有人制造了一个他们认为可以欺骗机器人的验证码，然后其他人开始自动解决它。您可能想到的任何新内容都会很快过时。

— 分解潜伏者

尝试思考人类可以比计算机做得更好的地方。我们可以推理，我们（母语人士）将几乎了解所有习语。请参阅此以获得更多想法。我认为，就文本而言，最好的办法是让用户输入经过NLP分析的文本，以匹配声明的情绪或表达某些内容。计算机不是很擅长起草清晰，结构合理的句子（但我想大多数人也不是很擅长）。

— JakeD

通常，文本CAPTCHA用于表示CATPCHA以文本形式显示，而不是要求的用户输入必须是文本。例如TextCaptcha。

— Theraot '16

5

关于什么使人与众不同，这是一个有趣的问题。休伯特·德雷福斯（Hubert Dreyfus）有一本很好的书，题目是“计算机不能做什么”。

计算机（至少到目前为止）无法处理的一项任务是对重要事物进行排名。例如，CAPTCHA要求您按重要性排序随机排列的物品列表（一件小物品，五件或六件物品）。这种特殊的练习需要AI根据人类的判断来做出决定（并非总是理性的）。

— 视力
source

5

一种可能可行的方法是利用视觉上的错觉，例如在走廊上的两条线是相同的，但在人眼看来似乎更长的一种，然后可以通过选择有关线的状态的问题来提示它们。我们的眼睛看起来更长，但是到电脑上，线的长度仍然相同。当然，总有一个问题是视力障碍者无法完成这些任务，但是可以使用不同的幻觉来解决这一问题。

— sgtdragonfire
source

2

让用户标记视频中突出显示的对象，而当前的分类器无法解决

创建最新的视频分类器。最好在Google的YouTube-8M视频培训数据上进行培训。但是，您也希望不断地将其原始视频输入。

为分类器添加尽可能多的对象标签。让它隔离可以识别为对象但不能标记的对象。

让它输出概述对象的视频。最好是GIF，它可以轻松地以表格形式嵌入。

对于其中的100个，请询问100个用户什么是对象。如果90％的用户同意某个对象的名称，则将该视频添加到验证码集中。将此称为预训练集。

每次用户需要进行身份验证时，请向他们展示视频中突出显示的对象之一，而不是来自预先训练的视频集中的对象。如果图像显示次数少于100次，请记录标签并为用户提供预先训练好的标签。如果他们做对了，请让他们通过，否则，请给他们另一个经过预训练的组合。

一旦未经预训练的视频有超过100场演出并且超过90％的验证码用户同意，则将该视频添加到经过训练的视频集中。

随着时间的流逝，请慢慢移除预先训练好的设定。在训练后的视频集中为每个视频设置到期时间，并在到期后将其删除，以免浪费太多时间。

理想情况下，此过程将不断改进视频分类器，使其保持最先进的状态，并且在其他分类器方面稍有领先。也许它也可能偏爱不太常见的单词和宾语，而偏爱更深奥的事物，从而使该分类器与其他分类器相对应。

图像标记也可以这样做，但是随着AI的发展，视频分类器的效用可能会持续更长的时间。

严格来说，尽管没有一些量子手段，但没有一个验证码系统不会一天被外部AI系统解决。

（编辑：哦，我刚刚注意到您专门说了“文本验证码”。如果这就是您的意思，那么我认为文本分类还没有什么神秘之处。计算机现在可以比人类更好地提取图片中的文本。但是从技术上讲，上述验证码系统中的输入是文本输入。）

— Doxosophoi
source