阻止反向搜索引擎找到图像的来源?


15

我打算制作一个游戏,向用户提供动漫相关的图像,他们必须猜测它的来源。

但是,大多数图像(尤其是流行动漫的图像)都可以在Google反向搜索中轻松使用,以查找并查明该动漫。

我尝试查看是否可以制作,因此无法识别图像,但不幸的是我的技巧还不够好。

原始图片:

原始图片

带有水平翻转的灰度:

带有水平翻转的灰度

水印:

水印

用灰度困惑图像:

用灰度困惑图像

带有水平和垂直翻转的灰度适用于此图像,但并不总是有效:

带有水平和垂直翻转的灰度

同样,上述方法对于人们来说很容易猜出动画。

我想知道是否有什么好技巧,可以在图片上使用,以便它不能在反向搜索引擎上使用,也不会太复杂以至于无法在程序上实现。

例如,灰度,裁剪,翻转是在C#中很容易实现的事情。


3
我喜欢使图像令人费解的想法。但是,如果有人真的想玩您的游戏,那么我很难确定Google反向搜索将对玩家造成什么问题,玩家是否在为谁先找到它而进行角逐?如果您打算营销游戏,我会更担心拥有这些图像的许可权。
好奇

2
@Emilie是的,有每周和每月的排名系统,只有第一个答案正确才计入该特定图像的积分。它不是一款将被出售的游戏,其原始图像将被指向拥有适当权利的艺术家。我确实想添加到我们的聊天频道中,这确实非常简单。
Prix

1
问题在于,反向图像搜索应该能够绕过图片损坏或效果不佳,这样您的基础技术就会遭受打击,最终最终会松懈。
joojaa 2014年

4
试图保护数字媒体免受盗版或任何其他任务的侵害,很可能最终导致您无法挫败不诚实的人,并破坏诚实用户的体验。有时您必须在脚趾之间做出这样的权衡。
GiantCowFilms 2014年

1
到此为止 表示赞赏没有获得使用该图像的许可。它是版权材料。如果您的游戏愚弄了搜索,那么它可能无法幸免于侵犯知识产权的查询。未经版权所有者书面许可,不得继续使用“其知识产权”。您可能会惊喜地发现它们根据您的游戏预期用途授予您许可。不要猜 不要希望 在进一步努力创造奇迹之前,先找出答案。
斯坦

Answers:


9

我认为您在使用水印选项时走在正确的轨道上,但是您保留了太多原始图像。这是我尝试过Google找不到的两张图片:

棋盘

在此处输入图片说明
反向图像搜索结果

镶嵌

在此处输入图片说明
反向图像搜索结果

另一个例子

在此处输入图片说明
反向图像搜索结果

第一个图像返回许多“方格旗”结果,第二个图像返回许多马赛克/拼贴图像。大小很重要!我最初使用较小的棋盘图案(16px)进行了尝试;Google仍然能够识别出这一点。这些32像素的正方形似乎是一个快乐的媒介。

根据DanS提供的信息,我认为这是欺骗Google的可靠技术(并且很容易实现自动化!)。我只能假定能够识别此动画的人仍然可以从这些图像中识别出来。


具有讽刺意味的是,我创建的图像最终将被Google索引并发布到该帖子中,从而违背了目的!


1
这就是我最终所做的,只是略有不同,我不再创建像正方形这样的常规形式,它似乎确实可以很好地工作,是的,在某些时候它会被索引,但是到那时我们将拥有新的图像已经回答的人不会回到队列中。感谢您抽出宝贵的时间。
Prix

2
更讽刺的是。您可能已经向Google提供了有关改进方面的提示。
joojaa 2014年

9

Google可能使用不同的系统,但是大量此类服务(包括tineye)都使用感知哈希,这些哈希的整体哈希值足够接近,不能完全匹配。

几年前出现了一份白皮书,详细介绍了该过程。我还没有找到指向它的链接,但是基本系统依赖于操作链来生成哈希。

  • 将图片缩小到较小比例,通常为32x32或64x64
  • 将图像转换为灰度
  • 将对比度提升到预定义值,以确保黑白色调之间的高差异
  • 根据结果​​图像中的像素计算pHash

对于任何上传的图像,将重复该过程,然后使用索引哈希进行交叉检查,以找到任何接近的匹配项。简而言之,必须在很大的部分上彻底改变图像,以欺骗任何这样的系统。


那里有一些有趣的信息,很乐意查看这篇文章。
Prix

2

只需创建原始图像的负片图像,然后使用CSS将其反转即可。用户将以相同的质量看到正常的图像,但是在下载时图像被反转了。

.myImageClass {

 filter: invert(100%);

}

负片图像将与原始图像(搜索结果NL)不匹配:

搜寻范例

此外,尝试将颜色减少到256种,Paint Shop Pro就是其中的王者。图像不会与原始图像直接匹配。如果将此方法与上面的方法结合使用,那可能会很棒。


0

您可以执行以下操作:

在此处输入图片说明

它不是100%防弹的,但它应该放弃大多数图像识别引擎。

我所做的就是给图像添加了黑白噪声以及一些位移。弄乱颜色,例如。仅替换一个或两个颜色通道将更为有效,但实现起来很复杂。


1
我将尝试一些流行的图像,看看它最终将如何发展。现在我陷入一个封闭的难题中,当给出错误答案时,我会开平方。因此,您一次只能看到每隔X个像素的图像,这似乎到目前为止是可行的。
Prix

是的,除非您放置足够的噪音以致无法识别整个图像,否则将无法实现我的目标。谢谢。
Prix

4
除了使用带有噪点的图像进行偏离航向的搜索外,Google都会立即找到源。该算法最有可能在傅立叶空间内搜索,因此您的噪音不会起到太大作用。
joojaa 2014年

@joojaa Yah,我确实注意到了这一点,但是Prix要求我向他展示我建议的图像,因此我发布了答案。
GiantCowFilms 2014年

@GiantCowFilms me脚,这正是图像搜索将忽略的那种过滤器。
纳文2015年

0

尝试切换要保存的文件格式。反向图像搜索使用一些固有地记录到图像中的数据开始,这可能就是为什么混淆技术没有起作用的原因。JPEG对此特别不利,PNG则不那么多。但是,对于特别受欢迎的图像,这可能不起作用。

理想情况下,找到一种方法以一种用户无法直接交互(复制->粘贴)的封装形式显示图像。不幸的是,我没有关于如何实现此目标的技术细节,只是我观察到Flash / Shockwave内容中使用的图像具有该特性。

其次:整个计划-使用受版权保护的图片而没有先征得其拥有者的适当许可,即使假设您在解决难题后即提供了归属信息,也会使您处于遭到下架请求或其他法律行动的风险中,尤其是在您正在以任何数量运行游戏。如果可以使用fanart来运行游戏(因为与规范内容相比,您更有可能获得使用fanart的适当许可),这样做可能更好。


这与OP的问题无关。我想我来晚了一点,但是:Google不使用EXIF数据,并且OP不会遇到法律问题,因为他是非营利组织。
纳文2015年

0

您必须混淆搜索引擎。

克服自动图像搜索的最好方法是提供无法识别的图像或来自冲突来源的图像,以及混淆指定模式的图像。

例如,如果您提供一个由三个图像组成的图像,这些图像由交替的带或条组成,并要求仅对每三个带组成的图像进行标识,那么如果与其他带隔离,则将显示为一个带有间隙的图像(其他图像的条带重叠的位置)。

人脑调用“封闭”以将相关图像感知地连接到一个可以识别的内聚图像中。该键足够可识别,但在其余图像中却无关紧要,从而使引擎感到困惑。

问题二可能具有相同的图像,但要求从第二个波段开始的每三个波段。实际上,您可以使用一张包含三个不同成分的图像,因此可以使用三个不同的答案。

除非不相关的频段与搜索物理隔离,否则自动搜索无法解决此类空间问题。难做。


作为用户观看,这将非常烦人
Zach Saucier

@ZachSaucier这应该是一个具有挑战性的游戏,也是绕过越来越智能的软件的东西。我无法在其他方面发表评论。就烦人而言,这与棋盘有何不同?
斯坦(Stan)

-3

到此为止 不要复制。使用原始艺术品。编辑:将此视为仅供参考。

通过复制,您正在间接尝试绕过知识产权保护。你在玩火。

还有你的理由和推理缺陷:给予信贷不要让使用图像许可。这不是“或”的情况。它是版权材料。结果是否出售都没有关系。您的金钱或其他利益与犯罪无关。即使该项目用于学术或科学研究,您也需要获得版权所有者的许可,而不是给予版权所有者的荣誉。

如果您的游戏愚弄了搜索,那么在追求知识产权违规查询的积极主动的律师看来,它可能无法幸免。

未经版权所有者书面许可,不得继续使用“其知识产权”。

您可能会惊喜地发现它们根据您的游戏预期用途授予您许可。记录日期和草图。如果您发现与您接触的人有您的想法,请起诉他们以保密。(这涉及单独的NDA法律文件,可能花费的时间超过其价值。)

不要猜 不要希望 在进一步努力创造奇迹之前,先找出答案。说对不起比征求许可要容易,但这种方式是合法的,合乎道德的,并且会带来更多回报。


3
这并不是要回答所提出的问题。它是关闭的缩短更好,做成评论
扎克索西耶
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.