将令人反感的内容上传到GitHub是否可以接受?[关闭]


12

我为我的网站开发了一个令人反感的内容检查器,并希望将其发布在GitHub上。但是,源代码包含许多令人反感,种族主义和其他令人讨厌的内容。

来源已被完全记录下来,但是我希望您对是否可以在GitHub上发布这样的作品还是是否让字符串的排列留给读者的想象力表示意见?


11
关键问题可能是“它实际上是令人反感的吗?还是仅仅是一个“典范”?” 进入github TOS -§7的建议表明,他们可以(但没有义务)将其删除。您可能希望将字符串提取到另一个文件,然后对该文件进行rot13加密或类似的处理,以免冒犯浏览器。

1
我想没关系,只是警告自述文件中的可能读者,其他GitHub Repos中有很多令人反感的词。另外,您的情况是真诚的。
jacktrades

5
为什么不将所有单词放入文本文件或数据库中并在运行时加载它们。然后在文件的开头添加一个很好的免责声明,即以下文本不适合胆小的人。您的代码是干净的,可以在不同情况下使用不同的文本文件吗?
Ampt入渗

@Sparticus感谢您的评论。我同意并认为这可能是对我最好的方法。
SimonGoldstone.com 2013年

5
一个词本身并不令人反感。其背后的意图使其令人反感。
kaptan

Answers:


45

我不得不不同意ROT-13解决方案。仅仅因为看到它们可能会冒犯某人而使您的单词模糊,这是浪费时间。

无论如何您的不良词/不良词规则字典应该来自单独的文件(可以在运行时加载,也可以作为资源嵌入)。混淆该文件只会使您/其他开发人员/您的用户更难以更改或解决任何问题。此外,如果我看到一个叫我的硬盘驱动器上的“banned_words.txt”的文件,我会想到它包含的进攻单词的列表。


我同意。我不想混淆这两个字。
SimonGoldstone.com 2013年

5
+1 @simon这样的列表已经出现:github.com/snipe/banbuilder
dcaswell 2013年

2
@simon我并不是说您的项目不值得,只是github允许人们像您想要的那样存储列表。另一个答案没有是或否,我只是想向您确认答案实际上是“是”。
dcaswell

1
“发明轮子”是学习的一部分……这是大学教授的大部分内容。
WernerCD 2013年

2
有时您会遇到……我们该怎么说……微妙的敏感性,这些敏感性可能会影响程序的分布是持久还是持久。如果旋转文件意味着它保持存在,这将有助于OP实现他的目标,即保留代码并保留在GitHub上。这不是我书中的时间浪费。
Blrfl 2013年

16

“计算机科学中的所有问题都可以通过另一层间接解决。” 作者: David Wheeler)。

如果您考虑到可以内容进行编码,以免打扰读者,那么您的选择不仅限于上传还是不上传。

  • 例如,简单地移至下一个字母(A至B,B至C等,而Z移至A以完成编码)可以将著名的四个字母单词变成完全无害的Gvdl。您需要在应用程序中使用它的唯一方式是将其以相反的方向移回先前的字母,而将A移至Z。

正如评论中指出的那样ROT13字母替换密码中使用了类似上述的方法,该方法以“作为隐藏... 令人反感的攻击性材料的方式...”而闻名。

 

http://upload.wikimedia.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


为了完整起见,请考虑对编码字典另外运行检查程序,以确保选择的编码不会意外地将一个令人讨厌的单词变成另一个。

在对此类内容进行编码时,应仔细检查,因为无法可靠地预测事物。在我过去的一个项目中,当配置错误的检查程序开始以随机字符序列(在ZIP档案的uuencoded内容中)发现令人反感的内容时,我们发生了相当严重的邮件中断。


与传递纯文本Gvdl相比,编码具有充分的好处,可以完全避免法律问题以及所有涉及的风险和依赖性

试想一下。说,特定存储库中的特定服务条款可以使我的内容正常。

但是,如果他们决定更改TOS怎么办?或者,如果我决定更改条款不兼容的另一个存储库,该怎么办?我该怎么办?

顺便说一句,即使在此时此刻,即使处于“友好”存储库中,也仍然不是完全安全的。

如果有人由于奇怪的Web过滤器而无法下载我的内容怎么办?我是否愿意回应用户的抱怨并解释如何修复过滤器?他们的过滤器...

...您知道,在决定拒绝编码之前,我宁愿三思而后行。即使我决定,也要确保我有一个非常非常好的理由。


6
Rot13是事实上的标准。Double rot13甚至更好。:-)
Blrfl

5
@Blrfl就像三重DES优于DES,三重rot13是要走的路。

1
我认为对于许多编辑器来说,有一些插件可以使编辑rot13文件比编辑任何其他具有特殊格式的文件更
容易

2
@Simon与其说是rot13令人费解,不如说是琐碎地隐藏文本的一种标准方法。请意识到,可能已将某些防火墙配置为阻止某些字符模式,从而使程序功能难以获取文本。不是冒犯性就是可能的问题,而是其他技术障碍,可能没有意识到“您要下载的内容”和“您要阻止的内容”之间的区别。是的,他们可以获得zip,但无法克隆,分叉或推送。

2
@ThomasEding 凯撒移位密码为一个字母。第一个字符最初是'F'。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.