客户希望我们对工作机器进行色情检查。可能吗?


30

一个长期的客户要求我们帮助筛选他们的工作机器以检查色情内容。如果发现敏感材料,他们担心赔偿责任。(出于明显的原因)他们主要关注的是视频,音频和图像文件。如果可能,他们还希望扫描基于文本的文档以查找不适当的内容。他们具有非工作内容的层次结构,从明显的违法行为开始(我不必列出详细信息),然后逐渐转移到明显令人反感的内容,还包括可能对某些内容令人反感的内容-例如内衣广告,笑话卡片,对接裂缝,以及与Howie Mandel相关的所有信息。

我的问题是:

  • 这是道德的吗?我认为这是因为每个员工在法律上都同意他们的工作机器属于公司,并且需要进行搜索。筛选不应在投入使用的个人计算机上进行。
  • 可行吗 我已经做了很多图像处理/索引工作,但这似乎是一个全新的复杂世界。
  • 有没有提到成功发现色情技术的方法?
  • 发现某些内容后,将结果存档对我来说是否合适?

29
谁的色情内容将用于测试?
ChaosPandion 2011年

12
我想成为这个项目的测试员!
Mayank

56
创建一个脚本,将其发布在4chan上找到的所有图像;如果其他成员回答“ MOAR!”,则说明它是色情内容。如果该脚本被禁止,则可能是CP。
user281377 2011年

8
您必须考虑已经有无数的商用产品可供使用。
GrandmasterB

34
诚实的问题:这实际上可能是一个问题吗?在工作电脑上色情?我的意思是……那是谁?此外,他们打算如何处理意外的色情内容?我的GF最近在她的工作PC上实际上感染了一种病毒,该病毒将任意Google查询重定向到色情网站,而且经常我不小心键入“ python.com” [NSFW!]而不是“ python.org”……此外,如果这是实际上是一个问题,我认为这出了公司一个更根本的信任和/或专业性问题。解决该问题,而不是搜索计算机。
康拉德·鲁道夫

Answers:


125

您可以使用90%Headology和10%软件来做到这一点。

首先,静静地扫描员工计算机,为每个员工建立文件和大小的数据库。

然后泄漏一条备忘录,其中将扫描所有PC的可疑内容,即老板拥有类似Shazam的程序,可以识别色情内容等。

然后几天后,再次扫描计算机以查找文件和大小。查看任何已删除的文件,它们是电影文件还是图像文件?这些就是您需要关注的员工。

定期在这些员工的PC上扫描图像和电影,然后手动检查它们是否有可疑内容。


9
而+1则表示拓扑。
TRiG

5
@二进制:两阶段方法确实令人印象深刻。
Matthieu M.

2
+1从我这里参考给奶奶!
2011年

2
@Anonymous在你的时候。在Visual Basic中创建一个GUI,以查看是否可以跟踪IP地址。youtube.com/watch?v=hkDD03yeLnU。严重的是,这是一种很棒的技术,可以播放一些一流的电视节目脚本。
Evan Plaice

2
多么邪恶的主意!喜欢它♥
Chani 2012年

75

这是一个显而易见的神经网络任务。首先,您需要由公司专家选择的大型图像训练集。

一个更有效的解决方案是宣布您将在接下来的每周/每月/无论什么地方检查每个人的色情机器,然后编写一个简单的应用程序来练习磁盘。我保证到那时机器都已经清洗了。


PS -一对夫妇的“严重”点-你其实并不想找到什么。

如果您确实在浏览器缓存中找到了几张图片,那么它们可能会链接不好或出现了令人毛骨悚然的弹出式窗口-还记得老师在whitehouse.com上开除吗?如果您为此解雇/纪律他们,那么工人/工会将产生强烈反对。如果在您的员工研究问题或在线检查价格之前,每次单击都必须提交法律批准,您的公司将如何运作?

如果您在机器上发现一堆色情内容,该如何证明该色情内容是由该员工放置的?您是否拥有可以在法庭上站得住脚的安全和审核系统?您是否使用(甚至不知道)一个系统管理员无法将其放置在操作系统上并使其看起来像用户文件的操作系统?

另外,根据我的经验,最常见的色情藏身地点是CxO和高级副总裁的笔记本电脑上。

最好只是安排文件提前消失。


+1-尽管我会将其与基于%的人工检查结合起来。也许随机选择0.1%的工作站进行实际检查。
德鲁

@nikie:马丁正在开一个关于训练集的玩笑。
Andrew Grimm'3

这是一个非常有趣的解决方案,而且是一个准确的解决方案:)
crosenblum 2011年

10
等待。你怎么知道我把色情藏在首席执行官的笔记本电脑上?
Jaap

1
如果人们在面对计算机被扫描的前景时真的能删除所有色情内容,我会感到惊讶。程序员可能会这样做,但是IME的其他人对于这种事情确实很“奇怪”。但是,您可以将此与Binary的想法结合起来,并仔细查看那些删除了许多MB的计算机。不过,+1从我这里观察到,您实际上并不想找到任何东西。
2011年

8

这种控制方法对于员工和IT人员而言无疑是痛苦的。一旦任何东西进入员工机器,就没有确定的方法可以检测到它。您首先需要停止将其输入机器。
最有名的做法显然是控制可访问的站点/域。这样的列表必须在网上的某个地方可用。除此之外,您还可以跟踪员工下载的图像和视频的数量以及来自何处。
材料很有可能来自网络以外的其他地方,例如来自外部硬盘驱动器。每月可能会对该系统进行一次随机扫描,您可以在其中随机选择一些视频和图像并手动进行检查。不确定如何完成。但是自动检查图像和视频肯定超出范围,并且肯定会是错误的。
实际上,我并不是很想限制员工做私人事情。为此,您应该信任您的员工。您的员工应该在办公室中足够忙碌,这样他们就不会有任何时间。员工是否更担心自己的工作不正确?还是他/他安装了一些破解或被黑的软件?


1
我同意开发人员和其他富有创造力的人不应拥有被锁定的计算机。但是,当我这样说时,请相信我,当您有200多名员工在处理工作流文档时,您不想给这些人任何会分散他们注意力的东西,包括浏览器。是的,有90%的人努力工作,不会与众不同,但这意味着您将有20多名哥布希人拉小便而变得毫无生产力。
Binary Worrier

6
那10%仍然毫无用处。如果不浏览网站,则玩游戏,阅读,无聊,无聊地坐等)。
jwenting 2011年

2
人们要么完成工作,要么不完成工作。当您有200个可以测量的相似任务时,它们更容易发现。
JeffO 2011年

2
在美国,公司计算机上的色情片涉及法律问题,而儿童色情片确实涉及严重的法律问题。制定无色情政策并采取措施将其拒之门外是最安全的。
David Thornley

7

市场上有许多产品可以执行各种形式的“内容过滤”。(用一些明显的术语进行Google搜索会发现一些明显的候选对象。)使用这些产品之一可能比从头开始构建大量扫描/过滤软件更好。另一种选择是只看边界。例如,通过监视外部电子邮件和网络流量。同样,有些产品可以做这种事情。

毫无疑问,公司扫描计算机中的“不良品”是合乎道德的,但这并不意味着没有问题。

首要问题:

  • 确定什么是“有害内容”以及什么不是“令人反感的内容”是主观的。
  • 用于检测包含“裸身描述”(让我们说)的图像和视频的软件(AFAIK)可能不可靠,从而导致误报和误报。

因此……这意味着您客户组织中的某人需要检查“命中”。那要花钱。

第二个问题:可能有一个无辜的解释。该文件可能是偶然下载的,也可能是由斗气的同事植入的。如果有无辜的解释,则客户的组织需要小心自己的所作所为。(好的,这实际上不是您的问题,但是您可能要应对一些问题。)

第三个问题:尽管公司有权监视不良材料,但许多员工仍会发现这很令人反感。如果距离太远,这将影响员工士气。一些员工会“走路”。其他人可能会采取抗议行动……例如,试图制造大量误报。(同样,不是真正问题,而是...)

第四个问题:人们可以通过加密,将其放在便携式或可移动媒体等上来隐藏令人反感的材料。人们可以伪造元数据,使它看起来像是由别人负责。


1
OP表示这是针对赔偿责任的问题,这在美国很有意义。那意味着把东西从计算机上拿走,而不必责怪别人。
David Thornley

我想说的不止于此。考虑问题中“不适用于工作”内容列表的末尾。听起来好像有人在讲“议程”……
Stephen C

@David:总是要怪人。如果您有潜在的责任问题,找人负责(“此人的行为违反了公司政策,我们可以证明这一点,那么对个人负责而不是我们作为公司负责”)成为标准的工作方式。实际上,这就是许多公司中负责职位的大多数人所花费的时间,他们试图找到人为可能会出问题的事情负责,并确保没有人能为遇到的任何麻烦而责备他们英寸
jwenting

6

关于法国的法律方面:

老板拥有计算机和互联网连接:他可以做任何让他高兴的事情。

但是,不能侵犯员工隐私。如果计算机上的目录标记为PERSONAL,则不允许老板扫描它。

绕过该方法的唯一方法是获取证据,证明员工存储了非法材料,并要求法院要求对计算机进行扫描(请注意,色情在法国不是非法的。)


除受版权保护的材料外,任何材料都可以算作盗窃。
TRiG 2011年

6
在法国,存在私有复制例外的概念:不允许您复制受版权保护的材料,但是如果您的副本是私人使用,则版权所有者不能要求任何权利。
mouviciel 2011年

我想住在法国...除了我不会说法语!
匿名类型

5

如果员工同意他们的工作机器属于公司并且可以接受搜索,那么是的,这是合法的。为了证明,最有必要对文件进行存档。

至于如何实际找到材料。你可以:

  1. 首先,扫描文件名中的某些单词(色情,女同性恋等)
  2. 扫描文本文档中的同一组单词
  3. 对于图像,您可以找到图像的平均颜色,如果该颜色恰好在大多数被称为“肉色”的范围内,则对图像进行标记(请务必仔细检查这些标记的图像的人)。不想为某人举报的图像最终成为海滩上的全家福。

如果您在文件进入计算机时对其进行扫描(例如,将程序加载到每台工作计算机上,并将标记的案例记录到中央数据库中),那么我认为这不会太令人讨厌(除了公然的不信任雇主显然对雇员有好处)。

对于视频文件,我不确定100%。可能与图像扫描类似(选择随机帧并扫描一定水平的“肤色”)。

扫描音频文件似乎会进入语音识别,这完全是蠕虫的“另一罐”。但是,扫描文件名将很容易,并且可以像处理文档,图像和视频一样进行。


是的,我一直在思考。各种口味的肉色很难。更不用说一个大的人头老照片(例如我的头像)可能会触发肉对非肉比率警告。很棒的开始。
Scant罗杰

误报的风险太大(部分取决于所涉及的业务)。
jwenting 2011年

在大多数人的肤色处于给定范围内的情况下,存在一个色彩空间。YCbCr,如果我没记错的话。将图像切成块,如果在大多数块中,平均像素值落在该范围内,请将其标记为“皮肤”照片。
Vitor Py

还有另一个问题 负责检查视频的人员可能会起诉您。我当然不想这样做。(并非所有色情都符合所有人的口味。)
Christopher Mahan

绿坝(是的,从大哥政府在东部地区)的本意是利用OpenCV进行了人脸检测功能。即使与肤色检测结合使用,这仍然会产生很多假阳性。
rwong 2011年

4

正如@Ryan所说,图像分析可以专注于颜色分析。

可行性?我姐姐在政府的某个地区工作,每年他们都会接受某种形式的审核,而且曾经是色情影片。她(地球物理学家)有几个假阳性(粉红色岩石)。



3
  • 这是道德的吗?

取决于员工的实施和合理期望。例如,如果您的软件扫描了连接到网络的任何计算机,则基础设施还有另一个要求,即防止未授权的计算机插入。(也许应该很明显,但是在我所看到的网络中经常被忽略)。

  • 可行吗 我已经做了很多图像处理/索引工作,但这似乎是一个全新的复杂世界。

对每个员工进行药物测试是否可行?也许是这样,但我质疑它的价值。我会随机化。让员工知道可以随时扫描其机器上是否有不适当的内容。

  • 有没有提到成功发现色情技术的方法?

我没有碰这个。我认为我无法控制自己的幽默感。但是在搜索文本时请注意“斯肯索普问题”

  • 发现某些内容后,将结果存档对我来说是否合适?

这是我最关心的问题,我会请一位律师。我怀疑如果您发现非法内容,从技术上讲,您可能有义务披露该内容。这很不好,尤其是如果用户没有遇到自己的真正过错。您(客户)将需要有关如何处理此问题的真正法律建议。让人力资源部门和律师参与其中。


2

从纯粹的技术角度来看:这听起来像是对象类别识别问题。我从来没有做过这样的事情,但是从我读过的内容来看,最先进的类别识别系统是这样工作的:

  • 首先,您搜索大量的兴趣点(例如,使用哈里斯角检测器,比例尺空间中LoG / DoG滤波器的极点;一些作者甚至建议选择随机点)
  • 然后,您将特征变换应用于每个点(例如SIFT,SURF,GLOH或许多其他点)
  • 将找到的所有特征组合成直方图(特征包)
  • 使用标准的机器学习算法(例如支持向量机)来使用大量训练图像来学习对象类别之间的区别。

2

每个人的计算机操作系统都可能是从磁盘映像安装的。

  1. 从磁盘映像开始,并获取您可能不需要扫描的文件列表。
  2. 获取每台PC上所有其他文件的列表。
  3. 从10-20台随机计算机中提取实际文件,并用作测试平台
  4. 在亵渎和可疑单词中搜索项目(帅哥,水罐,“勉强合法”,笑话等)字典
  5. 观看视频-任何人都应该有视频吗?
  6. 查看照片
  7. 任何有问题的视频或图像文件都可以用于搜索其他计算机

任何人将任何东西放到工作计算机上,都将需要一到两名员工才能被抓住。

收取此服务的淫秽金额。我将是Zappos永远不会对他们的员工这样做。


2

假设您是网络上的域管理员。

  1. C $放入每个用户的台式机。
  2. 将色情文件复制到个人私人共享中。
  3. 从原始位置删除。
  4. 做爆米花。
  5. 完成所有“证据”的详细分析。

1

我只想发表评论,但只有1个代表,所以我不能。

对于Gravatar,您可以添加一个功能,以从Internet缓存位置中的干净站点列表中过滤掉。IE Gravatar和其他您不想从中误报的网站。您也可以过滤掉桌面墙纸之类的东西。如果他们在桌面上显示色情内容,您可能会认为人们会注意到您的审计之外。


1

这样的事情永远无法可靠地进行。您可以使用阻止列表来按名称或将其包含在某个列表中来阻止域(通常的做法)。但是这些列表永远不会完整,并且基于标准的名称屏蔽可能会导致许多误报。

您可以阻止出现在站点文本中的单词,但这又可能导致误报(并且非常缓慢,因为您需要分析通过网络的每一个数据位以检测“顽皮的位​​”)。

您可以屏蔽显示出一定比例以上肤色的图片(甚至可能包含这些图片的网站)。但这又导致许多误报。大学医学部门用四肢和躯干的图像显示伤口和皮肤状况来阻止医学百科全书,这是众所周知的例子。当然,这将是种族主义的,因为它只会阻止某些肤色。如果您阻止匹配高加索肤色的颜色,例如总是有使用黑人演员的色情片。

最好只是信任您的员工,并制定何时打破这种信任的政策。


个人代理服务器,加密的隐藏分区,虚拟机。总有一种隐藏东西的方法。当然,还有3g的android智能手机。上次我检查了雇主无法阻止其员工在自己的手机上以自己的带宽观看他们想要的任何东西。
Christopher Mahan

这就是为什么技术手段毫无用处的原因,当然也没有政策。如果人们知道什么是允许的,什么是不允许的(即使没有这样的政策,我也想不出一个会用工作机器进行色情活动的受过教育的人,但这是另一回事),大多数人都会坚持。那些迟早会发现那些技术手段是否到位的人(很可能有人会在他们的屏幕上看到他们过去走路时不应该看到的东西)。
jwenting 2011年

1

我不知道,必须有一个中间的答案,它不是侵入性的,而是解决了真正的问题,即责任。

让他们签署豁免书,使公司对与工作电脑无关的非法物品承担任何责任,这些非法物品与工作无关。


我认为这项豁免在美国不可行。我不知道其他国家。
David Thornley

为什么不起作用?如果用户具有下载内容,安装软件的能力,则他们自然对此承担责任。
crosenblum

而且,如果公司具有过滤色情内容的能力(通常认为是,但事实并非如此),则部分归公司所有。
David Thornley

到处都不是。在某些国家/地区,公司对自己拥有的任何设备所发生的任何情况负责,无论员工是否出于预期目的使用设备。这在一定程度上也适用于美国,实际上,有人曾试图起诉公司在合法销售产品后非法使用其产品(例如,当产品被非法出售时,持续不断的针对枪械制造商的赔偿责任诉讼)。通常用于犯罪,幸运的是,这些诉讼经常被抛出,但不幸的是并非总是如此。
jwenting 2011年


1

图像和内容分析可以确定一个人的品味照片,泳装照片,裸照,色情图片之间的区别……据我所知,仅凭软件就远远不够复杂。

幸运的是,正如@ammoQ在评论中建议的那样,众包在这里应该是有用的。但是我不相信4chan或其他论坛的成员会欣赏大量色情图片,例如张贴的按钮,框架,广告等的通用Web图形。

我的建议是研究现有的众包解决方案,例如Amazon Mechanical Turk。(但是,服务条款可能明确禁止涉及色情内容,因此建议您可能必须找到其他解决方案或自行解决。)

为了使众包可行,您的软件应准备执行以下一些或全部操作:

  • 存储将内容与来自其的计算机链接的信息
  • 识别整个清单中的确切重复项并将其删除(但保留原始信息)
  • 将图像下采样到某个尺寸,例如320x200,足以识别图像的内容,而不会保留不必要的细节并浪费存储空间/带宽
  • 以一定的间隔创建视频内容的静止图像,并应用相同的下采样规则

最后,代表您原始图像和视频内容的缩小图像数据库由用户(或拥有资源的指定团队)根据您公司的行为准则进行检查。程序或界面可能一次只显示一幅图像,也可能显示缩略图屏幕,无论您认为哪种方法都能获得准确的信息。

图像来源计算机的身份对于评估数据的人员而言绝对是秘密且未知的。另外,应该将其随机化,并且每个图像可能要检查一次以上以消除偏差。

可以将相同的技术用于文本,但是首先可以通过关键字排名对内容进行评分,从而从众包评论中删除大量文本。当然,对长文档进行分类要比对图像分类要花费更多的时间。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.