有没有办法检测搜索引擎的偏见?


9

搜索引擎越来越多地被用作信息守门人,但是搜索引擎用来对结果进行排名的标准对于用户来说是不透明的。用户如何才能确保自己的结果不会以某种方式受到偏见或篡改,从而以提高搜索结果质量为代价来使某些用户受益?

政府通常会要求搜索服务提供商删除或降低政治上不受欢迎的网站的排名。企业可能会向提供商付款,以提高某些结果,从而提高收入。防火墙可能会混入结果,然后再将结果传输回用户。

即使对排名算法的看似无害的更改(可能表面上似乎没有偏见),实际上也可能被设计为损害共享某些共同属性(与实际质量无关)的网站。

是否可以通过监视一段时间内的结果并评估某个“隐性变量”(也许是政治派别)是否是网站排名变化的驱动因素来检测搜索引擎的偏见?

偷偷摸摸的提供商可能会随着时间的流逝逐渐降低目标网站的排名(可能还会随机访问网站,以分散用户注意力)。提供商在不被发现的情况下可以引入多少偏差有什么限制?或者有可能通过反复选择偶然产生预期结果的加权排名标准来掩盖此类干扰(通过“数据监听”)。

如果将排名标准公开,是否有任何变化?我们需要开源搜索引擎使用的标准吗?

这使我想起一个结果,即检测卖方是否篡改了诸如CDO之类的复杂金融工具就等于解决了最密集子图问题:

http://www.cs.princeton.edu/~rongge/derivative.pdf

谢谢!


4
这是一个很酷的问题,但是我将通过确保只询问一个与美学理论相关的问题来对其进行修改。最明显的是将此请求作为参考请求,并询问“是否有人已经查看过?”。如果您确定没有人拥有,那么类似“如何正式建模?”之类的东西。可能是个好问题。如果问题太多,而其中一些问题可能与非理论无关,那么它可能会以“不是一个真正的问题”而结束。
Artem Kaznatcheev

请注意,公开排名方案会使它容易受到垃圾邮件发送者的攻击。一个有趣的变体是:“是否有等同于排名的'公钥'”
Suresh Venkat 2012年

@SureshVenkat“公开排名方案可以使其受到攻击”听起来像是您在暗示<s>安全性</ s>含糊不清;)。
Artem Kaznatcheev

不,但这就是为什么我询问排名方案的公钥版本。
Suresh Venkat'2

由于不应将参与搜索过程的各方都视为恶意用户,因此通常的解决方案是将过程建模为具有自私用户的游戏。如果建模正确,我们就会发现搜索引擎这样做是否有益。然后,我们可以设计一种机制来防止这种篡改。
Helium'2

Answers:


3

这显然是一个非常悬而未决的问题,但是为了保持话题性,这里有一个CS理论方法来探讨“公平”的概念以及如何实施它。

“通过意识实现公平” Dwork,Hartt,Pitassi,Reingold,Zemel http://arxiv.org/abs/1104.3913

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.