Questions tagged «data-mining»

1
有没有办法检测搜索引擎的偏见?
搜索引擎越来越多地被用作信息守门人,但是搜索引擎用来对结果进行排名的标准对于用户来说是不透明的。用户如何才能确保自己的结果不会以某种方式受到偏见或篡改,从而以提高搜索结果质量为代价来使某些用户受益? 政府通常会要求搜索服务提供商删除或降低政治上不受欢迎的网站的排名。企业可能会向提供商付款,以提高某些结果,从而提高收入。防火墙可能会混入结果,然后再将结果传输回用户。 即使对排名算法的看似无害的更改(可能表面上似乎没有偏见),实际上也可能被设计为损害共享某些共同属性(与实际质量无关)的网站。 是否可以通过监视一段时间内的结果并评估某个“隐性变量”(也许是政治派别)是否是网站排名变化的驱动因素来检测搜索引擎的偏见? 偷偷摸摸的提供商可能会随着时间的流逝逐渐降低目标网站的排名(可能还会随机访问网站,以分散用户注意力)。提供商在不被发现的情况下可以引入多少偏差有什么限制?或者有可能通过反复选择偶然产生预期结果的加权排名标准来掩盖此类干扰(通过“数据监听”)。 如果将排名标准公开,是否有任何变化?我们需要开源搜索引擎使用的标准吗? 这使我想起一个结果,即检测卖方是否篡改了诸如CDO之类的复杂金融工具就等于解决了最密集子图问题: http://www.cs.princeton.edu/~rongge/derivative.pdf 谢谢!
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.