使用每个选民的准确性和相关不确定性的投票系统


11

假设我们有一个简单的“是/否”问题,我们想知道答案。有N个人“投票”以获取正确答案。每个投票者都有一个历史记录-1和0的列表,显示他们过去对此类问题是对还是错。如果我们将历史假设为二项式分布,我们可以发现选民在此类问题,他们的变异,CI和任何其他种类的置信度指标上的平均表现。

基本上,我的问题是:如何将信任度信息纳入投票系统

例如,如果我们仅考虑每个投票者的平均表现,则可以构建简单的加权投票系统:

result=sign(vvotersμv×(1)1vote)

也就是说,我们可以将选民的权重总和乘以(代表“是”)或(代表“否”)。这是有道理的:如果选民1的平均正确答案等于,而选民2的平均答案只有,那么应该比第一人的投票更重要。另一方面,如果第一人称仅回答了10个此类问题,而第二人回答了1000个此类问题,则我们对第二人的技能水平比对第一人的技能更有信心-第一人可能很幸运,并且在获得10个相对成功的答案后,他将继续获得更差的结果。- 1 0.9 0.8+11.9.8

因此,更精确的问题听起来可能是这样的:是否存在兼具强度置信度的统计指标?

Answers:


4

您应该将选民的专业知识视为系统的潜在变量。然后,您可以使用贝叶斯推理解决您的问题。作为图形模型的表示可能是这样的:

图形模型

让我们表示变量对真正的答案,为选民的选票和了它的历史。假设您还有一个“专家”参数这样。如果在这些上放一些先验(例如Beta优先),则应该能够使用贝叶斯定理来推断,然后在以计算 AViiHiμiPr(A=Vi)=μiμiPr(μiHi)μi

Pr(AVi,Hi)=μiPr(A,μiAi,Hi) dμi

这些系统很难解决。您可以将EM算法用作近似值,也可以使用完整的似然最大化方案来执行精确的贝叶斯推断。

看一下这篇关于众包的变异推理,Liu,Peng和Ihler 2012昨天在NIPS!上发表),其中提供了解决此任务的详细算法。


1
感谢您的回答,但请您更具体一点吗?特别是您所说的专业知识是什么?如果只是该人将正确回答的可能性,那么我们已经将其估计值作为先前回答的平均值,因此它不是潜在的。如果您的意思不是专业知识结合了对我们估计的平均值和信心,那么我们如何传播概率以获得专业知识和结果?
ffriend 2012年

是的,您可以使用“专家”变量和贝叶斯推断来表示平均值和置信度。我添加了一些解释和对我的答案的引用。希望能有所帮助!
Emile 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.