多数票的最佳近似是什么?


18

多数表决操作经常出现在容错中(毫无疑问,在其他地方),该函数输出的位等于输入值中出现频率最高的那个位。为简单起见,我们假设只要输入包含相等数量的状态0和状态1的位,便输出0。

通过返回最常出现在输入中的值,对于每个输入,有两种以上可能性存在,并且在出现平局的情况下,返回最先出现在字典上的最频繁值。我们将此功能称为“多个投票”。

当每个输入具有固定的概率分布(且输入中每个dit的分布相同)时,我对此类函数的输出感兴趣。我特别关心以下问题。

给定一个集合S={S1,S2,...,Sn},如果该集合被独立随机采样N次,且每次选择Si t h元素的概率为,则对于v的固定选择,这些输出S v的多次表决的概率是多少?piithSvSv

现在,直接将上述问题的确切答案作为多项式分布的总和来计算。但是,就我的目的而言,这不是理想的,并且近似逼近会更好。所以我的问题是:

对于上述概率,哪种闭合形式的近似值在与精确值的最大距离上具有最紧密的界限?


我不知道,但是我建议使用搜索短语“控制理论共识问题”或“控制理论共识问题”。它是与分布式计算共识问题不同的问题,可能正是您所需要的。
亚伦·斯特林

您是否正在寻找一个近似值,当N大于n时,近似值会很好地起作用?如果是这样,则平局决胜规则必须无关紧要。
伊藤刚(Tsuyoshi Ito)

@TsuyoshiIto:是的,确实如此,但该规则无关紧要,但我想确保问题提出得当。我并不在乎关系是如何断开的,因为很容易限制这种差异。
Joe Fitzsimons

1
好吧,这是包络估计的后面……让是您选择集合S i的次数。这是一个二项式变量。假装他们是独立的。现在,对于Y v的固定值,您可以计算得到Y v的值的概率,对于该值,可以计算出它赢得所有其他变量的概率。这应该给概率一个很好的界限。当然,它们并不是最严格的-您愿意考虑的依赖性越多,您的估算就越精确,但是您必须进行的计算就越多。YiSiYvYv
Sariel Har-Peled

Answers:


1

如果对于所有i v来说,则pv>piiv

Pr[outcome is different from v]minT(Pr[B(N,pv)T]+Pr[ivB(N,pi)T]),

其中是二项式分布,而T是任意阈值。堵塞T = N p v + max i v p v/ 2B(n,p)TT=N(pv+maxivpv)/2并使用切尔诺夫(Chernoff)边界,可以将该概率的上限限制为eΩ(N)

当然,如果 不是最大,则得到相反的图像。有绝对的可能性, v不是结果。pvv


1
感谢您考虑问题,但这不是我想要的。这不是封闭形式。我需要对无数个指数求和。我已经知道如何编写确切的解决方案,并且我对各个术语都知道很多近似值,但这不是我想要的。我正在寻找解决方案的封闭形式,而不是个别条款。我还需要对错误进行适当的约束。
乔·菲茨西蒙斯

1
您可以使用相同的方法获得封闭式表单(如果对附加因子满意)。为了限制错误,可以使用Berry-Eseen定理而不是Chernoff限制。n
ilyaraz 2011年

@ilyaraz我想了解你的第一个不适。您能更好地向我解释它为什么成立吗?我认为您已经以某种方式使用了联合绑定,但是我听不懂。谢谢:)
AntonioFa 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.