多数票的最佳近似是什么？

多数表决操作经常出现在容错中（毫无疑问，在其他地方），该函数输出的位等于输入值中出现频率最高的那个位。为简单起见，我们假设只要输入包含相等数量的状态0和状态1的位，便输出0。

通过返回最常出现在输入中的值，对于每个输入，有两种以上可能性存在，并且在出现平局的情况下，返回最先出现在字典上的最频繁值。我们将此功能称为“多个投票”。

当每个输入具有固定的概率分布（且输入中每个dit的分布相同）时，我对此类函数的输出感兴趣。我特别关心以下问题。

给定一个集合 $S=\{S_1, S_2,... ,S_n\}$ ，如果该集合被独立随机采样 $N$ 次，且每次选择的元素的概率为，则对于的固定选择，这些输出的多次表决的概率是多少？ $p_i$ $i^{th}$ $S$ $v$ $S_v$

现在，直接将上述问题的确切答案作为多项式分布的总和来计算。但是，就我的目的而言，这不是理想的，并且近似逼近会更好。所以我的问题是：

对于上述概率，哪种闭合形式的近似值在与精确值的最大距离上具有最紧密的界限？

co.combinatorics

— 乔·菲茨西蒙斯
source

我不知道，但是我建议使用搜索短语“控制理论共识问题”或“控制理论共识问题”。它是与分布式计算共识问题不同的问题，可能正是您所需要的。

— 亚伦·斯特林

您是否正在寻找一个近似值，当N大于n时，近似值会很好地起作用？如果是这样，则平局决胜规则必须无关紧要。

— 伊藤刚（Tsuyoshi Ito）

@TsuyoshiIto：是的，确实如此，但该规则无关紧要，但我想确保问题提出得当。我并不在乎关系是如何断开的，因为很容易限制这种差异。

— Joe Fitzsimons

好吧，这是包络估计的后面……让

是您选择集合

。这是一个二项式变量。假装他们是独立的。现在，对于

的固定值，您可以计算得到

值的概率，对于该值，可以计算出它赢得所有其他变量的概率。这应该给概率一个很好的界限。当然，它们并不是最严格的-您愿意考虑的依赖性越多，您的估算就越精确，但是您必须进行的计算就越多。

Y_{i}

$Y_i$

S_{i}

$S_i$

Y_{v}

$Y_v$

Y_{v}

$Y_v$

— Sariel Har-Peled

如果对于所有，则 $p_v > p_i$ $i \ne v$

P r [outcome is different from v] \leq min_{T} (P r [B (N, p_{v}) \leq T] + P r [\forall i \neq v B (N, p_{i}) \geq T]),

$\mathrm{Pr}[\mbox{outcome is different from $v$}] \leq \min_T \left(Pr[B(N, p_v) \leq T] + Pr[\forall i \ne v \quad B(N, p_i) \geq T]\right),$

其中是二项式分布，而是任意阈值。堵塞 $B(n, p)$ $T$ $T = N (p_v + \max_{i \ne v} p_v) / 2$ 并使用切尔诺夫（Chernoff）边界，可以将该概率的上限限制为。 $e^{-\Omega(N)}$

当然，如果不是最大，则得到相反的图像。有绝对的可能性，不是结果。 $p_v$ $v$

— 伊利亚拉兹
source

感谢您考虑问题，但这不是我想要的。这不是封闭形式。我需要对无数个指数求和。我已经知道如何编写确切的解决方案，并且我对各个术语都知道很多近似值，但这不是我想要的。我正在寻找解决方案的封闭形式，而不是个别条款。我还需要对错误进行适当的约束。

— 乔·菲茨西蒙斯

您可以使用相同的方法获得封闭式表单（如果对附加因子

满意）。为了限制错误，可以使用Berry-Eseen定理而不是Chernoff限制。

n

$n$

— ilyaraz 2011年

@ilyaraz我想了解你的第一个不适。您能更好地向我解释它为什么成立吗？我认为您已经以某种方式使用了联合绑定，但是我听不懂。谢谢:)

— AntonioFa 2011年