Questions tagged «st.statistics»

1
在不显示值的情况下估计分布式节点之间的百分位数
此问题是从“交叉验证” 迁移而来的,因为可以在“理论计算机科学堆栈交换”上进行回答。 迁移 8年前。 我有一个非常独特的问题要解决,我希望这里的人可以让我对如何最好地解决它有所了解。 问题:假设在一组参与者之间共享N个号码的列表,使得没有一个参与者实际知道他们共享的任何号码。所有参与者都知道N(数字列表的大小)和列表上所有数字的总和,但仅是先验的。 通过一起工作,可以比较两个共享数字a和b,使参与者了解语句“ a <b”是否为真,但仅此而已。但是,这是一件极其昂贵的事情(阅读:完成单个比较可能要花费几秒钟,甚至是几分钟)。有关如何进行此操作的更多信息,请参见本文末尾。 最终,各方希望输出列表中哪些索引对应于列表中的“前K%”(最大的K%)共享数。当然,这可以通过排序或使用“前K个”选择算法来完成。但是,这些往往会使用大量比较,这是可以避免的。(这些是O(n log n)或O(n),具有相当大的隐藏常数。) 另一种选择是“猜测”数字X,其中(1-K)%小于X并且K%大于。然后,您可以将每个元素与X进行比较,看看有多少个元素较大,有多少个元素较小。如果您的猜测是错误的,请使用二进制搜索之类的方法进行修改,直到收敛到正确的解决方案为止。如果您的猜测是正确的,那么需要进行的比较少得多。 所以,我的问题是 仅给出N和总和,“预测” X的最佳方法是什么? 当然,这将取决于基础分布。对于不同的用例,基本的分布可能会有所不同,但将是已知的,因此,我对所有常见解决方案(正态,统一,指数,也许还有其他)的良好解决方案感兴趣。我也很想听听有关如何最好地进行“二元”搜索以最大程度减少步骤的建议(假设对基础分布有假设)。 附录:使用Shamir的秘密共享方案在参与者之间共享列表中的每个值。假设有M个参与者,并且列表的长度为N。那么,列表上的第i个数字由某个有限域F上阶次为M-1 的多项式表示的常数项是共享,则从F随机选择所有其他系数。然后,第j个参与者的份额为,fifif_i˚F 我(Ĵ )1 ≤ 我≤ Ñfifif_ifi(j)fi(j)f_i(j)1≤i≤N1≤i≤N1\leq i\leq N。鉴于此份额,参与者没有有关该号码的信息(从信息论的角度而言);实际上,没有适当的参与者子集可以结合知识来学习有关共享号码的任何信息。但是,使用复杂的安全多方计算技术,可以在不透露任何更多信息的情况下确定一个共享值是否小于另一个共享值。这种技术需要所有参与者的配合,这就是为什么这样做的成本如此之高,并且应该尽可能少地进行几次的原因。


4
我想知道是否存在以下问题的下限(就样本复杂性而言): 给定示例oracle访问{ 1 ,… ,n }上的两个未知分布D1D1D_1,,测试(whp)是否D2D2D_2{1,…,n}{1,…,n}\{1,\dots,n\} D1=D2D1=D2D_1=D_2 或d2(D1,D2)=∥D1−D2∥2=∑ni=1(D1(i)−D2(i))2−−−−−−−−−−−−−−−−−−√≥ϵd2⁡(D1,D2)=‖D1−D2‖2=∑i=1n(D1(i)−D2(i))2≥ϵ\operatorname{d_2}(D_1,D_2)=\lVert D_1-D_2\rVert_2 = \sqrt{\sum_{i=1}^n\left(D_1(i)-D_2(i)\right)^2} \geq \epsilon Batu等。[BFR + 00]显示O(1ϵ4)O(1ϵ4)O\left(\frac{1}{\epsilon^4}\right)样本足够,但是我还没有发现下界的任何提法吗? 我认为总可以显示Ω(1ϵ2)Ω(1ϵ2)\Omega(\frac{1}{\epsilon^2})通过减少区分此问题的公平与ϵϵ\epsilon偏向硬币的任务(模拟仅支持两点的分布,并根据iid抛硬币来回答测试者的问题)来降低下限,但这仍然留下二次缺口... (我要关注的另一点是估计(最大为累加ϵϵ\epsilon)此L2L2L_2距离的下限-再次,我在文献中未发现此类结果的参考) 谢谢你的帮助,

1
区分
给定一个从一组混合态中随机选择的量子态,正确识别的最大平均概率是多少?ρ一种ρ一种\rho_AññNρ1个。。。ρñρ1个。。。ρñ\rho_1 ... \rho_N一种一种A 通过考虑将与区分的问题,可以将该问题转变为两个状态的可区分性问题。ρ一种ρ一种\rho_Aρ乙= 1ñ− 1∑我≠ Aρ一世ρ乙=1个ñ-1个∑一世≠一种ρ一世\rho_{B} = \frac{1}{N-1}\sum_{i\neq A}\rho_i 我知道对于两个量子状态,当您最小化最大错误概率而不是最小化平均错误概率时,就状态之间的迹线距离而言,问题有一个很好的解决方案,我希望对于这个案例。当然可以根据POVM的优化来写出概率,但是我希望已经进行了优化的东西。 我知道有大量关于量子态可区分性的文献,过去几天我一直在阅读大量论文,试图找到这个问题的答案,但是我很难找到答案。问题的特殊变化。我希望有人知道文学更好,可以为我节省一些时间。 严格来说,我不需要确切的概率,一个好的上限就可以了。但是,任何一个状态与最大混合状态之间的差异都非常小,因此在该限制内边界必须有用。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.