在
我想知道是否存在以下问题的下限(就样本复杂性而言): 给定示例oracle访问{ 1 ,… ,n }上的两个未知分布D1D1D_1,,测试(whp)是否D2D2D_2{1,…,n}{1,…,n}\{1,\dots,n\} D1=D2D1=D2D_1=D_2 或d2(D1,D2)=∥D1−D2∥2=∑ni=1(D1(i)−D2(i))2−−−−−−−−−−−−−−−−−−√≥ϵd2(D1,D2)=‖D1−D2‖2=∑i=1n(D1(i)−D2(i))2≥ϵ\operatorname{d_2}(D_1,D_2)=\lVert D_1-D_2\rVert_2 = \sqrt{\sum_{i=1}^n\left(D_1(i)-D_2(i)\right)^2} \geq \epsilon Batu等。[BFR + 00]显示O(1ϵ4)O(1ϵ4)O\left(\frac{1}{\epsilon^4}\right)样本足够,但是我还没有发现下界的任何提法吗? 我认为总可以显示Ω(1ϵ2)Ω(1ϵ2)\Omega(\frac{1}{\epsilon^2})通过减少区分此问题的公平与ϵϵ\epsilon偏向硬币的任务(模拟仅支持两点的分布,并根据iid抛硬币来回答测试者的问题)来降低下限,但这仍然留下二次缺口... (我要关注的另一点是估计(最大为累加ϵϵ\epsilon)此L2L2L_2距离的下限-再次,我在文献中未发现此类结果的参考) 谢谢你的帮助,