给定一系列iid随机变量,例如,对于,为,我试图限制经验均值的预期次数会超过一个值,因为我们继续绘制样本,即:
如果我们假设对于,我们可以使用Hoeffding不等式得出
哪个看起来不错(也许),但实际上是一个松散的界限,是否有更好的方法来限制此值?我希望可能会有一种方法,因为不同的事件(每个)显然不是独立的,我不知道有任何方法可以利用这种依赖性。同样,最好删除大于平均值的限制。
编辑:如果我们使用马尔可夫不等式,可以消除对大于均值的限制:
给定一系列iid随机变量,例如,对于,为,我试图限制经验均值的预期次数会超过一个值,因为我们继续绘制样本,即:
如果我们假设对于,我们可以使用Hoeffding不等式得出
哪个看起来不错(也许),但实际上是一个松散的界限,是否有更好的方法来限制此值?我希望可能会有一种方法,因为不同的事件(每个)显然不是独立的,我不知道有任何方法可以利用这种依赖性。同样,最好删除大于平均值的限制。
编辑:如果我们使用马尔可夫不等式,可以消除对大于均值的限制:
Answers:
这是一种手工制作的方法,对此我将不胜感激,(对此提出批评通常是最有帮助的)。如果我理解正确,OP将计算样本均值,其中每个样本包含来自新rv的先前样本+1观测值。表示每个样本均值的分布。然后我们可以写
考虑的样品大小之后将样本均值的分布几乎是正常的,表示它。然后我们可以写
解决我们得到 其中是标准法线cdf,是iid进程的标准偏差,是其平均值。插入边界并重新排列,我们得到
请注意,此界限还取决于过程的差异。这比问题中提出的约束更好吗?这将主要取决于样本平均值的分布如何“迅速”变为“几乎正态”。为了给出一个数值例子,假设该 。还假设随机变量在是统一的。然后和。考虑与平均值的10%的偏差,即设置。然后:对于,我建议的边界(对于有意义)变得更加严格。对于,霍夫廷界为而我建议的是。Hoeffding边界收敛到而我建议的边界如果增大,则两个边界之间的差异减小但仍然可见:对于20%的偏差,,Hoeffding边界收敛到而我建议将收敛到(即正常cdfs的总和对整体界线的贡献很小)。
更一般地说,我们注意到对于,霍夫定界收敛于
由于对于较小的值(这是有意义的情况),变大了,因此即使样本使得样本均值的分布缓慢收敛为,仍然存在在紧密度可能胜过它的情况。正态分布。