如果是在上具有非零值的概率分布,则对于哪种类型,存在常数,使得 对于所有吗?
上面的不等式实际上是分布及其压缩版本之间的Kullback-Leibler散度。我发现这种不等式适用于指数分布,伽玛分布和威布尔分布,并且我想知道这是否适用于更大的概率分布类别。(1 + ϵ ) p (x (1 + ϵ ))
知道不平等意味着什么吗?
如果是在上具有非零值的概率分布,则对于哪种类型,存在常数,使得 对于所有吗?
上面的不等式实际上是分布及其压缩版本之间的Kullback-Leibler散度。我发现这种不等式适用于指数分布,伽玛分布和威布尔分布,并且我想知道这是否适用于更大的概率分布类别。(1 + ϵ ) p (x (1 + ϵ ))
知道不平等意味着什么吗?
Answers:
写
对数以及和之间的关系建议将及其参数都表示为指数。为此,定义
对于定义了右手边且在等于所有实数。注意,变量需要并且(以为分布的密度)总概率定律可以表示为x = e y d x = e y d y p
让我们假设时。ý → ± ∞ p0∞p(1) 这排除了概率分布,其中密度在或附近有无限多个尖峰。特别是,如果的尾部最终是单调的,则暗含了这一假设,表明它不是严格的假设。
为了使对数运算更容易,还要注意
因为将执行以下计算直至倍数,所以请定义
我们也可以用替换,其中对应,正对应正。Ë δ δ = 0 ε = 0 δ ε
不等式失败的一种明显方法是使积分偏离某个,例如,如果存在正数的任何适当间隔,无论多么小,在间隔中都等于零而不为零。以正概率无限。ε∈ (0,1][ù,v]pp[ü-ε,v-ε]
因为关于的性质的问题是不确定的,所以我们可能陷入有关平滑度的技术问题。让我们避免这种问题,仍然希望获得一些见识,方法是假设所有地方的都有尽可能多的导数。(如果是连续的,则两个就足够了。)因为保证在任何有界集合上仍然是有界的,所以这意味着时永远不会为零。p q q ' ' q p (X )X > 0
请注意,这个问题确实与从上方接近零时的行为有关。由于该积分是在间隔中的连续函数,因此当限制为任何正间隔时,它将获得一些最大,这使我们能够选择,因为显然
使不平等起作用。这就是为什么我们只需要关心模的计算。
使用可变的改变从到,从到,和到,让我们计算通过第二顺序(或在实现的希望)简化。为此定义
是围绕的泰勒展开式的阶余数。
如后面的假设所述,在左侧积分中将变量更改为表示变量必须消失。在右手积分中将变量更改回
当且仅当在右侧的的系数是有限的时,不等式成立(在我们的各种技术假设下)。
这是停止的好时机,因为它似乎揭示了一个基本问题:恰好在的泰勒展开式中的二次误差不成立时受的二次函数限制。当接近爆炸(相对于分布)。
让我们检查问题中提到的一些情况:指数分布和伽玛分布。(指数是Gamma的特例。)我们不必担心比例参数,因为它们仅改变测量单位。仅非比例参数很重要。
在此,因为对于,,所以 围绕任意的泰勒展开式是带有余数的泰勒定理表明对于足够小的由主导。由于的期望是有限的,所以不等式适用于Gamma分布。
相似的计算暗示了Weibull分布,半正态分布,对数正态分布等的不等式。实际上,要获得反例,我们将需要违反至少一个假设,迫使我们研究在某个间隔消失或为分布。不能连续两次微分,或者具有无限多种模式。这些易于测试,可以应用于统计建模中常用的任何分布族。