有限方差和无限方差有什么区别


33

有限方差和无限方差有什么区别?我的统计知识非常基础;维基百科/谷歌在这里没有太多帮助。


8
具有无限方差的分布是重尾的;有很多离群值,并且其属性可能与过去所看到的不同。例如,从柯西分布中抽取的样本均值与各个样本具有相同的(柯西)分布。这与通常认为样本均值比任何单个样本都更好的“估计量”的普遍看法完全不同。
Dilip Sarwate 2014年

4
不,重尾与具有无限方差不一样,或者至少在我看来不是。但是,我不是统计学家,因此您应该等待这个论坛中排名较高的用户给出更权威的答案。
Dilip Sarwate 2014年

4
当定义总体方差的积分(总和)增加到超过任何有限界限时,就会发生无限方差。这里
Glen_b-恢复莫妮卡2014年

2
我认为最重要的是,对于这样的总体,大多数中央极限定理都无法成立,因此一些常见的结果将会崩溃。
Henry.L

1
重要的一点:如果一个的方差人口是无限的,但一个的方差样品是有限的,然后使用像样本统计群体的方差或标准偏差的任何估计,或小号,然后šs2s将有严重的偏见。由于这么多的测试统计数据基于对效果的估计标准误差进行归一化的效果度量,并且由于这么多的配置项基于对估计的标准误差的缩放,因此这意味着可能会对具有无限方差的变量进行统计推断偏颇sñ
亚历克西斯

Answers:


48

随机变量具有“无限方差”是什么意思?随机变量具有无限期望是什么意思?两种情况下的解释都非常相似,因此让我们从期望的情况开始,然后再进行期望的变化。

是连续型随机变量(RV)(我们的结论将是有效的更普遍,对于分立的情况下,通过更换和积分)。为了简化论述,让我们假设X 0XX0

它的期望由积分E X =定义 当该积分存在时,即是有限的。另外,我们说期望不存在。这是一个不正确的积分,并且通过定义是 ∫ 0 X ˚F X

EX=0xf(x)dx
对于限制是有限的,从尾的贡献必须消失,也就是,必须有 限量→交通∫ 一个 X ˚F X
0xf(x)dx=lima0axf(x)dx
这种情况的必要(但不充分)条件是 lim x
一种一种XFXdX=0
。上面显示的情况说明的是,(右)尾对期望贡献必须消失。如果不是这样,则期望值由任意大的实现值贡献。在实践中,这将意味着经验方法将非常不稳定,因为它们将被很少的非常大的实现值所支配XXFX=0。并且请注意,样本的这种不稳定性意味着在大型样本中不会消失---它是模型的内置部分!

在许多情况下,这似乎是不现实的。假设有一个(人寿)保险模型,所以模拟一些(人)寿险。我们知道不会出现X > 1000,但是实际上我们使用的模型没有上限。原因很清楚:没有上限是已知的,如果一个人(比如说)一百一十岁,没有理由他不能活一年以上!因此,具有严格上限的模型似乎是人为的。不过,我们不希望极端的尾巴产生很大影响。XX>1000

如果的期望值是有限的,那么我们可以将模型更改为硬上限,而不会对模型产生不适当的影响。在模糊上限的情况下,这似乎很好。如果模型有无限的期望,那么,我们为模型引入的任何硬上限都会产生戏剧性的后果!那就是无限期望的真正重要性。X

有了有限的期望,我们就可以模糊上限。有无限的期望,我们不能

现在,就必要的必要变数而言,可以说几乎相同。

为了更清楚一点,让我们看一个例子。对于本示例,我们使用在R包(在CRAN上)执行器中实现的Pareto分布,即pareto1 ---单参数Pareto分布,也称为Pareto类型1分布。它具有由 某些参数中号>0α>0。当α>

FX={ααXα+1个X0X<
>0α>0,期望存在并且由 α给出α>1个。当α1的预期不存在,或者说,它是无限的,因为积分定义它发散到无穷远。我们可以定义初刻分布(见后什么时候我们使用tantiles和内侧,而不是位数和中位数? 一些信息和参考文献)为 Ë中号=中号αα-1个α1个 (在此存在不考虑如果期望本身存在)。(后来编辑:我发明了“第一时刻分布”这个名字,后来我知道这与“正式”地命名部分力矩有关)。
Ë中号=中号XFXdX=αα-1个-α中号α-1个

当期望存在时(),我们可以将其除以得到相对的一阶矩分布,由 E r M = E m / E = 1给出α>1个α是只是一点点比一个大,所以期望“刚刚几乎不存在”,确定预期的积分会慢慢收敛。让我们看一下m=1α=1.2的示例。让我们绘制然后E

Ë[R中号=Ë/Ë=1个-中号α-1个
α=1个α=1.2在R的帮助下 r M Ë[R中号
### Function for opening new plot file:
open_png  <-  function(filename) png(filename=filename,
                                     type="cairo-png")

library(actuar) # from CRAN
### Code for Pareto type I distribution:
# First plotting density and "graphical moments" using ideas from http://www.quantdec.com/envstats/notes/class_06/properties.htm   and used some times at cross validated

m  <-  1.0
alpha <- 1.2
# Expectation:
E   <-  m * (alpha/(alpha-1))
# upper limit for plots:
upper  <- qpareto1(0.99, alpha, m)   
#
open_png("first_moment_dist1.png")
Er  <- function(M, m, alpha) 1.0 - (m/M)^(alpha-1.0)
### Inverse relative first moment distribution function,  giving
#   what we may call "expectation quantiles":
Er_inv  <-   function(eq, m, alpha) m*exp(log(1.0-eq)/(1-alpha))     

plot(function(M) Er(M, m, alpha), from=1.0,  to=upper)
plot(function(M) ppareto1(M, alpha, m), from=1.0,  to=upper, add=TRUE,  col="red")
dev.off()

产生这个情节:

在此处输入图片说明

μα>2

上面定义的函数Er_inv是相对的第一矩的逆分布,类似于分位数函数。我们有:

> ### What this plot shows very clearly is that most of the contribution to the expectation come from the very extreme right tail!
# Example   
eq  <-  Er_inv(0.5, m, alpha)
ppareto1(eq, alpha, m)
eq

> > > [1] 0.984375
> [1] 32
> 

μñ=5

set.seed(1234)
n  <-  5
N  <-  10000000  # Number of simulation replicas
means  <-  replicate(N,  mean(rpareto1(n, alpha, m) ))


> mean(means)
[1] 5.846645
> median(means)
[1] 2.658925
> min(means)
[1] 1.014836
> max(means)
[1] 633004.5
length(means[means <=100])
[1] 9970136

为了获得可读的图,我们仅显示值小于100的样本部分的直方图,这是样本的很大一部分。

open_png("mean_sim_hist1.png")
hist(means[means<=100],  breaks=100, probability=TRUE)
dev.off()

在此处输入图片说明

算术平均值的分布非常偏斜,

> sum(means <= 6)/N
[1] 0.8596413
> 

几乎86%的经验均值小于或等于理论均值,即期望值。 这是我们应该期望的,因为对均值的大部分贡献来自极高的尾巴,这在大多数样本中都没有体现

我们需要回头重新评估我们先前的结论。尽管均值的存在使得可以对上限进行模糊处理,但是我们看到,当“均值几乎不存在”时,意味着积分在缓慢收敛,我们实际上不能对上限进行模糊处理缓慢收敛的积分的结果是,最好使用不假定期望存在的方法。当积分非常缓慢地收敛时,实际上它似乎根本就没有收敛。收敛积分带来的实际好处是在缓慢收敛情况下的嵌合体!这是理解NN Taleb在http://fooledbyrandomness.com/complexityAugust-06.pdf中得出的结论的一种方法。


2
很棒的答案。
卡尔,

2

方差是对随机变量值分布的分散程度的度量。这不是唯一的测量方法,例如平均绝对偏差是替代方法之一。

无限变化意味着随机值不倾向于集中围绕平均值得太紧。这可能意味着有足够大的概率是一个随机数将是非常远离平均值。

像正态分布(高斯分布)一样,可以产生远离均值的随机数,但是此类事件的概率随着偏差的幅度而迅速降低。

在这方面,当您查看柯西分布或高斯(正态)分布图时,它们在外观上看起来并没有很大不同。但是,如果您尝试计算柯西分布的方差,它将是无限的,而高斯分布是有限的。因此,与柯西的分布相比,正态分布的均值更加紧密。

顺便说一句,如果您与数学家交谈,他们会坚持认为柯西分布没有明确的均值,它是无限的。对于那些指出柯西对称的事实的物理学家来说,这听起来很荒谬,因此,它必然会有平均值。在这种情况下,他们认为问题出在您对均值的定义上,而不是柯西分布上。


2
-

1
@kjetilbhalvorsen,“没有数学家会说柯西有无限的均值”-该均值的定义不完全是我的统计学教授告诉我的,而我的理论Physcis顾问感到惊讶的是,甚至还有一个关于均值的问题, “当然是零,如果您不同意,那么您对均值的定义就会出问题”
Aksakal,2016年

您是否问过他关于均值的定义?
kjetil b halvorsen

@ kjetilbhalvorsen,Riemann积分,如果您正在谈论数学教授。他的观点是,在黎曼总和中,您没有定义总和的特定顺序或总和的划分,因此您的总和将是无限的。物理学家的观点是对称的,显然,它“必须为零”
Aksakal,2016年

1
然后,也许您可​​以告诉他,他定义了中位数,而不是均值。
kjetil b halvorsen

2

另一种查看方法是分位数功能。

FX=X

然后我们可以计算一个时刻或期望

ËŤX=-ŤXFXdX

或者作为(替换 FXdX=dF):

ËŤX=01个ŤFdF

假设我们希望先计算一下 ŤX=X。在下图中,它对应于F和垂直线之间的区域X=0 (其中,当 ŤX<0)。第二弯矩将对应于同一区域沿线在处旋转时扫过的体积。X=0 (有一个因素 π 区别)。

柯西与正常

图像中的曲线显示了每个分位数对计算的贡献。

对于正态曲线,只有很少的分位数具有很大的贡献。但是对于柯西曲线,还有更多的分位数具有很大的贡献。如果曲线ŤF 当F接近零或一时,速度足够快到无穷大,则面积可以无限大。

由于被积物本身的距离(均值)或平方距离(方差)可能变为无穷大,所以这个无限可能并不那么奇怪。只是多少体重那些无限的尾巴有,多少F。

在距零(均值)的距离或距均值(方差)的平方距离的总和/积分中,相距很远的单个点比附近的许多点对平均距离(或平方距离)的影响更大。

因此,当我们移向无穷远时,密度可能会降低,但是对某些(增加的)数量之和的影响(例如距离或平方距离)不一定会改变。

如果对于一定距离的每个质量 X 一段距离内有一半或更多的质量 2X 那么你会得到总质量的总和 1个2ñ 会收敛,因为质量的贡献减少了,但是方差变得无限大,因为质量的贡献没有减少 2Xñ21个2ñ


1

您遇到的大多数分布可能具有有限的方差。这是一个离散的例子X 具有无限方差但均值有限:

令其概率质量函数为 pķ=C/|ķ|3,对于 ķž{0}p0=0,在哪里 C=2ζ3-1个:=2ķ=1个1个/ķ3-1个<。首先因为ËX∣ <它具有有限的均值。它也有无限方差,因为2ķ=1个ķ2/|ķ|3=2ķ=1个ķ-1个=

注意: ζX:=ķ=1个ķ-X是黎曼zeta函数。还有许多其他示例,只是写下来并不那么愉快。


4
正因为分布是对称的(即偶函数),也没有必要使平均0; 该平均值可能不存在,因为求和/积分的形式为-
Dilip Sarwate 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.