期望值与最可能值(模式)


15

分布的期望值是平均值,即加权平均值 f(x)

E[x]=+xf(x)dx

最可能的值是众数,即最可能的值。

但是,我们期望以某种方式看到很多次吗?从这里报价:E[x]

如果结果的概率不相等,则必须用加权平均值代替简单的平均值,这要考虑到某些结果比其他结果更有可能的事实。然而,直觉保持不变:x的期望值是人们期望平均发生的xix

我不明白“平均发生”是什么意思,这是否意味着,从长远来看,我希望花很多时间才能看到E[x]x的其他值更多x?但这不是模式的定义吗?

那么如何解释该陈述?E [x]的概率含义是E[x]什么?


我还想举个例子,让我感到困惑。通过研究分布,我了解到模式 为,而,其中是数据的自由度。χ2χmode2=ν2E[χ2]=νν

我在大学听说,在使用最小二乘法拟合一组数据后进行测试时,我应该期望得到因为“这通常会发生”。χ 2听,说:νχ2χ2ν


我是否误解了所有这些,或者期望值是否很有可能?(即使可能的值当然是模式)


4
我真的很喜欢这个问题的即取即用隐喻的功能,因为它产生了一个简单,清晰的答案:对随机变量的期望是其值的总和(如在票据上所绘)除以票数。而已。任何不遵循该定义的陈述(或更复杂的数学等效形式)都只是一种试探法,在某些情况下可能很不正确。
ub

Answers:


18

对于正态分布,期望值(即平均值)等于众数。

通常,不仅期望值不仅是最可能的(或最高密度的),而且可能没有发生的可能性。例如,考虑等于0或2的随机变量X,每个概率为0.5。则EX = 1,但期望值1出现的概率为0,而0和2均为分布模式。

“ x的期望值是一个人期望平均发生的事情”这句话是非技术性的外行语言,这种混淆可以证明,这只会使事情变得混乱。期望值是概率的数学平均值,具有非常特定的含义。以外行的语言来说,期望值或“平均”可能是通常期望发生的事情。如果将“平均”解释为所发生事件的数学平均值,则可以对这些进行协调。

期待您的

乔·阿维尔


1
提出一个问题:关于中位数的保证是可能的
明亮的星星,

正如@TrevorAlexander所说,模式也不提供任何保证。考虑连续分布的模式。
蒂姆

3
@Trevor Alexander总是有一个可能的中位数(正概率或密度)。但是,并非所有的中位数都是可能的。随机变量X的值是任何点m为其中P X 1 / 2。如果X等于1,2,3或4,每个概率1/4,则任意数量在区间[2,3]是X的中值P(Xm)1/2P(Xm)1/2
标记L.石

5

期望值是一个非常抽象的先验值,没有理由认为它是最可能的结果。正如其他人指出的那样,很容易构造随机变量如果X是连续的,则与密度相同)

P(X=E(X))=0
X

期望值的唯一依据以及我们“期望经常看到它”的原因是大数定律

如果您有独立的,均匀分布的变量 X i,则nXi

X1++XnnE(X)

(对于的适当含义,目前尚无意义)

这是什么意思?想象一下,您以概率p > 1投掷硬币着陆头的 2,我们将与数字1相关联,着陆尾部的概率1-p(即0)。最可能的结果是什么?1!(即头)期望值是多少?ÈX=1p+01-p=pp>1211p0

E(X)=1p+0(1p)=p

现在显然“ p”将永远不会发生(它是头还是尾,要么是0,要么是1)。

但是,将硬币发射10.000次,并记录其超过总掷出次数的次数。该数字记录了我们直观地想到的平均值(“平均头数”)。大数定律告诉您,这个数将接近E(X)=p


我不会说大数定律是期望值的唯一理由。例如,en.wikipedia.org / wiki /…是考虑效用函数的期望值的理由(我尚未研究过证明,但是如果它以某种方式基于大数定律,我会感到惊讶)。
Juho Kokkala '16年

3

我不喜欢“期望值”一词,在教授概率时也没有使用它。我认为“算术平均值”更好,因为6面模具的算术平均值为3.5,但不会出现这样的数字。我上大学时确实听说过“期望值”一词。许多技术术语与明显的非技术含义不一致。(我想到的是“或”。)

请注意,分布可能具有多个模式,但算术平均值是唯一的。众数,均值和中位数不同,用途也不同。


1
上一个不错的“或”。这让我想起了我在线性编程课程中学习的几种替代定理。它们的格式为“要么A为真,要么B为真,但不能同时为真”。将它表示为A xor B会容易得多。在随意的街头交谈中,我听不到xor的使用。
马克·L·斯通

2

使用离散分布最容易看出该差异:

考虑两组值,每个值都有可能相等地绘制出来:{1,2,2,2,10}和{1,2,2,2,3}。

两者具有相同的模式(2),但期望值不同。期望值将较大的值放在额外的权重上,而该模式仅查找频繁出现的值。因此,如果您从该分布中抽出很多次,则样本平均值将接近预期值,而最常见的整数将接近于众数。

mode=argmaxf(x)xf(x)

学习统计学时,使用语言区分中心趋势的不同度量标准是一个常见问题。例如,中位数是另一种度量值,不会因平均值之类的较大值而产生偏差。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.