经验CDF与CDF


21

我正在学习经验累积分布函数。但是我还是不明白

  1. 为什么称其为“经验的”?

  2. 经验CDF和CDF有什么区别?



关于盒子模型中票证,有一个简单,直接,优雅的解释:CDF描述了原始盒子中的内容。将样本(这是从原始框中抽取的一组票证:所谓的“经验”数据)放入一个空框时所获得的ECDF。
ub

要注意的一件事是,经验分布通常受其构造方式的限制,而CDF可能不受限制。例如,如果您根据Poisson变量的观测值建立经验CDF,则获得的ECDF将以最高观测频率为界,而真正的CDF为无界。
阿克萨卡(Aksakal)

Answers:


27

X为随机变量。

  • 累积分布函数F(x)给出了P(Xx)
  • 经验累积分布函数函数G(x)给出P(Xx)根据你的样品中观测。

区别在于使用了哪种概率测度。对于经验CDF,您可以使用由经验样本中的频率计数定义的概率度量。

简单示例(硬币翻转):

X为随机变量,表示单次掷硬币的结果,其中X=1表示正面,X=0表示背面。

:一个公平的硬币CDF由下式给出

F(x)={0for x<012for 0x<11for 1x

如果翻转2头和1尾,经验CDF将为:

G(x)={0for x<023for 0x<11for 1x

实证CDF会反映你的样品中,2/3的空翻是头。

另一个示例(对于正常分布,F为CDF):

X为均值为0,标准差为1的正态分布随机变量。

CDF由下式给出:

F(x)=x12πex22

x1<x2<x3

G(y)={0for y<x113for x1y<x223for x2y<x31for x3y

如果有足够的IID抽取(并且满足一定的规律性条件),经验CDF将收敛于总体人口的CDF。


12

经验CDF和CDF有什么区别?

是的,他们不同。经验性cdf是适当的cdf,但是经验性cdf即使不从离散分布中抽取,也总是离散的,而分布的cdf可以是离散之外的其他东西。

如果将样本视为值的总体,则每个样本的概率均等(即每个观察值的概率为1 / n),则该分布的cdf将是数据的ECDF。

为什么称其为“经验的”?

它是基于样本的人口CDF的估算值;具体来说,如果您在每个不同的数据值处处理样本的比例,并像对待总体中的概率一样对待它,则会得到ECDF。

经验的含义类似于“通过观察而不是理论”,在这种情况下,这正是含义……使用观察来确定分布函数。


10

经验CDF是根据实际数据集构建的(在下图中,我使用了来自标准正态分布的100个样本)。CDF是一种理论构造-如果您可以无限次取样,就会发现CDF。

经验CDF通常非常接近CDF,尤其是对于大样本(实际上,有定理表明,随着样本数量的增加,CDF收敛到CDF的速度有多快)。

Empirical CDF vs CDF


10

经验是您从数据和观察中获得的东西。例如,假设您想了解一个国家中人的身高分布情况。您首先要测量人员,然后得出可以近似于分布的直方图。然后计算经验CDF。

如果使用统计分布(确定性公式,它使用相同的参数给出完全相同的输出),则也可以计算其CDF。

您可以说:“这个国家的人口高度分布与正态分布相似,平均值为1.75 m,标准差为0.1 m。那么您可以使用〜的CDFñμ=1.75 σ=0.1  而不是经验分布的构造CDF。


是否使用置信度度量来表示CDF和Emperical CDF在世界上所有实验采样的限制内描述相同种群的可能性?例如,这似乎适用于选举投票。(尽管可能不是,因为不能严格描述输出为函数...)
BenPen

3

根据Dictionary.com,“经验”的定义包括:

来自经验或实验或由经验或实验指导。

因此,经验CDF是您从数据中获得的CDF。这与从统计或概率模型(如正态分布)获得的理论CDF(通常称为“ CDF”)形成对比。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.