为什么样本的CDF均匀分布


17

在这里读到,给定样本来自cdf的连续分布,该样本对应于X1,X2,...,XnFXUi=FX(Xi)遵循标准均匀分布。

我已经使用Python中的定性模拟对此进行了验证,并且我很容易就能验证这种关系。

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

结果如下图:

显示正态分布的样本和cdf的图。

我无法理解为什么会这样。我认为这与CDF的定义及其与PDF的关系有关,但是我缺少一些东西...

如果有人可以指点我阅读有关该主题的文章或帮助我获得对该主题的直觉,我将不胜感激。

编辑:CDF看起来像这样:

样本分布的CDF


2
计算的cdf 。FX(X)
詹雄2015年

2
在有关模拟的任何书籍中,您都可以找到此属性的证明(对于连续rv而言),因为这是cdf逆模拟方法的基础。
西安

2
另请尝试Google-ing 概率积分变换
Zachary Blumenfeld 2015年

1
@西安很好地指出结论仅适用于连续随机变量。有时,此结果被错误地用于离散随机变量。在另一方面,也注意到许多证据涉及步骤,其中假定的严格单调˚F,这也是一个太强假设。以下链接提供了关于此主题的严格摘要:people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdfP(F(X)x)=P(XF1(x))F

@Zhanxiong 的唯一必要条件是它是càdlàg。F
AdamO

Answers:


19

假设是连续的并且在增加。限定ž = ˚F XX ,并注意Ž取入值[ 0 1 ]。然后 ˚F ŽX = P ˚F XX X = P X ˚F - 1 XX = ˚F X˚F -FXž=FXXž[01个]

FžX=PFXXX=PXFX-1个X=FXFX-1个X=X

在另一方面,如果是均匀随机变量,取入值[ 0 1 ]˚F ÙX = [R ˚F ÙÛ ü[01个]

FüX=[RFüüdü=0Xdü=X

FžX=FüXX[01个]


Z是否具有均匀(0,1)分布吗?
StatsSorceress

ž01个

8

FXFXFXF-1个X=F-1个pXpFF-1个=λF-1个F

F一种<bPF-1个一种<X<F-1个b=P一种<FX<b=b-一种


ÿ=FX
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.