Questions tagged «normal-distribution»

正态分布或高斯分布的密度函数为对称的钟形曲线。它是统计中最重要的分布之一。使用[normality]标签询问有关正常性测试的信息。







1
中心极限定理和大数定律
关于中央极限定理(CLT),我有一个非常初学者的问题: 我知道CLT指出iid随机变量的均值近似为正态分布(对于,其中n是求和的索引)或标准化随机变量将具有标准正态分布。n→∞n→∞n \to \inftynnn 现在,《大数定律》粗略地说,iid随机变量的均值(概率或几乎确定地)收敛至其期望值。 我不明白的是:如果按照CLT的规定,均值大致呈正态分布,那么它又如何同时收敛到期望值呢? 对我而言,收敛将意味着,随着时间的推移,平均值取非预期值的概率几乎为零,因此,分布的确不是正态的,而是除预期值外,各处均几乎为零。 欢迎任何解释。

3
评估正态分布的确定间隔
我知道正态分布的CDF缺少易于处理的公式,这是因为其中包含复杂的误差函数。 但是,我想知道是否有一个不错的公式。或针对此问题的“最新技术”近似值是什么。N(c−≤x&lt;c+|μ,σ2)N(c−≤x&lt;c+|μ,σ2)N(c_{-} \leq x < c_{+}| \mu, \sigma^2)

5
为什么我们不利用t分布来构造比例的置信区间?
要计算具有未知总体标准偏差(sd)的均值的置信区间(CI),我们采用t分布估算总体标准差。值得注意的是,CI=X¯±Z95%σX¯CI=X¯±Z95%σX¯CI=\bar{X} \pm Z_{95\% }\sigma_{\bar X}其中。但是因为我们没有总体标准偏差的点估计,所以我们通过近似进行估计,其中σX¯=σn√σX¯=σn\sigma_{\bar X} = \frac{\sigma}{\sqrt n}CI=X¯±t95%(se)CI=X¯±t95%(se)CI=\bar{X} \pm t_{95\% }(se)se=sn√se=snse = \frac{s}{\sqrt n} 相反,对于人口比例,要计算CI,我们近似为其中提供和CI=p^±Z95%(se)CI=p^±Z95%(se)CI = \hat{p} \pm Z_{95\% }(se)se=p^(1−p^)n−−−−−√se=p^(1−p^)nse = \sqrt\frac{\hat{p}(1-\hat{p})}{n}np^≥15np^≥15n \hat{p} \ge 15n(1−p^)≥15n(1−p^)≥15n(1-\hat{p}) \ge 15 我的问题是,为什么我们对人口比例的标准分布感到自满?

1
多元正常后验
这是一个非常简单的问题,但我无法在互联网上或书中的任何地方找到推导。我想看到一个贝叶斯如何更新多元正态分布的推导。例如:想象一下 P(x|μ,Σ)P(μ)==N(μ,Σ)N(μ0,Σ0).P(x|μ,Σ)=N(μ,Σ)P(μ)=N(μ0,Σ0). \begin{array}{rcl} \mathbb{P}({\bf x}|{\bf μ},{\bf Σ}) & = & N({\bf \mu}, {\bf \Sigma}) \\ \mathbb{P}({\bf \mu}) &= & N({\bf \mu_0}, {\bf \Sigma_0})\,. \end{array} 观察一组x1...xnx1...xn{\bf x_1 ... x_n},我想计算P(μ|x1...xn)P(μ|x1...xn)\mathbb{P}({\bf \mu | x_1 ... x_n})。我知道答案是P(μ|x1...xn)=N(μn,Σn)P(μ|x1...xn)=N(μn,Σn)\mathbb{P}({\bf \mu | x_1 ... x_n}) = N({\bf \mu_n}, {\bf \Sigma_n})其中 μnΣn==Σ0(Σ0+1nΣ)−1(1n∑i=1nxi)+1nΣ(Σ0+1nΣ)−1μ0Σ0(Σ0+1nΣ)−11nΣμn=Σ0(Σ0+1nΣ)−1(1n∑i=1nxi)+1nΣ(Σ0+1nΣ)−1μ0Σn=Σ0(Σ0+1nΣ)−11nΣ \begin{array}{rcl} \bf \mu_n &=& \displaystyle\Sigma_0 \left(\Sigma_0 …


3
当样本较大时,为什么不使用T分布来估计均值?
基础统计课程通常建议在样本大小n大(通常超过30或50)时使用正态分布来估计总体参数的平均值。学生的T分布用于较小的样本量,以说明样本标准偏差的不确定性。当样本量较大时,样本标准偏差可提供有关总体标准偏差的良好信息,从而可以进行正态分布估计。我明白了。 但是,当您可以准确地获得您的置信区间时,为什么要使用估计呢?无论样本大小如何,如果仅使用T分布可以准确估计出正态分布,那么使用正态分布有什么意义呢?

1
多元标准正态分布与高斯copula之间的差异
我想知道多元标准正态分布与高斯copula之间的区别是什么,因为当我查看密度函数时,它们在我看来是相同的。 我的问题是为什么引入高斯系动词或高斯系动词产生什么好处,或者当高斯系动词只不过是多元标准正态函数本身时其优势是什么。 还有copula中概率积分变换背后的概念是什么?我的意思是我们知道,系动词是具有统一变量的函数。为什么必须统一?为什么不使用诸如多元正态分布之类的实际数据并找到相关矩阵?(通常,我们绘制这两种资产收益以考虑它们之间的关系,但是当它是copula时,我们绘制的是概率为US的资产。) 另一个问题。我还怀疑来自MVN的相关矩阵是否可以像copula一样是非参数的或半参数的(因为copula参数可以是kendall's tau等)。 由于我是该领域的新手,我将非常感谢您的帮助。(但是我读了很多论文,而这些是我唯一不了解的内容)

1
两个独立随机变量(正态和卡方)乘积的pdf
如果X和Y是独立的,则两个独立的随机变量X和Y的乘积的pdf是多少?X是正态分布,Y是卡方分布。 Z = XY 如果XXX具有正态分布X∼N(μx,σ2x)X∼N(μx,σx2)X\sim N(\mu_x,\sigma_x^2) fX(x)=1σx2π−−√e−12(x−μxσx)2fX(x)=1σx2πe−12(x−μxσx)2f_X(x)={1\over\sigma_x\sqrt{2\pi}}e^{-{1\over2}({x-\mu_x\over\sigma_x})^2} 和YYY具有卡方分布自由度 whre是单位阶跃函数。kkkY∼χ2kY∼χk2Y\sim \chi_k^2 fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)f_Y(y)={y^{(k/2)-1}e^{-y/2}\over{2^{k/2}\Gamma({k\over2})}}u(y)u(y)u(y)u(y) 现在,如果X和Y独立,则的pdf 是多少?ZZZXXXYYY 找到解决方案的一种方法是使用Rohatgi的著名结果(1976,p.141),如果fXY(x,y)fXY(x,y)f_{XY}(x,y)是连续RV XXX和Y的联合pdf YYY,则Z的pdf ZZZ是 fZ(z)=∫∞−∞1|y|fXY(zy,y)dyfZ(z)=∫−∞∞1|y|fXY(zy,y)dyf_Z(z) = \int_{-\infty}^{\infty}{{1\over|y|}f_{XY}({z\over y},y)dy} 由于和是独立的 我们面临解决积分。谁能帮助我解决这个问题。ÿ ˚F X Ý(X ,ÿ )= ˚F X(X )˚F Ý(Ý )˚F Ž(ż )= &Integral; ∞ - ∞ 1XXXYYYfXY(x,y)=fX(x)fY(y)fXY(x,y)=fX(x)fY(y)f_{XY}(x,y)=f_X(x)f_Y(y) fZ(z)=∫∞−∞1|y|fX(zy)fY(y)dyfZ(z)=∫−∞∞1|y|fX(zy)fY(y)dyf_Z(z) = \int_{-\infty}^{\infty}{{1\over|y|}f_{X}({z\over y})f_{Y}(y)dy} &Integral;∞01fZ(z)=1σx2π−−√12k/2Γ(k2)∫∞01|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dyfZ(z)=1σx2π12k/2Γ(k2)∫0∞1|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dyf_Z(z) = {1\over\sigma_x\sqrt{2\pi}}{1\over{2^{k/2}\Gamma({k\over2})}}\int_{0}^{\infty}{{1\over|y|}e^{-{1\over2}({{z\over y}-\mu_x\over\sigma_x})^2} {y^{(k/2)-1}e^{-y/2}}dy} ∫∞01|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dy∫0∞1|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dy\int_{0}^{\infty}{{1\over|y|}e^{-{1\over2}({{z\over …


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.