Questions tagged «normal-distribution»

正态分布或高斯分布的密度函数为对称的钟形曲线。它是统计中最重要的分布之一。使用[normality]标签询问有关正常性测试的信息。

3
伽玛分布与正态分布之间的关系
我最近发现有必要为平均值为0的正常随机变量的平方导出pdf。无论出于什么原因,我都选择不预先对方差进行归一化。如果我正确执行此操作,则此pdf如下: N2(x;σ2)=1σ2π−−√x−−√e−x2σ2N2(x;σ2)=1σ2πxe−x2σ2 N^2(x; \sigma^2) = \frac{1}{\sigma \sqrt{2 \pi} \sqrt{x}} e^{\frac{-x}{2\sigma^2}} 我注意到这实际上只是伽马分布的参数化: N2(x;σ2)=Gamma(x;12,2σ2)N2(x;σ2)=Gamma⁡(x;12,2σ2) N^2(x; \sigma^2) = \operatorname{Gamma}(x; \frac{1}{2}, 2 \sigma^2) 然后,从两个伽玛(具有相同比例参数)的总和等于另一个伽玛的事实出发,可以得出该伽玛等于平方正态随机变量的总和。kkk N2Σ(x;k,σ2)=Gamma(x;k2,2σ2)NΣ2(x;k,σ2)=Gamma⁡(x;k2,2σ2) N^2_\Sigma(x; k, \sigma^2) = \operatorname{Gamma}(x; \frac{k}{2}, 2 \sigma^2) 这让我有些惊讶。即使我知道分布(即标准正态RV 平方和的分布)是伽玛的一种特例,但我没有意识到伽玛本质上只是一个允许归纳和任何方差的随机变量。这也导致了我以前从未遇到过的其他特征,例如指数分布等于两个平方正态分布之和。χ2χ2\chi^2 这对我来说有点神秘。以我上面概述的方式,正态分布对伽马分布的推导至关重要吗?我检查的大多数资源都没有提到这两个分布在本质上是相关的,甚至就此而言,它还描述了伽玛的推导方式。这使我认为有些简单的事实正在发挥作用,我只是以复杂的方式强调了这些事实?

5
最大似然估计-为什么在很多情况下尽管有偏见仍使用它
最大似然估计通常导致有偏估计(例如,其对样本方差的估计因高斯分布而有偏)。 那么,什么使它如此受欢迎?为什么要使用那么多?此外,有什么特别之处使其比其他方法更好? 此外,我注意到对于高斯,MLE估计量的简单缩放使其无偏。为什么这种缩放不是标准程序?我的意思是-为什么在进行MLE计算之后,找不到必要的缩放比例以使估计量无偏的原因并不常见?标准做法似乎是对MLE估计的简单计算,当然,对于比例因子众所周知的高斯情况,当然除外。

3
给定一个观察值的方差的置信区间
这是“第七届柯尔莫哥洛夫概率论奥林匹克竞赛”中的一个问题: 给定一个来自分布的观测值XXX,且两个参数均未知,请给出的置信区间,置信度至少为99%。Normal(μ,σ2)Normal⁡(μ,σ2)\operatorname{Normal}(\mu,\sigma^2)σ2σ2\sigma^2 在我看来,这应该是不可能的。我有解决方案,但尚未阅读。有什么想法吗? 我将在几天后发布解决方案。 [后续编辑:官方解决方案发布在下面。Cardinal的解决方案更长,但提供了更好的置信区间。也感谢Max和Glen_b的投入。]

4
Shapiro–Wilk是最好的正态性检验吗?为什么它会比Anderson-Darling等其他测试更好?
我在一些文献中已经读过,Shapiro-Wilk检验被认为是最好的正态性检验,因为对于给定的显着性水平,如果无效假设被否定,则拒绝原假设的概率高于其他假设。正常性测试。αα\alpha 您能否在可能的情况下使用数学参数向我解释,与其他一些正态性检验(例如安德森–达林检验)相比,它的工作原理如何?

1
线性回归预测区间
如果我的数据点的最佳线性近似(使用最小二乘)是线,如何计算近似误差?如果我计算观察值和预测值之间的差异的标准偏差,我以后可以说真实(但未观察到)的值属于区间假设正态分布()的概率约为68%?e i = r e a l (x i)− (m x i + b )y r = r e a l (x 0)[ y p - σ ,y p + σy=mx+by=mx+by=mx+bei=real(xi)−(mxi+b)ei=real(xi)−(mxi+b)e_i=real(x_i)-(mx_i+b)yr=real(x0)yr=real(x0)y_r=real(x_0)y p = m x 0 + b[yp−σ,yp+σ][yp−σ,yp+σ][y_p-\sigma, y_p+\sigma]yp=mx0+byp=mx0+by_p=mx_0+b 澄清: 我对函数进行了观察,评估结果为点。我将这些观察值拟合为。对于我没有观察到的,我想知道 有多大。使用上述方法,中的是正确的。〜68%?X 我升(X )= 米X + b X 0 ˚F …

3
此发行版有名称吗?
今天我想到,分布 可以看作是高斯和拉普拉斯之间的折衷分布,对于和这样的分布有名称吗?它是否有一个标准化常数的表达式?结石树桩我,因为我不知道如何甚至开始求解在积分 1 = c ^ ·&∫ ∞ - ∞ EXP ( - | X - μ | pX∈[R ,p∈[1,2]β>0Çf(x)∝exp( - |x−μ|pβ)f(x)∝exp⁡(-|X-μ|pβ) f(x)\propto\exp\left(-\frac{|x-\mu|^p}{\beta}\right) x∈R,p∈[1,2]x∈R,p∈[1,2]x\in\mathbb{R}, p\in[1,2]β>0.β>0.\beta>0.CCC1=C⋅∫∞−∞exp(−|x−μ|pβ)dx1=C⋅∫−∞∞exp⁡(−|x−μ|pβ)dX 1=C\cdot \int_{-\infty}^\infty \exp\left(-\frac{|x-\mu|^p}{\beta}\right) dx

2
我应该将英式英语中“正态分布”中的“ N”大写吗?
这个问题有些遗漏,但是我认为这里的社区可能对此主题有强烈的见解! 我正在写我的博士学位论文。始终如一地,当谈论与高斯分布正式相关的数量时,我将“正态”中的“ N”大写以表示它们。例如,“ [...在这种情况下,所得的分布不是正态分布,而是由[...]描述”。 我的主管已阅读了相关章节,并用小写的“ n”代替了其中的每一个。我找不到关于该主题的权威文献-Springer 显然希望名称适当地大写,并且根据互联网上的另一个随机消息,将发行名称大写是个好主意。 缺乏针对论文的权威风格指南,我认为我将转向专家社区-经常做什么,为什么?

1
为什么方差的采样分布是卡方分布?
该声明 样本方差的样本分布是自由度等于的卡方分布,其中是样本大小(假设感兴趣的随机变量是正态分布的)。nn−1n−1n-1nnn 资源 我的直觉 这对我来说有点直觉,1)因为卡方检验看起来像是平方和; 2)卡方分布只是正态分布的平方和。但是,我对此仍然不太了解。 题 这句话是真的吗?为什么?

3
如何使用Excel执行t检验来检查正态分布?
我想知道如何在Excel中检查数据集的正常性,只是为了验证是否满足使用t检验的要求。 对于右尾,是否仅计算平均值和标准偏差,然后从平均值中添加1、2和3标准偏差以创建范围,然后将其与标准正态分布的正态68/95 / 99.7进行比较即可,是否合适? Excel中的norm.dist函数可测试每个标准偏差值。 还是有更好的方法来测试正常性?

2
结合来自多项研究的信息以估计正态分布数据的均值和方差-贝叶斯与荟萃分析方法
我已经审查了一组论文,每个论文都报告了在已知大小相应样本中的观测值的平均值和SD 。我想对我正在设计的一项新研究中同一度量的可能分布进行最大可能的猜测,以及该猜测的不确定性。我很高兴假设)。XXXññnX〜ñ(μ , σ2X〜ñ(μ,σ2X \sim N(\mu, \sigma^2 我的第一个想法是荟萃分析,但是通常使用的模型着重于点估计和相应的置信区间。但是,我想说一些关于充分分布,在这种情况下也将包括作出的猜测有关的方差,σ 2。 XXXσ2σ2\sigma^2 我一直在阅读有关根据先验知识估算给定分布的完整参数集的可能的Bayeisan方法。通常,这对我来说更有意义,但是我对贝叶斯分析的经验为零。这似乎是一个直截了当,相对简单的问题。 1)考虑到我的问题,哪种方法最有意义,为什么?荟萃分析还是贝叶斯方法? 2)如果您认为贝叶斯方法是最好的,您能指出我一种实现此方法的方法(最好在R中)吗? 相关问题 编辑: 我一直试图以我认为是“简单”的贝叶斯方式来解决这个问题。 正如我如上所述,我不只是有兴趣在估计平均,,而且方差,σ 2,在光的事先信息,即P (μ ,σ 2 | ÿ )μμ\muσ2σ2\sigma^2P(μ , σ2| ÿ)P(μ,σ2|ÿ)P(\mu, \sigma^2|Y) 同样,我对实践中的贝叶斯主义一无所知,但是不久之后,发现均值和方差未知的正态分布的后部通过共轭具有正态-反伽马分布的封闭形式解。 问题是重新表述为。P(μ , σ2| ÿ)= P(μ | σ2,Y)P(σ2| ÿ)P(μ,σ2|ÿ)=P(μ|σ2,ÿ)P(σ2|ÿ)P(\mu, \sigma^2|Y) = P(\mu|\sigma^2, Y)P(\sigma^2|Y) 估计与正常分布; P (σ 2 | Ý )与逆伽马分布。P(μ | σ2,Y)P(μ|σ2,ÿ)P(\mu|\sigma^2, …

3
非正定协方差矩阵对我的数据有什么影响?
我有许多多变量观测值,并希望评估所有变量的概率密度。假定数据是正态分布的。在低数量的变量下,一切都会按我预期的那样工作,但移至更大的数量会导致协方差矩阵变为非正定。 我已将Matlab中的问题减少为: load raw_data.mat; % matrix number-of-values x number of variables Sigma = cov(data); [R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf. 如果err> 0,则Sigma不是正定的。 为了评估更高维度的实验数据,我可以做些什么?它可以告诉我有关数据的任何有用信息吗? 我在这方面是个初学者,所以如果我错过了一些明显的事情,我深表歉意。

2
极值理论-显示:从正常到冈贝尔
的最大值 simiid根据极值理论,标准正态收敛于标准Gumbel分布。X1,…,Xn.∼X1,…,Xn.∼X_1,\dots,X_n. \sim 我们如何证明这一点? 我们有 P(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(\max X_i \leq x) = P(X_1 \leq x, \dots, X_n \leq x) = P(X_1 \leq x) \cdots P(X_n \leq x) = F(x)^n 我们需要查找/选择常数的序列,以便:F \ left(a_n x + b_n \ right)^ n \ rightarrow ^ {n \ rightarrow \ infty} G(x )= e ^ {-\ exp(-x)}an>0,bn∈Ran>0,bn∈Ra_n>0,b_n\in\mathbb{R}F(anx+bn)n→n→∞G(x)=e−exp(−x)F(anx+bn)n→n→∞G(x)=e−exp⁡(−x)F\left(a_n …

1
小波域高斯过程:什么是协方差?
我一直在阅读Maraun等人的文章《小波域中的非平稳高斯过程:综合,估计和有效测试》(2007年),该类定义了可由小波域中的乘数指定的一类非平稳GP。这样一个GP的实现是: 其中是白噪声,是相对于小波的连续小波变换,是标度为且时间为的乘数(类似傅立叶系数),是重构小波小波逆变换。s (t )= MHm (b ,a )宽Gη(吨),s(t)=Mhm(b,a)Wgη(t), s(t) = M_h m(b,a) W_g \eta(t)\, , W g g m (b ,a )a b M h hη(吨)η(t)\eta(t)w ^GWgW_gGggm (b ,a )m(b,a)m(b,a)一种aabbb中号HMhM_hHhh 本文的一个关键结果是,如果乘数仅缓慢变化,则实现本身仅是“弱”依赖于和的实际选择。因此,指定了过程。他们继续创建一些重要的测试,以帮助根据实现推断小波乘数。g h m (b ,a )m (b ,a )m(b,a)m(b,a)GggHhhm (b ,a )m(b,a)m(b,a) 两个问题: 1.我们如何评价标准GP可能性是?p (D )= N(0 ,ķ)p(D)=N(0,K)p(D) = \mathcal{N}(0,K) …

5
为什么我们对正态分布的使用有偏差和误导性的标准偏差公式?
第一次进行正态分布蒙特卡洛模拟时,我感到有些震惊,发现个样本的标准偏差的平均值(样本大小均为n = 2)要小得多比,即平均\ sqrt {\ frac {2} {\ pi}}倍,即用于生成总体的\ sigma。但是,这是众所周知的,如果很少记起,并且我确实知道,或者我不会进行模拟。这是一个模拟。100100100100100100√n = 2ñ=2n=2 σ2π--√2π \sqrt{\frac{2}{\pi }}σσ\sigma 这是一个使用100,n = 2,\ text {SD}和\ text {E}(s_ {n = 2})= \ sqrt \的估计量来预测N(0,1)的 95%置信区间的示例frac {\ pi} {2} \ text {SD}。ñ(0 ,1 )ñ(0,1个)N(0,1)n = 2ñ=2n=2标清标清\text{SD}Ë (小号n = 2)= π2--√标清Ë(sñ=2)=π2标清\text{E}(s_{n=2})=\sqrt\frac{\pi}{2}\text{SD} RAND() RAND() Calc Calc N(0,1) N(0,1) SD …

3
两个正态分布之差的分布
我有两个正态分布的概率密度函数: f1(x1|μ1,σ1)=1σ12π−−√e−(x−μ1)22σ21f1(x1|μ1,σ1)=1σ12πe−(x−μ1)22σ12f_1(x_1 \; | \; \mu_1, \sigma_1) = \frac{1}{\sigma_1\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_1)^2}{2\sigma_1^2} } 和 f2(x2|μ2,σ2)=1σ22π−−√e−(x−μ2)22σ22f2(x2|μ2,σ2)=1σ22πe−(x−μ2)22σ22f_2(x_2 \; | \; \mu_2, \sigma_2) = \frac{1}{\sigma_2\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_2)^2}{2\sigma_2^2} } 我正在寻找和之间分离的概率密度函数。我认为这意味着我正在寻找| x_1-x_2 |的概率密度函数。。那是对的吗?我怎么找到那个?x1x1x_1x2x2x_2|x1−x2||x1−x2||x_1 - x_2|

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.