Questions tagged «normal-distribution»

正态分布或高斯分布的密度函数为对称的钟形曲线。它是统计中最重要的分布之一。使用[normality]标签询问有关正常性测试的信息。


3
两个正态分布随机变量之间的欧几里得距离的分布是什么?
假设给了两个对象,它们的确切位置是未知的,但是根据具有已知参数的正态分布(例如和。我们可以假设它们都是双变量法线,这样位置就由坐标上的分布来描述(即和是分别包含和的预期坐标的向量)。我们还将假定对象是独立的。a∼N(m,s)a∼N(m,s)a \sim N(m, s)b∼N(v,t))b∼N(v,t))b \sim N(v, t))(x,y)(x,y)(x,y)mmmvvv(x,y)(x,y)(x,y)aaabbb 有谁知道这两个对象之间的欧几里德距离平方的分布是否是已知的参数分布?还是如何通过分析得出此功能的PDF / CDF?

3
正态分布和高斯分布有什么区别
正态分布和高斯分布之间有很大的区别吗?我看过很多论文都在不加区分地使用它们,而且我通常也将它们称为同一事物。 但是,我的PI最近告诉我,正常情况是高斯的均值= 0和std = 1的特定情况,我早些时候在另一家商店也听说过,对此有何共识? 根据维基百科,他们称之为正态分布的是标准正态分布,而正态分布是高斯的同义词,但是话又说回来,我也不确定维基百科。 谢谢

3
我怎样才能计算
假设和Φ (⋅ )是密度函数和标准正态分布的分布函数。ϕ (⋅ )ϕ(⋅)\phi(\cdot)Φ (⋅ )Φ(⋅)\Phi(\cdot) 如何计算积分: ∫∞- ∞Φ (w − ab) ϕ(w)d w∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

3
考虑的总和
我一直在想这个问题。我觉得它突然发生有点奇怪。基本上,为什么我们只需要三个均匀的ZnZnZ_n就能平滑呢?为何平滑化如此迅速地进行? Z2Z2Z_2: Z3Z3Z_3: (图像从John D. Cook的博客中无耻地被盗:http : //www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/) 为什么不用四套制服?还是五个?要么...?


4
正常随机变量的近似阶数统计
是否存在用于某些随机分布的顺序统计的众所周知的公式?特别是正常随机变量的一阶和最后一阶统计量,但也可以理解为更通用的答案。 编辑:为澄清起见,我正在寻找可以或多或少明确评估的近似公式,而不是确切的整数表达式。 例如,对于正常rv的一阶统计量(即最小值),我已经看到以下两个近似值: e1:n≥μ−n−12n−1√σe1:n≥μ−n−12n−1σe_{1:n} \geq \mu - \frac{n-1}{\sqrt{2n-1}}\sigma 和 e1:n≈μ+Φ−1(1n+1)σe1:n≈μ+Φ−1(1n+1)σe_{1:n} \approx \mu + \Phi^{-1} \left( \frac{1}{n+1} \right)\sigma 其中第一个,对于,给出大约,这似乎是一个松散的界限。n=200n=200n=200e1:200≥μ−10σe1:200≥μ−10σe_{1:200} \geq \mu - 10\sigma 第二个给出而快速的Monte Carlo给出,所以这并不是一个很差的近似值,但也不是很好,并且更重要的是,我对它的来源一无所知。e1:200≈μ−2.58σe1:200≈μ−2.58σe_{1:200} \approx \mu - 2.58\sigmae1:200≈μ−2.75σe1:200≈μ−2.75σe_{1:200} \approx \mu - 2.75\sigma 有什么帮助吗?

1
两个高斯加权混合的方差是多少?
假设我有两个正态分布A和B,均值和以及方差和。我想使用权重和对这两个分布进行加权混合,其中和。我知道这种混合的平均值是。μ 乙σ 甲σ 乙 p q 0 ≤ p ≤ 1个q = 1 - p μ 阿乙 = (p × μ 甲)+ (q × μ 乙)μAμA\mu_AμBμB\mu_BσAσA\sigma_AσBσB\sigma_Bpppqqq0≤p≤10≤p≤10\le p \le 1q=1−pq=1−pq = 1-pμAB=(p×μA)+(q×μB)μAB=(p×μA)+(q×μB)\mu_{AB} = (p\times\mu_A) + (q\times\mu_B) 差异是多少? 一个具体的例子是,如果我知道男女身高分布的参数。如果我的房间里有60%是男性,那么我可以得出整个房间的预期平均身高,但是方差又如何呢?

6
科学家如何找出正态分布概率密度函数的形状?
这可能是一个业余问题,但我对科学家如何提出正态分布概率密度函数的形状感兴趣?基本上让我感到烦恼的是,对于某人而言,正态分布数据的概率函数具有等腰三角形而不是钟形曲线的形状可能更直观,并且您如何向这样的人证明概率密度函数为所有正态分布的数据都呈钟形吗?通过实验?还是通过一些数学推导? 毕竟,我们实际上考虑的是正态分布的数据?遵循正态分布或其他形式的概率模式的数据吗? 基本上我的问题是为什么正态分布概率密度函数具有钟形而不是其他形状?科学家如何通过实验或研究各种数据本身的性质来找出可应用于正态分布的现实场景? 因此,我发现此链接对于解释正态分布曲线的函数形式的推导确实很有帮助,因此回答了“为什么正态分布看起来像它,而没有其他任何东西?”的问题。至少对我来说,是真正令人难以置信的推理。

2
非iid高斯变量之和的分布是什么?
如果分布, 分布 并且,我知道分布如果X和Y独立,则。XXXN(μX,σ2X)N(μX,σX2)N(\mu_X, \sigma^2_X)YYYN(μY,σ2Y)N(μY,σY2)N(\mu_Y, \sigma^2_Y)Z=X+YZ=X+YZ = X + YZZZN(μX+μY,σ2X+σ2Y)N(μX+μY,σX2+σY2)N(\mu_X + \mu_Y, \sigma^2_X + \sigma^2_Y) 但是如果X和Y不是独立的,即 (X,Y)≈N((μXμY),(σ2XσX,YσX,Yσ2Y))(X,Y)≈N((μXμY),(σX2σX,YσX,YσY2))(X, Y) \approx N\big( (\begin{smallmatrix} \mu_X\\\mu_Y \end{smallmatrix}) , (\begin{smallmatrix} \sigma^2_X && \sigma_{X,Y}\\ \sigma_{X,Y} && \sigma^2_Y \end{smallmatrix}) \big) 这会影响总和的分布方式吗?ZZZ

4
如何使用常规编程语言从均值和方差已知的正态分布中采样?
我从来没有上过统计学课程,所以我希望在正确的位置提问。 假设我仅具有两个数据描述正态分布:平均值和方差σ 2。我想使用计算机从此分布中随机抽样,以便我尊重这两个统计数据。μμ\muσ2σ2\sigma^2 很明显,我可以通过简单地将0左右归一化来处理均值:在输出样本之前,只需将添加到每个样本即可。但我不明白如何以编程方式生成样本尊重σ 2。μμ\muσ2σ2\sigma^2 我的程序将使用传统的编程语言。我无权访问任何统计数据包。

3
如何取多元正态密度的导数?
假设我具有多元正态N(μ,Σ)N(μ,Σ)N(\mu, \Sigma)密度。我想获得第二(局部的)衍生物WRT μμ\mu。不知道如何取矩阵的导数。 维基说在矩阵中逐个元素地取导数。 我正在使用拉普拉斯逼近 logPN(θ)=logPN−12(θ−θ^)TΣ−1(θ−θ^).log⁡PN(θ)=log⁡PN−12(θ−θ^)TΣ−1(θ−θ^).\log{P}_{N}(\theta)=\log {P}_{N}-\frac{1}{2}{(\theta-\hat{\theta})}^{T}{\Sigma}^{-1}(\theta-\hat{\theta}) \>. 模式是 θ = μ。θ^=μθ^=μ\hat\theta=\mu 我得到Σ−1=−∂2∂θ2logp(θ^|y),Σ−1=−∂2∂θ2log⁡p(θ^|y),{\Sigma}^{-1}=-\frac{{{\partial }^{2}}}{\partial {{\theta }^{2}}}\log p(\hat{\theta }|y),这究竟是怎么来的呢? 我所做的: logP(θ|y)=−k2log2π−12log|Σ|−12(θ−θ^)TΣ−1(θ−θ^)log⁡P(θ|y)=−k2log⁡2π−12log⁡|Σ|−12(θ−θ^)TΣ−1(θ−θ^)\log P(\theta|y) = -\frac{k}{2} \log 2 \pi - \frac{1}{2} \log \left| \Sigma \right| - \frac{1}{2} {(\theta-\hat \theta)}^{T}{\Sigma}^{-1}(\theta-\hat\theta) 因此,我将导数wrt取到θθ\theta,首先是有转置,其次是矩阵。所以,我被困住了。 注意:如果我的教授遇到此问题,则是指该讲座。

3
因变量的正态性=残差的正态性?
这个问题似乎一直在抬头,我出于我对统计(和理智!)的理解而试图将其斩首。 一般线性模型的假设(t检验,ANOVA,回归等)包括“正态性假设”,但我发现很少对此进行清楚地描述。 我经常碰到统计教科书/手册等,只是简单地指出“正态性假设”适用于每个组(即X类分类变量),我们应该检查每个组与正态性的背离。 问题: 假设是指Y 的值还是Y的残差? 对于特定的组,是否可能具有强烈的Y 值非正态分布(例如,偏斜),但是Y 残差的近似(或更正态分布)呢? 其他资料表明,该假设与模型的残差有关(在存在组的情况下,例如t检验/ ANOVA),我们应该检查这些残差的正态性偏离(即,只有一个QQ图/检验与跑)。 不残差的正态模型意味着残差的正态群体?换句话说,我们是否应该仅检查模型残差(与许多文本中的说明相反)? 为了说明这一点,请考虑以下假设示例: 我想比较两个种群(X)之间的树高(Y)。 在一个种群中,Y的分布强烈向右偏斜(即,大多数树短而高的树很少),而另一种实际上是正常的 总体而言,身高在正态分布的人群中较高(建议可能存在“实际”差异)。 数据转换并不能大大改善第一批人口的分布。 首先,比较完全不同的高度分布的组是否有效? 我在这里如何处理“正常性假设”?一个人群的召回身高不是正态分布。难道我检查残差两个群体单独或残差的模型(t检验)? 请在答复中按数字提及问题,经验表明我很容易迷路或迷路(尤其是我!)。请记住,我不是统计学家。尽管我对统计数据有一个合理的概念(即非技术性!)理解。 PS,我已经搜索了档案并阅读了以下没有巩固我的理解的主题: 方差分析假设正态性/残差的正态分布 残差与样本数据的正态性;那么t检验呢? 正常性测试“基本上没有用”吗? 测试正常性 评估分配的正态性 我使用什么测试来确认残差呈正态分布? 当Kolmogorov-Smirnov检验对于参数检验的残差很显着但偏度和峰度看起来很正常时,该怎么办?

6
有没有中心极限定理不成立的例子?
维基百科说- 在概率论中,中心极限定理(CLT)确定,在大多数情况下,添加独立随机变量时,即使原始变量本身不存在,其适当归一化的总和仍趋于正态分布(非正式地为“钟形曲线”)。正态分布... 当它说“在大多数情况下”时,中央极限定理在哪些情况下不起作用?

1
计算联合置信区间的高斯相关不等式的结果
根据《 Quanta杂志》上一篇非常有趣的文章:“长期寻找,发现并几乎丢失” –已经证明,给定向量具有多元变量高斯分布,给定间隔围绕的相应分量的,然后I 1,… ,I n xx=(x1,…,xn)x=(x1,…,xn)\mathbf{x}=(x_1,\dots,x_n)I1,…,InI1,…,InI_1,\dots,I_n xx\mathbf{x} p(x1∈I1,…,xn∈In)≥∏i=1np(xi∈Ii)p(x1∈I1,…,xn∈In)≥∏i=1np(xi∈Ii)p(x_1\in I_1, \dots, x_n\in I_n)\geq \prod_{i=1}^n p(x_i\in I_i) (高斯相关不等式或GCI;有关更一般的表述,请参见https://arxiv.org/pdf/1512.08776.pdf)。 这看起来确实很简单,并且文章说这对联合置信区间有影响。但是,这对我而言似乎毫无用处。假设我们正在估计参数 ,并且发现了估计器都是(也许是渐近的)联合正态的(例如MLE估计器) 。然后,如果我为每个参数计算95%的置信区间,则GCI保证超立方体I_1 \ times \ dots I_n是一个联合置信区域,其覆盖范围不小于(0.95)^ n ...甚至覆盖率也非常低中度n。θ1,…,θnθ1,…,θn\theta_1,\dots,\theta_nθ1^,…,θn^θ1^,…,θn^\hat{\theta_1},\dots,\hat{\theta_n}I1×…InI1×…InI_1\times\dots I_n(0.95)n(0.95)n(0.95)^n nnn 因此,找到联合置信区域似乎不是一个明智的方法:如果知道协方差矩阵并且该协方差矩阵更锐利,则很难找到多元高斯的通常置信区域,即超椭球。当协方差矩阵未知时,找到置信区域可能有用吗?您能给我展示一个GCI与联合置信区域计算的相关性的例子吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.