Questions tagged «normal-distribution»

正态分布或高斯分布的密度函数为对称的钟形曲线。它是统计中最重要的分布之一。使用[normality]标签询问有关正常性测试的信息。

3
为什么经常采用高斯分布?
引自维基百科上有关朴素贝叶斯分类器参数估计的文章:“一个典型的假设是,与每个类关联的连续值均根据高斯分布进行分布。” 我了解出于分析原因,高斯分布很方便。但是,还有其他现实世界中的原因可以做这种假设吗?如果人口由两个子群体(聪明/愚蠢的人,大/小苹果)组成,该怎么办?

3
如何计算与异常大的Z分数相关的概率?
用于网络主题检测的软件包可以返回非常高的Z分数(我见过的最高Z分数是600,000+,但是Z分数超过100的情况非常普遍)。我打算证明这些Z分数是伪造的。 巨大的Z得分对应于极低的关联概率。相关概率的值在正态分布的Wikipedia页面(以及可能的每个统计资料教科书)上给出,Z分数最高为6。所以... 问题:如何计算n到1,000,000之间的误差函数?1−erf(n/2–√)1−erf(n/2)1-\mathrm{erf}(n/\sqrt{2}) 我特别希望已经实施了此软件包(如果可能)。到目前为止,我发现的最好的是WolframAlpha,它设法以n = 150(此处)进行计算。

2
为什么平方差如此常用?
当我研究新的统计方法和概念时,常常会遇到平方差(或均方误差,或其他过多的表述)。举例来说,Pearson的r是根据与这些点所在的回归线的均方差确定的。对于方差分析,您正在查看平方和,依此类推。 现在,我了解到,通过对所有数据求平方,可以确保包含异常值的数据确实受到惩罚。但是,为什么指数正好使用2?为什么不使用2.1或e或pi?使用2还是有某种特殊的原因?我怀疑这种解释可能与钟形曲线有关,但我很确定。

2
两个相关多元正态随机变量的线性组合
假设我们有两个随机变量向量,它们都是正常的,即和。我们对它们的线性组合的分布感兴趣,其中和是矩阵,是向量。如果和独立,则。问题是在从属情况下,假设我们知道任何一对的相关性。谢谢。X∼N(μX,ΣX)X∼N(μX,ΣX)X \sim N(\mu_X, \Sigma_X)Y∼N(μY,ΣY)Y∼N(μY,ΣY)Y \sim N(\mu_Y, \Sigma_Y)Z=AX+BY+CZ=AX+BY+CZ = A X + B Y + CAAABBBCCCXXXYYYZ∼N(AμX+BμY+C,AΣXAT+BΣYBT)Z∼N(AμX+BμY+C,AΣXAT+BΣYBT)Z \sim N(A \mu_X + B \mu_Y + C, A \Sigma_X A^T + B \Sigma_Y B^T)(Xi,Yi)(Xi,Yi)(X_i, Y_i) 最好的祝福,伊万

2
CNN Xavier权重初始化
在一些教程中,我发现有人说“ Xavier”权重初始化(论文:了解训练深度前馈神经网络的难度)是初始化神经网络权重的有效方法。 对于完全连接的层,这些教程中有一条经验法则: V一个[R (W ^)= 2ñ我ñ+ nØ ü Ť,更简单的选择:V一个[R (W ^)= 1ñ我ñV一种[R(w ^)=2ñ一世ñ+ñØüŤ,更简单的选择:V一种[R(w ^)=1个ñ一世ñVar(W) = \frac{2}{n_{in} + n_{out}}, \quad \text{simpler alternative:} \quad Var(W) = \frac{1}{n_{in}} 其中是图层的权重方差,使用正态分布进行初始化,,是父图层和当前图层中神经元的数量。ñ 我ñ Ñ Ò ù 吨V一个[R (W ^)V一种[R(w ^)Var(W)ñ我ññ一世ñn_{in}ñØ ü ŤñØüŤn_{out} 卷积层有类似的经验法则吗? 我正在努力找出最适合初始化卷积层权重的方法。例如在权重形状为的层中(5, 5, 3, 8),即内核大小为5x5,过滤三个输入通道(RGB输入)并创建8特征图...是否将被3视为输入神经元的数量?或者说75 = 5*5*3,因为输入是5x5每个颜色通道的色标? 我既可以接受一个明确的问题答案,也可以接受一个更“通用”的答案,这可以解释找到正确的权重初始化并最好链接源的一般过程。

1
给定单个样本的概率为0,为什么MLE有意义?
我在回顾一些旧的统计数据时有一种奇怪的想法,由于某种原因,我似乎无法想到答案。 连续的PDF告诉我们在任何给定范围内的观测值的密度。即,如果X〜ñ(μ ,σ2)X∼N(μ,σ2)X \sim N(\mu,\sigma^2),例如,则概率一个实现落在之间一种aa和bbb是简单地∫b一种ϕ (x )dX∫abϕ(x)dx\int_a^{b}\phi(x)dx,其中ϕϕ\phi是标准正态的密度。 当我们考虑对参数(例如μμ\mu进行MLE估计时,我们写出了ñNN(随机变量X1个。。XñX1..XNX_1 .. X_N的联合密度。。X N并将对数似然比wrt区分为μμ\mu,设置为0并求解μμ\mu。通常给出的解释是“给定数据,该参数使该密度函数最合理”。 让我烦恼的部分是:我们的密度为ñNN rv,我们的样本表示,获得特定实现的概率恰好为0。在给定数据的情况下,为什么最大化关节密度甚至有意义(因为再次观察到我们实际样本的概率恰好是0)? 我能想到的唯一合理化方法是,我们希望使PDF 在我们观察到的样本周围尽可能达到峰值,以使该区域中的积分(从而观察该区域中的东西的概率)最高。

5
分布范围是0到1,并且它们之间有峰值?
是否有一个发行版,或者我可以与其他发行版一起创建一个下图所示的发行版(对不好的图纸表示歉意)? 在这里我给出一个数字(在示例中为0.2、0.5和0.9),以表示峰值应位于的位置以及使函数变宽或变窄的标准偏差(sigma)。 PS:当给定数字为0.5时,分布为正态分布。

1
史蒂夫·徐(Steve Hsu)对中国天才的计算
物理学家史蒂夫·许(Steve Hsu)在博客中写道: 假设分布呈正态分布,那么在美国,+ 4SD的表现只有大约10,000人,而在欧洲则是类似的数字,因此这是一个相当好的人口群体(大约是美国每年前几百名高中生)。 如果将东北亚的数字推算至中国的13亿人口,那么在这个水平上您会得到大约300,000个人,这实在是压倒性的。 您可以仅使用和这样的常用算术运算符向非统计学家解释普通语言下的史蒂夫陈述吗?+++−−-

3
线性回归:是否有任何非正态分布给出OLS和MLE的身份?
这个问题的灵感来自长期的评论讨论: 线性回归如何使用正态分布? 在通常的线性回归模型中,为了简单此处写入只有一个预测器: ÿ一世= β0+ β1个X一世+ ϵ一世Yi=β0+β1xi+ϵi Y_i = \beta_0 + \beta_1 x_i + \epsilon_i 其中X一世xix_i是已知的常数,ϵ一世ϵi\epsilon_i是零均值独立误差项。如果我们除了承担的误差正态分布,则通常的最小二乘估计和最大似然估计β0,β1个β0,β1\beta_0, \beta_1是相同的。 因此,我的问题很简单:误差项是否存在其他分布,以使mle与普通最小二乘方估计量相同?一种含义很容易显示,另一种则不然。


2
两个普通乘积之和是拉普拉斯?
它显然是的情况下,如果X一世〜ñ(0 ,1 )Xi∼N(0,1)X_i \sim N(0,1),然后 X1个X2+ X3X4〜大号一个p 升一Ç ë (0 ,1 )X1X2+X3X4∼Laplace(0,1)X_1 X_2 + X_3 X_4 \sim \mathrm{Laplace(0,1)} 我看过关于任意二次形式的论文,这些总是导致可怕的非中心卡方表达式。 上面的简单关系对我来说似乎一点都不明显,所以(如果是真的!)有人能简单证明上面的关系吗?

3
需要算法来计算数据是从正态分布还是对数正态分布采样的相对可能性
假设您有一组值,并且想知道是从高斯(正态)分布中抽样还是从对数正态分布中抽样? 当然,理想情况下,您应该对总体或实验误差的来源有所了解,因此会有更多有用的信息来回答问题。但是在这里,假设我们只有一组数字而没有其他信息。哪个更有可能:是从高斯抽样还是从对数正态分布抽样?可能性更高?我希望的是在两个模型之间进行选择的算法,并希望量化每个模型的相对可能性。

2
高斯的“判别式”分析模型为何如此称呼?
高斯判别分析模型学习,然后应用贝叶斯规则评估 因此,它们是生成模型。为什么将其称为判别分析?如果是因为我们最终得出了类之间的判别曲线,则所有生成模型都将发生这种情况。P (y | x )= P (x | y )P p r i o r(y )P(x | y)P(x|y)P(x|y)P(y| x)= P(x | y)Pp - [R 我ö ř(y)ΣG∈ ÿP(x | g)Pp - [R 我ö ř(克)。P(y|x)=P(x|y)Pprior(y)Σg∈YP(x|g)Pprior(g).P(y|x) = \frac{P(x|y)P_{prior}(y)}{\Sigma_{g \in Y} P(x|g) P_{prior}(g) }.

1
从嘈杂的观察中确定真实均值
我有一大套形式的数据点(平均值,标准偏差)。我希望将其减少为单一(更好)的平均值,以及(希望)较小的标准偏差。 显然,我可以简单地计算,但是这没有考虑到某些数据点比其他数据点准确得多的事实。Σ d一个牛逼一米Ë 一个Ññ∑datameanN\frac{\sum data_{mean}}{N} 简而言之,我希望对这些数据点进行加权平均,但不知道在标准偏差方面加权函数应该是什么。

3
具有无限方差的正态分布的值大于平均值的概率是多少?
今天在面试中我被问到类似的问题。 面试官想知道,当波动性趋于无穷大时,平价期权最终会平价化的可能性是多少。 我说0%是因为在Black-Scholes模型和随机游走假设下的正态分布将具有无限方差。因此,我计算出所有值的可能性为零。 我的面试官说正确的答案是50%,因为正态分布仍将是对称且几乎均匀的。因此,当您从均值到+无穷大积分时,您将获得50%。 我仍然不相信他的推理。 谁是对的?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.