Questions tagged «standard-deviation»

标准差是随机变量,其估计量或一批数据的散布的类似度量的方差的平方根。

5
标准偏差的2D模拟?
考虑以下实验:给一组人一个城市列表,并要求他们在世界地图上标记相应的位置(否则未标记)。对于每个城市,您将获得大致以相应城市为中心的点分散。伊斯坦布尔说,一些城市的分散程度要低于其他城市。 假设对于给定的城市,我们得到一组2D样本,代表测试分配的地图上城市(例如,本地坐标系)的位置主题。我想用适当的单位(km)将这个集合中点的“分散”数量表示为一个数字。{(xi,yi)}{(xi,yi)}\{(x_i, y_i)\}(x,y)(x,y)(x, y)iii 对于一维问题,我会选择标准偏差,但是是否可以为上述情况合理选择一个二维模拟?

4
方差比标准差更基本的概念吗?
在这个心理测量学网站上,我读到了 [A]深水平方差是比标准差更基本的概念。 该站点并没有真正进一步解释为什么方差比标准偏差更根本,但是它提醒我我在该站点上已经阅读了一些类似的内容。 例如,@ kjetil-b-halvorsen 在此评论中写道:“标准差有助于解释和报告。对于发展该理论,方差更好。” 我认为这些声明是相关的,但我并不真正理解它们。我知道样本方差的平方根并不是总体标准偏差的无偏估计量,但是肯定有更多的东西。 对于这个网站,“基本”一词也许含糊不清。在那种情况下,也许我们可以从发展统计理论的角度出发,问问方差是否比标准差更重要?为什么/为什么不呢?

1
我们可以使用留一法的均值和标准差来显示离群值吗?
假设我有正态分布的数据。对于数据的每个元素,我想检查它远离均值有多少SD。数据中可能有一个异常值(可能只有一个异常值,也可能是两个或三个),但是这个异常值基本上就是我要寻找的。从均值和标准差的计算中暂时排除我当前正在查看的元素是否有意义?我的想法是,如果它接近平均值,则不会产生任何影响。如果是离群值,则可能会影响均值和SD的计算,并降低检测到均值的可能性。我不是统计学家,因此不胜感激!

3
有界数据集的变异系数最大值
在有关标准偏差是否可以超出均值的最新问题之后的讨论中,曾短暂提出一个问题,但从未完全回答。所以我在这里问。 考虑一组非负数 ,其中表示。不需要是不同的,也就是说,集合可以是多集。该集合的均值和方差定义为 ,标准偏差为。请注意,数字集不是来自总体的样本,我们也不是估算总体均值或总体方差。那么问题是:nnnxixix_i0≤xi≤c0≤xi≤c0 \leq x_i \leq c1≤i≤n1≤i≤n1 \leq i \leq nxixix_ix¯=1n∑i=1nxi, σ2x=1n∑i=1n(xi−x¯)2=(1n∑i=1nx2i)−x¯2x¯=1n∑i=1nxi, σx2=1n∑i=1n(xi−x¯)2=(1n∑i=1nxi2)−x¯2\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i, ~~ \sigma_x^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 = \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - \bar{x}^2σxσx\sigma_x 在间隔[0,c]中,对于x_i的所有选择,\ dfrac {\ sigma_x} {\ bar {x}}的最大值σxx¯σxx¯\dfrac{\sigma_x}{\bar{x}}(变异系数)是多少?xixix_i[0,c][0,c][0,c] 我可以找到的最大值σxx¯σxx¯\frac{\sigma_x}{\bar{x}}是n−1−−−−−√n−1\sqrt{n-1} 时,其实现了n−1n−1n-1所述的xixix_i具有值000和剩余的(离群值)xixix_i 具有值ccc,给出 x¯=cn, 1n∑x2i=c2n⇒σx=c2n−c2n2−−−−−−−√=cnn−1−−−−−√.x¯=cn, 1n∑xi2=c2n⇒σx=c2n−c2n2=cnn−1.\bar{x} = \frac{c}{n},~~ \frac{1}{n}\sum x_i^2 = \frac{c^2}{n} \Rightarrow \sigma_x …


2
对于哪种分布,有一个标准差的封闭形式的无偏估计量?
对于正态分布,存在以下标准偏差的无偏估计量: σ^无偏见的= Γ (n − 12)Γ (n2)1个2∑k = 1ñ(x一世− x¯)2------------√σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2\hat{\sigma}_\text{unbiased} = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})} \sqrt{\frac{1}{2}\sum_{k=1}^n(x_i-\bar{x})^2} 这个结果之所以不太为人所知的原因似乎是,它很大程度上是一个古玩,而不是任何重要的事项。证明覆盖在这个线程上 ; 它利用了正态分布的关键属性: 1个σ2∑k = 1ñ(x一世− x¯)2〜χ2n − 11σ2∑k=1n(xi−x¯)2∼χn−12 \frac{1}{\sigma^2} \sum_{k=1}^n(x_i-\bar{x})^2 \sim \chi^{2}_{n-1} 从那里开始,只需做一些工作,就可以期望,并通过将此答案识别为的倍数,我们可以得出。σ σ无偏E (∑ñk = 1(x一世− x¯)2------------√)E(∑k=1n(xi−x¯)2)\mathbb{E}\left( \sqrt{\sum_{k=1}^n(x_i-\bar{x})^2} \right)σσ\sigmaσ^无偏见的σ^unbiased\hat{\sigma}_\text{unbiased} 这让我很好奇,哪些其他分布具有标准差的闭合形式的无偏估计量。与方差的无偏估计器不同,这显然是特定于分布的。此外,要适应证明以找到其他分布的估计量,并非易事。 偏态正态分布的二次形式具有良好的分布特性,我们使用的正态分布特性实际上是一种特殊情况(因为正态是偏态正态的一种特殊类型),因此也许很难将此方法扩展到他们。但是对于其他分配,似乎需要一种完全不同的方法。 是否存在其他已知此类估计量的分布?

2
为什么将标准偏差定义为方差的平方根而不是N的平方和的平方根?
今天我教了一门统计学入门课,一个学生问我一个问题,在这里我改写为:“为什么标准偏差定义为方差的平方根而不是N的平方和的平方根?” 我们定义总体方差:σ2=1N∑(xi−μ)2σ2=1N∑(xi−μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} 和标准差:。σ=σ2−−√=1N√∑(xi−μ)2−−−−−−−−−−√σ=σ2=1N∑(xi−μ)2\sigma=\sqrt{\sigma^2}=\frac{1}{\sqrt{N}}\sqrt{\sum{(x_i-\mu)^2}} 我们可能对的解释是,它给出了总体中单位与的总体平均值的平均偏差。σσ\sigmaXXX 但是,在sd的定义中,我们将平方和的平方根除以。学生提出的问题是,为什么我们不划分平方庙的开方代替。因此,我们得出了竞争公式:学生认为,这种公式看起来更像由平均通过时分割比一个“平均”偏差如在。N−−√N\sqrt{N}NNNσnew=1N∑(xi−μ)2−−−−−−−−−−√.σnew=1N∑(xi−μ)2.\sigma_{new}=\frac{1}{N}\sqrt{\sum{(x_i-\mu)^2}}.N−−√N\sqrt{N}σσ\sigma 我认为这个问题并不愚蠢。我想给学生一个答案,那就是说sd 定义为方差的平方根,即均方根偏差。换句话说,为什么学生应该使用正确的公式而不遵循她的想法? 该问题与此处提供的旧主题和答案有关。那里的答案有三个方向: σσ\sigma是均方根(RMS)偏差,而不是与平均值的“典型”偏差(即)。因此,它的定义有所不同。σnewσnew\sigma_{new} 它具有良好的数学特性。 此外,sqrt将使“单位”恢复到原始大小。但是,也是如此,它被N除以。σnewσnew\sigma_{new}NNN 第1点和第2点都是支持sd作为RMS的参数,但是我看不到反对使用σnewσnew\sigma_{new}。怎样说服入门级学生使用均方根平均距离σσ\sigma与均值?

3
数据集更改后使用旧标准偏差计算新标准偏差
我的阵列nnn真实值,其具有平均μoldμold\mu_{old}和标准偏差σoldσold\sigma_{old}。如果将数组xixix_i元素替换为另一个元素xjxjx_j,则新的均值将为 μnew=μold+xj−xinμnew=μold+xj−xin\mu_{new}=\mu_{old}+\frac{x_j-x_i}{n} 这种方法的优点是,无论的值如何,都需要恒定的计算量。是否有任何的方法来计算σ Ñ Ë 瓦特使用σ ö 升d等的计算μ Ñ Ë 瓦特使用μ ö 升d?nnnσnewσnew\sigma_{new}σoldσold\sigma_{old}μnewμnew\mu_{new}μoldμold\mu_{old}


5
比较配对观测值的方差
我有成对的观测值(,),它们来自一个共同的未知分布,该分布具有有限的第一和第二矩,并且围绕均值对称。X i Y iNNNXiXiX_iYiYiY_i 令为的标准偏差(对无条件),对于为。我想检验一下假设 X ÿ σ ÿσXσX\sigma_XXXXYYYσYσY\sigma_Y H0H0H_0:σX=σYσX=σY\sigma_X = \sigma_Y H1H1H_1:σX≠σYσX≠σY\sigma_X \neq \sigma_Y 有人知道这样的测试吗?我可以在第一分析中假定分布是正态的,尽管一般情况更有趣。我正在寻找一种封闭形式的解决方案。Bootstrap永远是不得已的手段。

2
不同分布的中值绝对偏差(MAD)和SD
对于正态分布的数据,标准偏差和中位数绝对偏差通过以下方式关联:σσ\sigmaMADMAD\text{MAD} σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,\sigma=\Phi^{-1}(3/4)\cdot \text{MAD}\approx1.4826\cdot\text{MAD}, 其中是标准正态分布的累积分布函数。Φ()Φ()\Phi() 其他分布有类似关系吗?

3
如何评估标准偏差?
我已经收集了来自85个人对他们执行某些任务的能力的反馈。 回答采用李克特五分制: 5 =很好,4 =良好,3 =平均,2 =差,1 =差, 平均得分是2.8,标准偏差是0.54。 我理解平均值和标准偏差代表什么。 我的问题是:这个标准偏差有多好(或坏)? 换句话说,是否有任何准则可以帮助评估标准偏差。

4
如果一个变量的标准偏差为0,则相关性如何?
据我了解,我们可以通过使用等式对协方差进行归一化来获得相关性 ρi,j=cov(Xi,Xj)σiσjρi,j=cov(Xi,Xj)σiσj\rho_{i,j}=\frac{cov(X_i, X_j)}{\sigma_i \sigma_j} 其中是的标准偏差。 X我σi=E[(Xi−μi)2]−−−−−−−−−−−√σi=E[(Xi−μi)2]\sigma_i=\sqrt{E[(X_i-\mu_i)^2]}XiXiX_i 我担心的是标准偏差等于零怎么办?是否有任何条件可以保证它不能为零? 谢谢。

9
非负数据的标准偏差可以超过平均值吗?
我有一些三角3D网格。三角形区域的统计信息是: 最低0.000 最高2341.141 均值56.317 标准开发98.720 那么,当数字像上面那样工作时,这是否意味着对于标准偏差特别有用或表明在计算标准偏差时存在错误?这些区域肯定远非正常分布。 就像某人在以下他们的回应之一中提到的那样,令我感到非常惊讶的是,数字均值仅用一个标准差就能得出负数,从而超出了法律范围。 谢谢

5
为什么美国和英国学校采用不同的标准差计算方法?
据我了解,英国学校教导说使用以下方法可以找到标准偏差: 而美国学校则教: (无论如何都是基本水平)。 过去,这曾导致我的许多学生在Internet上进行搜索时遇到问题,但发现了错误的解释。 为什么会有所不同? 如果使用简单的数据集(例如10个值),那么如果采用错误的方法(例如,在检查中),将会出现什么程度的错误?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.