是否可以找到组合的标准偏差?


Answers:


30

因此,如果您只想将这些样本中的两个合并为一个,则可以:

s1=1n1Σi=1n1(xiy¯1)2

s2=1n2Σi=1n2(yiy¯2)2

其中和是样本均值,而和是样本标准差。y¯1y¯2s1s2

要添加它们,您需要:

s=1n1+n2Σi=1n1+n2(ziy¯)2

这并不是那么简单,因为新的均值与和:y¯y¯1y¯2

y¯=1n1+n2Σi=1n1+n2zi=n1y¯1+n2y¯2n1+n2

最终公式为:

s=n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2

对于标准偏差的常用贝塞尔校正(“分母”)版本,均值的结果与以前相同,但是n1

s=(n11)s12+(n21)s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n21

您可以在此处阅读更多信息:http : //en.wikipedia.org/wiki/Standard_deviation


1
如果OP使用的是样本标准差的Bessel校正(方差为分母)版本(几乎所有在这里提出要求的人都将做),则此答案将无法完全满足他们的要求。n1
Glen_b-恢复莫妮卡2014年

在这种情况下,本节将解决问题。(编辑链接到旧的Wikipedia版本,因为它已从新版本中删除)
Glen_b-恢复莫妮卡2014年

@Glen_b好收获。您可以将其编辑为答案以使其更有用吗?
sashkello 2014年

我去了维基百科找到证明,但是不幸的是这个公式不再存在。想要详细说明(证据)或改进Wikipedia?:)
Rauni Lillemets


8

这显然扩展到组:K

s=k=1K(nk1)sk2+nk(y¯ky¯)2(k=1Knk)1

7
按标准来说,这有点简短。您能否再多谈一谈这是如何得出的,以及为什么这是正确的答案?
Sycorax说恢复莫妮卡

1

我遇到了同样的问题:具有带有空交集的几个子集的标准差,均值和大小,计算这些子集的并集的标准差。

我喜欢sashkelloGlen_b♦的答案,但我想找到它的证明。我是以这种方式完成的,如果对任何人有帮助,我都会把它留在这里。


因此,目的是要确实看到:

s=(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2

一步步:

(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1(xiy1¯)2+i=1n2(yiy2¯)2+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1((xiy1¯)2+(y¯1y¯)2)+i=1n2((yiy2¯)2+(y¯2y¯)2)n1+n2)1/2=(i=1n1(xi2+y¯2+2y1¯22xiy1¯2y1¯y¯)n1+n2+i=1n2(yi2+y¯2+2y2¯22yiy2¯2y2¯y¯)n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯i=1n1xin1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯i=1n2yin1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯n1y1¯n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯n2y2¯n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)n1+n2)1/2

现在的诀窍是认识到我们可以对和重新排序:由于每个 项出现次,因此我们可以重新排序将分子写为 Ñ1 ñ 1个 Σ=1X 2 + ˉ ý 2-2 ˉ Ÿ X

2y¯j=1n1xjn1
n1
i=1n1(xi2+y¯22y¯xi),

因此,继续进行等式链:

=(i=1n1(xiy¯)2n1+n2+i=1n2(yiy¯)2n1+n2)1/2=(i=1n1+n2(ziy¯)2n1+n2)1/2=s

话虽这么说,可能有一种更简单的方法可以做到这一点。

如前所述,该公式可以扩展到个子集。证明是对套数的归纳。基本情况已得到证明,对于归纳步​​骤,应将类似的均等链应用于后者。k


我看不出问题是如何解决的。是否假设这两个数据集来自同一分布?OP是否有可用的实际观察结果或仅是平均值和标准差的样本估计值?
Michael R. Chernick

是的,它们被假定来自相同的分布。没有观测值,只有子集的平均值和标准差。
iipr

那么,为什么要使用涉及各个观察结果的公式?
Michael R. Chernick

也许我的答案不清楚。我只是简单地发布了上述公式的数学证明,该公式允许s根据两个子集的标准偏差,均值和大小进行计算。在公式中,没有引用单个观察值。在证明中有,但仅是证明,从我的角度来看,它是正确的。
IIPR
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.