如何对两个不同尺度的变量求和?


9

如果我有两个遵循两个不同分布且具有不同标准偏差的变量...我该如何转换两个变量,以便在求和时两个结果不会被波动更大的“驱动”。

例如...变量A的易失性低于变量B(范围从0到3000),并且变量B往返。300至350。

如果仅将两个变量加在一起,结果显然将由A驱动。

Answers:


14

一种常见的做法是标准化两个变量,以减去样本均值并除以样本标准差,将它们置于相同的比例。完成此操作后,这两个变量将在相同的范围内,因为它们每个的样本均值均为0,样本标准偏差为1。因此,可以在不因以下原因而对一个变量产生不当影响的情况下添加它们:规模。A,B

也就是说,计算

AA¯SD(A),  BB¯SD(B)

其中表示的样品平均值和标准偏差,同样地,对于B的标准化的变量版本被解释为高于/标准偏差低于平均值的数量特别的观察是。 A¯,SD(A)A


1
如果变量不是正态分布的,这将起作用吗?
2011年

1
标准化与正态分布无关-它只是将变量置于相同范围的一种方法。所以,是的。

如果我将其除以sd而不是减去均值...我将获得相同的波动率,但范围不同吗?
2011年

是的-如果仅按比例缩放它们(除以标准偏差),则它们最终将具有相同的方差,但它们的均值和范围将不同。

@Macro如果我没有数据,而只有变量的顺序数据,该怎么办。因此,两个变量之和的作用更像是得分。我相信会有一些不好的暗示,例如序列中很早的分数。你知道另一种方式吗?
tintinthong
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.