为什么建议对计数数据使用平方根变换?


57

当您拥有计数数据时,通常建议取平方根。(有关简历一些例子,看看@ HarveyMotulsky的答案在这里,或@ whuber的答案在这里。)另外,装修与分布泊松响应变量广义线性模型时,日志是规范链接。这有点像对响应数据进行对数转换(尽管更准确地说,是对控制响应分布的参数进行对数转换)。因此,这两者之间存在某种张力。 λ

  • 您如何调和这种(明显的)差异?
  • 为什么平方根比对数好?

Answers:


45

38X+X+1

在此处输入图片说明

23

在此处输入图片说明

23

y=log(y+c)0c0.40.5μ120.43

至于人们为什么选择一个转换而不是另一个转换(或不选择)的原因,这实际上是他们正在实现的目标。

[1]:亨里克·本特松在他施舍“广义线性模型,并转化残差”地块后图案情节在这里看到 (见P4第一张幻灯片)。我添加了一些y抖动,并省略了这些行。


1
(0,+)(,+)λ

2
Xy

1
+1平方根只是处理计数数据的起点。对数也是一个不错的选择。数据通常会告诉您,哪一个更成功地获得了有用且简洁的描述。Gung,在您提到答案中,证明平方根是一个不错的选择,这取决于右图中明显显示的非孤立残差的对称分布。当您更改模拟的参数时,您会发现保持了对称性。
ub

1
@Glen我不是说日志始终是一个不错的选择。但有时它们优于根。当出现零计数时,是,您需要“开始”对数。其他线程在这里讨论了获取初始值的方法。如果数据中没有零计数,那么日志将完全没有问题。
ub

2
x+3/8xx+ccx+3/8
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.