57 当您拥有计数数据时,通常建议取平方根。(有关简历一些例子,看看@ HarveyMotulsky的答案在这里,或@ whuber的答案在这里。)另外,装修与分布泊松响应变量广义线性模型时,日志是规范链接。这有点像对响应数据进行对数转换(尽管更准确地说,是对控制响应分布的参数进行对数转换)。因此,这两者之间存在某种张力。 λλ 您如何调和这种(明显的)差异? 为什么平方根比对数好? generalized-linear-model data-transformation poisson-distribution count-data variance-stabilizing — gung-恢复莫妮卡 source
45 3838X--√+ X+ 1-----√X+X+1 2323 2323 ÿ∗= 日志(y+ c )y∗=log(y+c)00cc0.40.40.50.5μμ12120.430.43 至于人们为什么选择一个转换而不是另一个转换(或不选择)的原因,这实际上是他们正在实现的目标。 [1]:亨里克·本特松在他施舍“广义线性模型,并转化残差”地块后图案情节在这里看到 (见P4第一张幻灯片)。我添加了一些y抖动,并省略了这些行。 — Glen_b source 1 (0,+∞)(0,+∞)(−∞,+∞)(−∞,+∞)λλ 2 X′yX′y 1 +1平方根只是处理计数数据的起点。对数也是一个不错的选择。数据通常会告诉您,哪一个更成功地获得了有用且简洁的描述。Gung,在您提到的答案中,证明平方根是一个不错的选择,这取决于右图中明显显示的非孤立残差的对称分布。当您更改模拟的参数时,您会发现保持了对称性。 — ub 1 @Glen我不是说日志始终是一个不错的选择。但有时它们优于根。当出现零计数时,是,您需要“开始”对数。其他线程在这里讨论了获取初始值的方法。如果数据中没有零计数,那么日志将完全没有问题。 — ub 2 x+3/8−−−−−−√x+3/8x−−√xx+c−−−−−√x+cccx+3/8−−−−−−√x+3/8