是个根本转变建议?


12

我的同事想在通过将响应变量提高到(即)的幂后,对一些数据进行分析。 ÿ0.12518y0.125

我对此感到不舒服,但努力阐明原因。我想不出这种转换的任何机械原理。我以前也从未看过它,我担心它可能会夸大I型错误率或某种程度-但我无力支持这些担忧!

另外,我的同事发现,在AIC比较中,这些转换后的模型优于未转换的模型。这本身是否可以证明其用途合理?


9
仅供参考,看起来很多像为许多范围。对数转换在许多情况下通常是合理的(但在不合理的情况下也经常使用)。y1/8ylog(y)y
Cliff AB

2
这是一个相关的讨论
user603

5
您无法在具有转换因变量的模型之间有意义地比较AIC。(转换自变量即可。)
Stephan Kolassa,2017年

5
@CliffAB是正确的。小正幂与对数之间的主要实际区别是,您可以采用零的幂。当数据中有几个零(可能是由于数字的记录方式不精确)时,有时会使用较小的幂(0.1甚至0.01)来代替对数。(更好的方法是:对于小使用Box-Cox变换。)由于很少有自然法则涉及1/8幂,许多自然法则涉及指数现象,因此使用对数可以有时提供的洞察力和可解释性比小的力量更好。py=(xp1)/pp
ub

3
如果这种想法可以转化为对数(如果出现零的话),那么这是一个小问题。广义线性模型的对数链接表示,平均响应呈指数变化,但并不假设其所有值均为正。因此它可以容忍数据中的一些零。大致的含义是,如果可能的话,它们应该或将为正值:例如,报告的零(样品中为零样品,根据机器为零浓度)有时意味着未检测到。尽管它的名字很漂亮,但只要GLM中存在自然联系,Box-Cox似乎就会超卖。
尼克·考克斯

Answers:


10

通常的做法是在响应上应用具有任意值的幂变换(Tukey,Box-Cox)。从这个角度来看,我对您的1/8的值没有特别的关注-如果该转换为您提供了良好的残差,那就去做吧。

当然,任何变换都会改变您适合的功能关系,这可能是机械上没有意义的1/8,但是当我的目的不是外推或拟合物理参数时,这对我来说就不必担心律,但要获得正确的p值来表示效果(我认为这是回归中的正常用例)。为此,您唯一需要担心的是该函数适合您的预测值(残差均值和残差变化)域中的数据,并且易于检查。

如果不确定功率转换的最佳值,并且想在不同选项之间进行比较,则不应直接比较AIC /似然值,因为功率转换会改变响应的范围。幸运的是,事实证明,计算转换的校正相对简单,因此可以通过其(校正后的)可能性来比较不同的转换(例如,请参见此处)。

在R中,这是在MASS :: boxcox中实现的-这是为功率选择正确值的便捷方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.