日志转换是否是对非正常数据进行t测试的有效技术?


19

在审查一篇论文时,作者指出:“在进行t检验以满足正态性的前提假设之前,使用自然对数对表现出偏态分布的连续结果变量进行了转换。”

这是分析非正态数据的可接受方法,尤其是在基础分布不一定是对数正态的情况下吗?

这可能是一个非常愚蠢的问题,但我之前从未见过。


3
好吧,如果初始分布不是对数正态的,那么转换后的数据将不满足正态性的前提假设,那么转换将带来什么呢?
2012年

@Macro-足够真实!(+1)-他们可能只是想使分布更接近对称,这对于t检验来说并不是一件坏事,但是,除非他们检查并写下来,否则我们不知道该日志是否转换引起的负偏斜可能会使情况变得更糟...
jbowman 2012年

2
我们可以推断出,因为这样做是为了满足正常性,并且首先检查了正常性,所以之后又检查了正常性。它在此处的语言中非常隐含。
约翰

10
对数的t检验与未转换数据的t检验或非参数检验都不相同。原木上的t检验比较的是几何平均值,而不是(通常)算术平均值。这是决定使用对数是否可以接受的几个重要考虑因素之一(对数取决于应用)。
whuber

Answers:


9

当遇到不正常的数据时,通常尝试对常态进行某种转换(例如使用对数,平方根等)。尽管对数经常会为偏斜数据产生良好的结果,但不能保证它会在这种特殊情况下工作。在分析转换后的数据时,也应牢记上述@whubers的评论:“对数的t检验与未转换的数据的t检验既不是非参数检验的t检验也不相同。原木上的t检验比较几何而不是(通常的)算术平均值。”

ñ-1个一世=1个ñX一世-X¯3ñ-1个一世=1个ñX一世-X¯23/2

我宁愿使用Box-Cox程序来使用给定数据选择转换,而不是选择转换(例如对数),因为它在大多数时间都有效。但是,这存在一些哲学问题。特别是这是否会影响t检验中的自由度数,因为在选择使用哪种变换时我们已经使用了样本中的一些信息。

最后,在转换后使用t检验或经典非参数检验的一个很好的选择是使用t检验的自举类似物。它不需要假设正常性,并且是对未转换的均值(而不是其他任何东西)的检验。


1
+1良好,周​​到的讨论,最后有很好的建议。有关t检验的引导/重采样/置换版本的更多信息,请参见stats.stackexchange.com/q/24911上的最新主题。
whuber

0

一般来说,如果不满足执行t检验所需的假设,那么使用非参数检验会更合适。


5
也许。非参数检验几乎总是比较中位数(或其他百分位数),而不是均值,因此确实解决了一个稍微不同的问题。但这似乎并不是对当前问题的有帮助的答复,该问题专门(且仅)询问有关t检验数据日志的问题。
Whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.