在Box-Cox转换后的数据中以原始单位表示答案


13

对于某些测量,分析结果会以转换后的比例适当显示。但是,在大多数情况下,最好以原始的度量标准显示结果(否则您的工作或多或少就毫无价值)。

例如,在对数转换的数据的情况下,由于记录值的均值不是均值的对数,因此会出现原始标度解释的问题。在对数刻度上取均值估计值的对数,而在原始刻度上不给出均值估计值。

但是,如果日志转换后的数据具有对称分布,则以下关系成立(因为日志保留顺序):

Mean[log(Y)]=Median[log(Y)]=log[Median(Y)]

(对数值的对数是原始测量范围的中位数)。

因此,我只能对原始度量标准上的中位数差异(或比率)做出推断。

如果总体大致正常且具有大约标准偏差,则两样本t检验和置信区间最为可靠,因此我们可能会倾向于将Box-Cox变换用作正态假设成立(我也认为这也是方差稳定变换)。

但是,如果将t工具应用于Box-Cox转换后的数据,则会推断出转换后的数据在方式上的差异。我们如何以原始的测量尺度来解释那些?(转换后的值的平均值不是转换后的平均值)。换句话说,在转换后的尺度上对均值的估计值进行逆转换,不会在原始尺度上给出均值的估计值。

在这种情况下,我还可以仅推断中位数吗?有没有可以让我回到原始状态的方法的转换?

这个问题最初是在这里发表评论的

Answers:


11

如果要具体推断原始变量的均值,则不要使用Box-Cox转换。当转换后的变量有其自己的解释时,IMO Box-Cox转换最有用,而Box-Cox转换仅帮助您找到合适的标度进行分析-事实证明,这种情况经常令人惊讶。我发现这种方式的两个意外指数是1/3(当反应变量为膀胱容积时)和-1(当反应变量为每分钟呼吸次数时)。

对数转换可能是唯一的例外。对数刻度上的平均值对应于原始刻度上的几何平均值,至少是一个明确定义的数量。


好吧,您也有其他例外。-1对应于谐波平均值,...
kjetil b halvorsen

9

如果Box-Cox转换产生对称分布,则将转换后的数据的平均值反转换为原始比例的中值。对于任何单调变换,包括Box-Cox变换,IHS变换等,都是如此。因此,对变换后数据的均值的推论与对原始标度中值的推论相对应。

由于原始数据存在偏差(或者您一开始就不会使用Box-Cox转换),所以为什么要对均值进行推断?我本以为在这种情况下使用中位数会更有意义。我不明白为什么这被视为“原始规模的解释问题”。


推断是基于BC参数 -在原始尺度上是否容易解释?我认为通常的过程只是简单地以这种方式进行报告,而不必理会(通常取决于关于渐进对等的某些结果,而该结果通常可能并不适用)。λ
ARS

谢谢。可能是因为样本(我认为应该遵循近似对称分布的总体)可能恰巧是偶然的。
乔治·唐塔斯

4
一些环境风险评估提供了一个很好的例子,说明无论如何都需要对方法进行推断。为简化起见,假设您打算将土地开发成公园。您对土壤中的某些相关化合物进行测试,并且通常会发现其浓度大致呈对数正态分布。不过,使用公园的人-可能直接暴露在这些土壤中-会在他们四处走动时有效地随机均匀地“采样”土壤。它们随时间的暴露将是算术平均浓度,而不是几何平均浓度。
ub

1
有时,我们对某种事物的总量产生的问题感兴趣。如果您知道平均值,则可以从平均值到总数(乘以观察数)。没有办法从中位数到总数!
乔治·唐塔斯

6

如果您想按原始比例进行均值推断,则可以考虑使用不使用正态性假设的推断。

但是要小心。如果两个样本的方差相等(如果转换后的方差相等,则转换后的量表上的方差相等),那么在两个样本方差不同的情况下,简单地说通过重新采样(置换测试或自举)对均值进行直接比较就可能是一个问题。如果手段不同,则按原始比例)。此类技术无法避免思考您正在做的事情。

考虑对估计还是预测比对测试更感兴趣的另一种方法是,使用变换后的变量的泰勒展开来计算回切后的近似均值和方差-在通常的泰勒展开中,您可以写,现在编写,其中是一个均值和方差的随机变量,您将要使用将其转换回去。[ μ + Ý - μ ] ý μ σ 2f(x+h)t[μ+(Yμ)]Yμσ2t()

如果您抱有期望,那么第二项就会掉线,人们通常只会选择第一项和第三项(其中第三项代表的只是近似转换均值中的偏差);此外,如果将展开的方差带到第二项,则第一项和第一个协方差项会丢失-因为是一个常数-因此您将获得关于差的单项近似。t(μ)

-

最简单的情况是对数标度具有正态性,因此原始标度具有对数正态性。如果您知道方差(最好很少发生),则可以按原始比例构造对数正态CI和PI,并可以根据相关量的分布平均值给出预测平均值。

如果你估计在数比例都均值和方差,你可以构建对数区间(预测区间的观测,说),但你原来的规模对数没有任何一个精彩瞬间。因此,预测的平均值不存在。Ťtt

您需要非常仔细地思考要尝试回答的问题。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.