Answers:
在第一步应该是问为什么你的变量为非正态分布。这可能是有启发性的。根据我的经验得出的常见发现:
第一步可能建议对测试进行设计修改。如果您提前意识到这些问题,那么即使您认为它们有问题,您甚至可以设计测试来避免它们。
在第二个步骤是决定做什么的,你有非正常的数据的情况。注意转换只是一种可能的策略。我要重申先前关于非正常性的答案的一般建议:
一个简单的选择是使用分数总和而不是分数本身。分布的总和趋于正态。例如,在教育中,您可以在一系列测试中添加学生的分数。
当然,另一种选择是使用不被假定为正态性的技术,这些技术被低估且未充分使用。
对于偏斜和重尾数据,我使用(并开发了)Lambert W x F分布框架。 偏斜和重尾 Lambert W x F分布基于输入随机变量(RV)的非线性变换,以输出,与X相似,但偏斜和/或重尾(有关详细公式,请参阅论文)。ý 大号一米b ë ř 吨W¯¯ × ˚F
这通常适用于任何连续RV,但实际上,我们对高斯最为感兴趣。对于重尾Lambert W x F分布,该逆是双射的,可以使用您喜欢的估计器针对参数从数据进行估计(MLE,矩量法,贝叶斯分析,...)。对于并且X为高斯分布,它简化为Tukey的h分布。θ = (μ X,σ X,δ ,α )α ≡ 1
现在,作为数据转换,由于转换是双射的(对于偏斜情况几乎是双射的),并且可以使用Lambert的W函数(因此称为Lambert W x F)显式获得,因此这变得很有趣。这意味着我们可以从数据中消除偏斜度,也可以消除粗尾(双向!)。
您可以使用LambertW R软件包进行尝试,该手册显示了许多使用方法的示例。
对于应用程序,请参阅以下帖子