一位同事正在为她的论文分析一些生物学数据,并得出一些令人讨厌的异方差(下图)。她正在使用混合模型对其进行分析,但仍然无法处理残差。
对数转换响应变量可以清除内容,并且根据对该问题的反馈,这似乎是一种适当的方法。但是,最初,我们曾认为将转换变量与混合模型一起使用存在问题。事实证明,我们一直在误解Littell&Milliken(2006)的SAS for Mixed Models中的一个陈述,该陈述指出了为什么不适合转换计数数据然后使用正常的线性混合模型进行分析的原因(下面有完整的引号) 。
一种也可以改善残差的方法是使用具有Poisson分布的广义线性模型。我已经读过Poisson分布可用于对连续数据进行建模(例如,如本文中所讨论的),并且stats包允许这样做,但是我不了解模型适合时的情况。
为了理解如何进行基础计算,我的问题是:当您将Poisson分布拟合到连续数据时,1)是否将数据四舍五入到最接近的整数2)这样做会导致信息丢失,并且3)何时(如果有的话)将Poisson模型用于连续数据是否合适?
Littel&Milliken 2006,第529页,“转换[count]数据可能会适得其反。例如,转换可能会使随机模型效应的分布或模型的线性变形。更重要的是,转换数据仍然留有可能性。负预测计数。因此,高度怀疑使用转换数据的混合模型进行推断。”