通常,当在纵向设计中遇到连续但偏斜的结果度量时(例如,具有一个对象间效应),通常的方法是将结果转换为正态。如果情况极端,例如观察结果被截断,则可能会花哨并使用Tobit生长曲线模型或类似的模型。
但是,当我看到结果通常在某些时间点分布然后在其他时间严重偏斜时,我会感到茫然。转换可能会堵塞一个泄漏,但会引发另一个泄漏。在这种情况下,您有什么建议?我是否不知道混合效果模型的“非参数”版本?
注意:一个应用示例是一系列教育干预措施前后的知识测验分数。分数开始正常,但随后聚集在量表的高端。
通常,当在纵向设计中遇到连续但偏斜的结果度量时(例如,具有一个对象间效应),通常的方法是将结果转换为正态。如果情况极端,例如观察结果被截断,则可能会花哨并使用Tobit生长曲线模型或类似的模型。
但是,当我看到结果通常在某些时间点分布然后在其他时间严重偏斜时,我会感到茫然。转换可能会堵塞一个泄漏,但会引发另一个泄漏。在这种情况下,您有什么建议?我是否不知道混合效果模型的“非参数”版本?
注意:一个应用示例是一系列教育干预措施前后的知识测验分数。分数开始正常,但随后聚集在量表的高端。
Answers:
假设问题出现在您的残差中(因为结果变量本身的分布通常不是问题),我将寻求调查问题的原因,而不是尝试通过转换或应用“修复”问题。非参数模型。
如果是某种趋势(例如逐渐或多或少地逐渐趋于正常),或者从正常到不正常之间有明显的突破,则表明存在某种“制度变化”您的数据(即数据生成机制随时间而变化)或某种类型的变量丢失问题。
如果是没有明显模式的情况(例如,时间段1和3看起来正常,而时间段2和4看起来不正常),我会非常仔细地寻找数据完整性问题。
检查您是否确实存在政权变更的一种简单方法是仅使用“正常”时间段估算模型,然后使用其他时间段重新估算并查看发生了什么差异。一种更复杂的方法是使用潜在类模型,也许将时间作为伴随变量。
关于非参数混合效应模型的问题,取决于您所说的非参数含义。如果您指的是没有假定数值因变量的模型,那么会有很多这样的模型(例如LIMDEP有很多)。此外,请记住,如果样本量较小,则从推断的角度来看,违反正态性假设可能仅会产生问题。研究此问题的一种方法是尝试尝试其他评论和答案中讨论的各种转换,并查看它是否对您的结论有很大影响。