可以(应该)在随机效应模型中使用正则化技术吗?


11

通过正则化技术,我指的是套索,岭回归,弹性网等。

考虑一个包含人口统计和诊断数据的医疗保健数据预测模型,其中预测住院时间。对于某些人,在基线时间段内有多个LOS观测值(即,一个以上IP事件)相关。

例如,建立一个包含每个人随机效应拦截项的弹性净预测模型是否有意义?


第一行的字幕:“通过随机效应技术(即关于参数如何随机分布的假设),我指的是回归参数上的拉普拉斯先验和正态先验……等” :-)
Confidenceprior

Answers:


7

有几篇论文讨论这个问题。我会以特殊顺序查找:

  1. Pen.LME:霍华德·D·邦德尔,阿伦·克里希纳和苏吉特·戈什。线性混合变量模型中固定变量和随机变量的联合变量选择。Biometrics,66(4):1069-1077,2010。

  2. GLMMLASSO:Jurg Schelldorfer,Peter Buhlmann,Sara van de Geer。使用L1惩罚估计高维线性混合效应模型。斯堪的纳维亚统计杂志,38(2):197-214,2011。

可以在网上找到。

我碰巧正在完成一篇关于将弹性净罚分应用于混合模型(LMMEN)的论文,并计划在下个月将其发送给期刊审阅。

  1. LMMEN:西迪,里托夫,昂热。基于弹性净罚分的线性混合模型的正则化和分类

总体而言,如果您要对不正常的数据或没有身份链接的数据进行建模,则可以使用GLMMLASSO(但要注意,它不能处理很多RE)。否则,Pen.LME会很好,因为您没有固定或随机效果的高度相关数据。在后一种情况下,您可以邮寄给我,我很乐意将您的代码/纸寄给您(我会在不久的将来将其寄放在cran中)。

我今天上传到CRAN- lmmen。它同时解决了固定效应和随机效应对弹性混合型惩罚的线性混合模型问题。

软件包中还包含lmmlassoglmmLasso软件包的cv函数。


1
Yonicd,弹性网在线性混合模型中的应用正是我想要的。我正在处理相关的遗传数据,因此弹性网的分组选择将非常有用。我已尝试与您联系,但除了发布此回复外别无其他方法,因为似乎无法发送消息。无论如何,我期待着阅读您的论文,并会尽快尝试您的代码。

5

我一直将岭回归视为只是经验随机效应模型,而不仅限于单个类别变量(并且没有花哨的相关性矩阵)。通过交叉验证岭罚分和拟合/估算简单的随机效应,几乎总是可以得到相同的预测。在您的示例中,您可能会觉得很花哨,并且在演示/诊断功能上有单独的脊罚,在患者指标上有另一个(使用罚分比例因子中的线glmnet)。或者,您可以包括一个花哨的随机效果,该效果具有人与时间相关的效果。这些可能性都不对是非,它们只是有用的。


2

我目前正在考虑一个类似的问题。我认为在应用程序中,如果可行,您可以做到这一点,并且您相信使用此方法是合理的。如果这是随机效果的常用设置(也就是说,您需要对每个组进行重复测量),那么这只是关于估计技术的争论,它的争议较小。如果您实际上没有对大多数组进行多次重复测量,那么它可能位于通常的随机效应模型的边界上,并且如果您想将其作为一个总体建议,则可能需要仔细证明其有效性(从方法论的角度)。方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.