使用样条或分数多项式时,如何处理丢失的数据?


12

我正在阅读多变量模型构建: Patrick Royston和Willie Sauerbrei提出的基于分数多项式的实用回归分析模型,用于对连续变量进行建模。到目前为止,我印象深刻,这是我以前从未考虑过的有趣方法。

但是作者没有处理丢失的数据。的确,在p。17他们说丢失数据“引入了许多其他问题。这里不考虑。”

多重插补是否可以使用分数多项式>

在某些方面(但不是全部),FP是样条曲线的替代方法。样条回归处理缺失数据是否更容易?


您正在处理缺失的x或缺失的y还是两者都存在?
Glen_b-恢复莫妮卡的时间

2
+1(!)我很高兴看到其他人也提出了类似的问题。最近,我发布了一个问题:stats.stackexchange.com/questions/295977/…关于如何在R的小鼠中使用受限的三次样条。我将特别选择样条曲线,因为它们不需要指定分数阶多项式,而样条曲线对于许多功能形式而言足够灵活。我不知道这是否回答了您的问题(因此有此评论)。
IWS

2
这是一个有趣的问题,它通过对比其适应丢失数据的能力,提出了批评这几种平滑/插值技术的可能性(作为可能答案的一个维度)。(在某种程度上,对缺失的脆弱性是现代方法的“尴尬”。)我只是在通过一个显而易见的观点时指出,贝叶斯实现将使您的估算“免费”。
David C. Norris

2
@ DavidC.Norris您的评论吸引了我!您能否详细说明贝叶斯方法如何“免费”地弥补缺失(我认为您是指通过适当的方法,“自动”并默认使用分析方法来处理)?(或为我提供参考)
IWS

2
这里“免费”的免费午餐部分是您必须写下贝叶斯模型,这意味着必须明确考虑数据生成过程DGP)。完成此操作后,将缺失的值视为[讨厌的]参数。(在贝叶斯方法中,“一切都是参数”。另请参见潜在变量。)然后,MCMC会利用您指定的DGP在出现错误时“免费”“填充”缺失值。
David C. Norris

Answers:


1

多重插补可以与分数多项式和样条一起使用。假设表示您的函数形式(例如)。假设是在合成样本中每个样本中估计的函数,则您的函数为。f(x)f(x)=x+x.5fm()M1MmMfm(x)

假设您使用的软件可以为x的每个唯一值提供标准误差估计,则可以使用Rubin的(调查中无响应的多重插补; 1987年)公式来计算标准误差。对于带有多重插补的自由度,有大小样本公式。大样本公式(在Rubin中也是如此)仅使用与标准误差相同的输入,因此也可以使用。小样本案例将模型的自由度作为输入。这个公式是否可以在这里应用对我来说并不明显。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.