我正在阅读多变量模型构建: Patrick Royston和Willie Sauerbrei提出的基于分数多项式的实用回归分析模型,用于对连续变量进行建模。到目前为止,我印象深刻,这是我以前从未考虑过的有趣方法。
但是作者没有处理丢失的数据。的确,在p。17他们说丢失数据“引入了许多其他问题。这里不考虑。”
多重插补是否可以使用分数多项式>
在某些方面(但不是全部),FP是样条曲线的替代方法。样条回归处理缺失数据是否更容易?
您正在处理缺失的x或缺失的y还是两者都存在?
—
Glen_b-恢复莫妮卡的时间
+1(!)我很高兴看到其他人也提出了类似的问题。最近,我发布了一个问题:stats.stackexchange.com/questions/295977/…关于如何在R的小鼠中使用受限的三次样条。我将特别选择样条曲线,因为它们不需要指定分数阶多项式,而样条曲线对于许多功能形式而言足够灵活。我不知道这是否回答了您的问题(因此有此评论)。
—
IWS
这是一个有趣的问题,它通过对比其适应丢失数据的能力,提出了批评这几种平滑/插值技术的可能性(作为可能答案的一个维度)。(在某种程度上,对缺失的脆弱性是现代方法的“尴尬”。)我只是在通过一个显而易见的观点时指出,贝叶斯实现将使您的估算“免费”。
—
David C. Norris
@ DavidC.Norris您的评论吸引了我!您能否详细说明贝叶斯方法如何“免费”地弥补缺失(我认为您是指通过适当的方法,“自动”并默认使用分析方法来处理)?(或为我提供参考)
—
IWS
这里“免费”的免费午餐部分是您必须写下贝叶斯模型,这意味着必须明确考虑数据生成过程(DGP)。完成此操作后,将缺失的值视为[讨厌的]参数。(在贝叶斯方法中,“一切都是参数”。另请参见潜在变量。)然后,MCMC会利用您指定的DGP在出现错误时“免费”“填充”缺失值。
—
David C. Norris