受限三次样条曲线和惩罚样条曲线有何不同?


11

我正在阅读很多有关在各种回归问题中使用样条曲线的信息。一些书(例如Hodges Riched Parrameterized线性模型)推荐了样条曲线。其他(例如Harrell 回归建模策略)选择了受限制的三次样条曲线。

在实践中,这些有何不同?您是否经常会从使用一种或另一种获得实质上不同的结果?一个或另一个具有特殊优势吗?

Answers:


9

从我的阅读中,您要求我们比较的两个概念是完全不同的野兽,需要像苹果和桔子那样的比较。这使您的许多问题都显得有些无聊-理想情况下(假设您可以按照要求的形式以RCS为基础记下摇摆的惩罚),您将使用惩罚受限三次回归样条模型。

受限三次样条

X

使用RCS进行模型选择通常涉及选择结数及其位置,前者控制所得样条曲线的摆动程度或复杂程度。除非在模型拟合时采取了其他步骤来使估计系数正规化,否则,结数将直接控制样条曲线的复杂性。

这意味着用户在估算包含一个或多个RCS项的模型时需要克服一些问题:

  1. 使用多少个结?,
  2. X
  3. 如何比较不同节数的模型?

RCS术语本身需要用户干预才能解决这些问题。

惩罚样条

XX

βTSβ

其中是惩罚矩阵,是模型系数。然后发现系数值以最大化对数对数似然标准SβLp

Lp=LλβTSβ

其中是模型的对数似然性,是平滑度参数,该参数控制对样条曲线的摆动性进行惩罚的强度。Lλ

由于可以根据模型系数评估受罚对数似然性,因此有效地拟合该模型成为寻找最佳值,同时在搜索最佳过程中更新系数的问题。λλ

λ可以使用交叉验证,广义交叉验证(GCV)或边际可能性或受限边际可能性标准来选择。后两者有效地将样条模型重铸为混合效果模型(基础的完美平滑部分变为固定效果,基础的摆动部分为随机效果,并且平滑度参数与随机效果的方差项成反比),这就是霍奇斯在书中所考虑的。

为什么这解决了要使用多少个结的问题?好吧,这只是一种。这解决了在每个唯一数据点(平滑样条线)不需要打结的问题,但是您仍然需要选择要使用的打结数或基函数。但是,由于罚分缩小了系数,您可以选择所需的较大基数来包含真实函数或近似函数,从而逃脱选择,然后让罚分控制最终估计样条曲线的摆动程度是,在惩罚的基础上消除或控制了额外的潜在摆动。

比较方式

罚(回归)样条曲线和RCS是完全不同的概念。没有什么能阻止您创建RCS基和二次方相关的罚分,然后使用惩罚性回归样条模型的思想来估计样条系数。

RCS只是您可以用来创建样条曲线基础的一种基础,而惩罚回归样条曲线是一种用于估计包含一个或多个带有相关联的摆动惩罚的样条曲线的模型的方法。

我们可以避免问题1.,2和3.吗?

是的,在某种程度上,使用薄板样条线(TPS)。TPS基具有与唯一数据值一样多的基函数。Wood(2003)指出,可以使用TPS基函数的特征分解来创建薄板回归样条(TPRS)基,并且仅保留前最大的发言权。您仍然必须指定Xkk,您要使用的基本函数的数量,但是选择通常取决于您期望拟合函数的摆动程度以及您愿意承担的计算量。也不需要指定结的位置,并且惩罚减少了系数,因此避免了模型选择的问题,因为您只有一个惩罚模型,而没有很多不同惩罚的未惩罚模型。

P样条

为了使事情变得更复杂,有一种样条曲线基础被称为P样条曲线(Eilers&Marx,1996),其中通常被解释为“惩罚”。P样条曲线是B样条曲线的基础,差值罚分直接应用于模型系数。在典型使用中,P样条惩罚会惩罚相邻模型系数之间的平方差,进而会惩罚摆动。P样条曲线非常容易建立,并导致稀疏惩罚矩阵,这使得它们非常适合基于MCMC的贝叶斯模型中的样条项估计(Wood,2017)。P

参考文献

Eilers,PHC和BD Marx。1996。带有-样条曲线和罚分的灵活平滑。统计 科学

Wood,SN2003。薄板回归样条。JR统计 Soc。B系列统计 Methodol。65:95-114。doi:10.1111 / 1467-9868.00374

Wood,SN 2017年。《广义加法模型:R入门》,第二版,CRC出版社。


4
+6,出色的治疗。几天后提醒我,如果我忘记的话,我会为此悬赏。
gung-恢复莫妮卡

1
谢谢你!
彼得·弗洛姆

赏金??????
kjetil b halvorsen
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.