Answers:
从我的阅读中,您要求我们比较的两个概念是完全不同的野兽,需要像苹果和桔子那样的比较。这使您的许多问题都显得有些无聊-理想情况下(假设您可以按照要求的形式以RCS为基础记下摇摆的惩罚),您将使用惩罚受限三次回归样条模型。
使用RCS进行模型选择通常涉及选择结数及其位置,前者控制所得样条曲线的摆动程度或复杂程度。除非在模型拟合时采取了其他步骤来使估计系数正规化,否则,结数将直接控制样条曲线的复杂性。
这意味着用户在估算包含一个或多个RCS项的模型时需要克服一些问题:
RCS术语本身需要用户干预才能解决这些问题。
其中是惩罚矩阵,是模型系数。然后发现系数值以最大化对数对数似然标准
其中是模型的对数似然性,是平滑度参数,该参数控制对样条曲线的摆动性进行惩罚的强度。
由于可以根据模型系数评估受罚对数似然性,因此有效地拟合该模型成为寻找最佳值,同时在搜索最佳过程中更新系数的问题。
可以使用交叉验证,广义交叉验证(GCV)或边际可能性或受限边际可能性标准来选择。后两者有效地将样条模型重铸为混合效果模型(基础的完美平滑部分变为固定效果,基础的摆动部分为随机效果,并且平滑度参数与随机效果的方差项成反比),这就是霍奇斯在书中所考虑的。
为什么这解决了要使用多少个结的问题?好吧,这只是一种。这解决了在每个唯一数据点(平滑样条线)不需要打结的问题,但是您仍然需要选择要使用的打结数或基函数。但是,由于罚分缩小了系数,您可以选择所需的较大基数来包含真实函数或近似函数,从而逃脱选择,然后让罚分控制最终估计样条曲线的摆动程度是,在惩罚的基础上消除或控制了额外的潜在摆动。
罚(回归)样条曲线和RCS是完全不同的概念。没有什么能阻止您创建RCS基和二次方相关的罚分,然后使用惩罚性回归样条模型的思想来估计样条系数。
RCS只是您可以用来创建样条曲线基础的一种基础,而惩罚回归样条曲线是一种用于估计包含一个或多个带有相关联的摆动惩罚的样条曲线的模型的方法。
是的,在某种程度上,使用薄板样条线(TPS)。TPS基具有与唯一数据值一样多的基函数。Wood(2003)指出,可以使用TPS基函数的特征分解来创建薄板回归样条(TPRS)基,并且仅保留前最大的发言权。您仍然必须指定,您要使用的基本函数的数量,但是选择通常取决于您期望拟合函数的摆动程度以及您愿意承担的计算量。也不需要指定结的位置,并且惩罚减少了系数,因此避免了模型选择的问题,因为您只有一个惩罚模型,而没有很多不同惩罚的未惩罚模型。
为了使事情变得更复杂,有一种样条曲线基础被称为P样条曲线(Eilers&Marx,1996),其中通常被解释为“惩罚”。P样条曲线是B样条曲线的基础,差值罚分直接应用于模型系数。在典型使用中,P样条惩罚会惩罚相邻模型系数之间的平方差,进而会惩罚摆动。P样条曲线非常容易建立,并导致稀疏惩罚矩阵,这使得它们非常适合基于MCMC的贝叶斯模型中的样条项估计(Wood,2017)。
Eilers,PHC和BD Marx。1996。带有-样条曲线和罚分的灵活平滑。统计 科学
Wood,SN2003。薄板回归样条。JR统计 Soc。B系列统计 Methodol。65:95-114。doi:10.1111 / 1467-9868.00374
Wood,SN 2017年。《广义加法模型:R入门》,第二版,CRC出版社。