如何在PLS中计算回归系数的置信区间?


10

PLS的基本模型是,给定的矩阵和向量yX = TP'+ E,y = T q'+ f相关, 其中T是一个潜在的n x k矩阵,而E ,f是噪声项(假设X,y为中心)。n×mXny

X=TP+E,
y=Tq+f,
Tn×kE,fX,y

PLS生成T,P,q的估计T,P,q,以及回归系数\ hat {\ beta}的“捷径”向量,β^从而yXβ^。我想在一些简化的假设下找到\ hat {\ beta}的分布β^,其中可能包括以下内容:

  1. 该模型是正确的, 对于未知的T,P,qX = TP'+ E,y = T q'+ fX=TP+E,y=Tq+fT,P,q
  2. 潜在因子的数量k是已知的,并在PLS算法中使用。
  3. 实际误差项为具有已知方差的零均值法线。

这个问题有些不确定,因为有很多'the'PLS算法的变体,但是我接受其中任何一个的结果。我还将接受有关如何通过例如引导程序来估计\ hat {\ beta}分布的指南,但这也许是一个单独的问题。β^

Answers:


9

您是否了解这篇文章:PLS回归:化学计量学的基本工具?第3.11节描述了为PLS参数得出SE和CI的过程。

我通常依靠Bootstrap来计算CI,如Abdi,H中所建议的。偏最小二乘回归和潜在结构回归的投影(PLS回归)。我似乎还记得Tenenhaus M.(1998)的La gression PLS:Théorieet pratique(Technip)中讨论过理论解决方案,但是由于我没有这本书,所以我现在无法检查。目前,有一些有用的R包,例如plsRglm

PS我刚刚发现妮可克莱默的文章,在参考plsdof [R包。


2

我发现了Reiss 等人的论文用于工业批量质量预测的偏最小二乘置信区间计算,其中出现以下引用:

PLS预测应伴有在线置信区间,以指示预测的准确性。用于PLS预测的置信区间的表述是尚未得出“黄金标准”的研究领域。

本文包含对“此类工作的出色调查”的参考,Faber和Bro 撰写的多向PLS预测标准误差,以及Faber和Kowalski撰写的论文 ,测量误差的传播,用于验证通过主成分回归获得的预测和部分最小二乘。我将在这些结果可用时对其进行总结...


(+1)知道,谢谢。我应该再看一看Michel Tenenhaus的作品-如果我觉得某事有趣,我会通知您。
chl 2010年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.