偏最小二乘(PLS)回归的模型假设


13

我正在尝试查找有关PLS回归假设的信息(单)。我对将PLS的假设与OLS回归的假设进行比较特别感兴趣。 y

我已经阅读/浏览了有关PLS主题的大量文献;Wold(Svante and Herman),Abdi和许多其他人的论文,但找不到令人满意的来源。

沃尔德等。(2001)PLS回归:化学计量学的基本工具确实提到了PLS的假设,但是只提到了

  1. X不必独立,
  2. 该系统是一些潜在变量的函数,
  3. 该系统在整个分析过程中应表现出同质性,并且
  4. 测量误差是可以接受的。 X

没有提及观察到的数据或模型残差的任何要求。有谁知道解决这个问题的资源吗?考虑基础数学类似于PCA(以最大化yX之间的协方差为目标X)是(y,X)的多元正态性吗?模型残差是否需要表现出方差均匀性?

我也相信我在某处读到,观察不必是独立的。就重复测量研究而言,这意味着什么?


Wold的链接。等是不正确的。这是应该的吗?libpls.net/publication/PLS_basic_2001.pdf
emudrak

一位客户对一篇论文的评论者发表了评论,说某行“表明您检查了线性假设”。你会怎么做?
emudrak

Answers:


5

当我们说标准OLS回归有一些假设时,我们的意思是需要这些假设才能得出OLS估计量的某些理想属性,例如,它是最佳的线性无偏估计量-参见高斯-马尔可夫定理和一个很好的答案作者:@mpiktas in 线性回归通常假设的完整列表是什么?不需要假设就可以简单地使回归。假设仅出现在最优性陈述的上下文中。yX

更一般地,“假设”是只有理论结果(定理)才能具有的东西。

对于PLS回归也是如此。始终可以使用PLS回归对进行回归。因此,当您问PLS回归的假设是什么时,您所考虑的最优性陈述是什么?实际上,我什么都不知道。PLS回归是收缩正则化的一种形式,有关某些上下文和概述,请参见我在理论上的回答,即偏最小二乘回归。正则估计量是有偏差的,因此没有任何假设会证明无偏。yX

此外,PLS回归的实际结果取决于模型中包含多少个PLS分量,这些分量充当正则化参数。仅在完全指定了选择此参数的过程(通常没有指定)的情况下,谈论任何假设才有意义。因此,我认为PLS根本没有任何最优结果,这意味着PLS回归没有任何假设。我认为对于任何其他惩罚回归方法(例如主成分回归或岭回归)也是如此。

更新:我在回答岭回归的假设是什么以及如何测试它们的答案中扩展了这个论点

当然,仍然存在一些经验法则规定何时进行PLS回归可能有用,何时不行。请查看上面链接的我的答案进行一些讨论;PLSR的经验丰富的从业者(我不是其中之一)当然可以多说些。


样本的正态性和独立性如何?
WCMC

3

显然,PLS不会对变量的联合分布进行“硬性”假设。这意味着您必须谨慎选择适当的测试统计信息(我假设对变量分布的依赖性不足将PLS归类为非参数技术)。我发现有关适当统计数据的建议是:1)对相关的潜在变量使用r平方; 2)评估估计稳定性的重采样方法。

OLS / MLS和PLS之间的主要区别在于,前者通常使用总体参数的最大似然估计来预测变量之间的关系,而PLS估计真实群体的变量值来预测变量组之间的关系(通过关联预测变量组/具有潜在变量的响应变量)。

我也对处理重复/重复的实验(特别是多因素实验)感兴趣,但是我不确定如何使用PLS进行处理。

偏最小二乘手册:概念,方法和应用(第659页,第28.4节)

Wold,H.2006。预测器规范。统计科学百科全书。9。

http://www.rug.nl/staff/tkdijkstra/latentvariablesandindices.pdf(第4和第5页)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.