我有一个由10个变量组成的数据集。我运行偏最小二乘(PLS)来预测这10个变量的单个响应变量,提取10个PLS分量,然后计算每个分量的方差。在原始数据上,我得出所有变量的方差之和为702。
然后,我将每个PLS分量的方差除以该总和,得到由PLS解释的方差的百分比,令人惊讶的是,所有分量一起解释了原始方差的44%。
对此有什么解释?不应该是100%吗?
据我所知,在响应端(y),确定PLS分量的数量是观察的最小数量。我有20个观察。但是另一方面,我只有10个独立变量,这使我限于10个PLS。我的问题是用于计算每个组件(PLS或PCA)的解释方差的通用公式是什么?
—
2015年
mathworks.com/help/stats/plsregress.html此示例在Y侧只有一个变量,并计算10个组件。
—
2015年