与主成分分析不同,因子分析模型的解决方案不一定是嵌套的。也就是说,当仅提取第一个因子与第一个两个因子相同时,第一个因子的负载(例如)不一定相同。
考虑到这一点,请考虑以下情况:您具有一组高度相关的清单变量,并且(根据其内容的理论知识)应由单个因素来驱动。想象一下,探索性因素分析(无论您喜欢哪种度量标准:并行分析,卵石图,本征值> 1等)都强烈暗示着存在因素:主要因素较大,次要因素较小。您有兴趣使用清单变量和因子解来估计(即,获取因子得分)参与者对第一个因子的值。 在这种情况下,最好是:
- 拟合因子模型以仅提取因子,并获得因子得分(等),或
- 拟合因子模型以提取两个因子,获得因子的因子得分,但是扔掉/忽略第二个因子的得分?
对于哪种更好的做法,为什么呢? 关于这个问题有研究吗?
Is is always better to extract more factors when they exist?
不是很清楚。提取存在的数量总是更好。由于您提到的分析的多变量和非嵌套性质,欠拟合或过拟合都会扭曲“真实”的潜在结构。问题在于我们不确切知道数据中有多少个因素。以及这些数据是否与人口总数一样多。