Questions tagged «factor-analysis»

因子分析是降维潜在变量技术,它用较少数量的连续连续变量(称为因子)代替了相互关联的变量。这些因素被认为是相互关系的原因。[对于确认因子分析,请使用标签“ confirmative-factor”。同样,不应将因子分析的术语“因子”与作为回归/ ANOVA的分类预测因子的“因子”相混淆。]

3
在因子分析中仅加载两个(或更少)项目(变量)是否可以接受?
我在SPSS中通过因子分析设置了一组20个变量。为了研究的目的,我需要发展6个因素。SPSS已显示8个变量(共20个)已被低权重加载或由于多个因素而均等地加载,因此我将其删除。剩下的12个变量已经在6个因子中成对装入了2个,这是完美的结构-就像我想要的那样,但是现在,一位与我合作的教授希望我找到理由(在什么条件下)每个因子仅保留2个项目是适当的,因为众所周知,因子分析对于每个因子加载3个或更多项目的结果很有用。 谁能帮我解决这个问题,最好还提供公开的参考资料?

1
低阶线性系统的快速计算/估计
方程的线性系统普遍存在于计算统计中。我遇到的一种特殊系统(例如,在因子分析中)是 Ax=b一个X=bAx=b 其中 这里d是Ñ × Ñ对角线矩阵具有严格为正对角,Ω是米× 米(具有米« Ñ)对称半正定矩阵,乙是任意Ñ × 米矩阵。我们被要求解决一个被低秩矩阵扰动的对角线性系统(简单)。解决上述问题的幼稚方法是使用伍德伯里公式将A求逆A=D+BΩBT一个=d+乙Ω乙ŤA=D+ B \Omega B^TDdDn×nñ×ñn\times nΩΩ\Omegam×m米×米m\times mm≪n米≪ñm\ll nB乙Bn×mñ×米n\times mAAA。但是,这并不对劲,因为Cholesky和QR因式分解通常可以大大加快线性系统(和法向方程式)的求解速度。我最近提出了以下论文,该论文似乎采用了Cholesky方法,并提到了伍德伯里反演的数值不稳定性。但是,该论文似乎是草稿形式,我找不到数值实验或支持性研究。解决我描述的问题的最新技术水平是什么?

2
使用R对二分数据进行因子分析的推荐程序
我必须对由二分变量(0 =是,1 =否)组成的数据集进行因子分析,我不知道自己是否走对了。 使用tetrachoric()我创建一个相关矩阵,并在其上运行fa(data,factors=1)。结果与使用MixFactor时收到的结果非常接近,但事实并非如此。 可以吗?还是您建议其他程序? 为什么会fa()工作并factanal()产生错误?(Fehler in solve.default(cv) : System ist für den Rechner singulär: reziproke Konditionszahl = 4.22612e-18)

1
如何使矩阵为正定?
我正在尝试为以下因素分析模型实现EM算法; w ^Ĵ= μ + B aĴ+ eĴ对于j = 1 ,… ,nWj=μ+Baj+ejforj=1,…,nW_j = \mu+B a_j+e_j \quad\text{for}\quad j=1,\ldots,n 其中是p维随机向量,是潜变量的q维向量,是参数的pxq矩阵。一个Ĵ乙w ^ĴWjW_j一个Ĵaja_j乙BB 由于该模型使用了其他假设,因此我知道,其中是误差项的方差协方差矩阵, = diag(,,...,)。d È Ĵ d σ 2 1 σ 2 2 σ 2 pw ^Ĵ〜ñ(μ ,B B′+ D )Wj∼N(μ,BB′+D)W_j\sim N(\mu, BB'+D)dDDËĴeje_jdDDσ21个σ12\sigma_1^2σ22σ22\sigma_2^2σ2pσp2\sigma_p^2 为了使EM算法正常工作,我正在进行涉及和矩阵估计的圆顶迭代,并且在这些迭代过程中,我在每次迭代中使用和新估计来计算的逆。不幸的是,在迭代过程中,失去了正定性(但不应该这样做,因为它是一个方差-协方差矩阵),这种情况破坏了算法的收敛性。我的问题是:D B B ' + D B D B …


1
标尺可靠性度量(Cronbach's alpha等)与组件/因子负载之间有什么关系?
假设我有一个数据集,其中包含一堆问卷项目的得分,理论上,这些项目的评分范围较小,例如心理学研究中。 我知道这里的常见方法是使用Cronbach's alpha或类似方法检查量表的可靠性,然后将量表中的项目汇总以形成量表分数并从那里继续进行分析。 但是,还有因素分析,可以将您所有项目的得分作为输入,并告诉您其中哪些构成一致的因素。通过查看负载和社区等,您可以了解这些因素的强大程度。对我来说,这听起来像是同一件事,只是更深入。 即使您所有的秤可靠性都不错,EFA也会根据哪些项目更适合哪个秤来纠正您,对吗?您可能会遇到交叉负荷,使用派生因子得分比简单的比例总和更有意义。 如果我想将这些量表用于以后的分析(如回归或ANOVA),只要能保持其可靠性,我是否应该汇总这些量表?或者是CFA之类的东西(测试量表是否保持良好的因素,这似乎在衡量与“可靠性”相同的东西)。 我已经分别学习了这两种方法,所以我真的不知道它们之间的关系,是否可以一起使用它们,或者哪种方法对哪种环境更有意义。在这种情况下,是否存在用于良好研究实践的决策树?就像是: 根据预测的规模项目运行CFA 如果CFA拟合良好,请计算因子得分并将其用于分析。 如果CFA显示不合适,请改用EFA并采用探索性方法(或其他方法)。 因子分析和可靠性测试是否确实是针对同一事物的单独方法,还是我在某个地方误解了?

1
EFA显然支持单一因素,措施在内部是一致的,但是CFA是否适合?
我正在探索一项10项自我报告测评的心理测量特性。我有两个独立样本中的大约400个案例。这些项目以4点李克特量表完成。全民教育显然支持单因素解决方案(例如,第一特征值超过6,所有其他本征值低于1),而克朗巴赫的alpha值很好(例如.90)。没有项目具有较低的项目-总相关性。 我最初想做一个CFA(EFA只是我发现CFA不好之后的后续工作),测试一个单因素模型。令我惊讶的是,该模型的适用性相对较差: CFI=.91 TLI=.88 RMSEA=.13 此外,每个项目的负载都非常好(.65+)。 奇怪的是SRMR=.05,这是可以接受的/很好。 修改索引建议我将各地的错误相关联。如果有明确的理由这样做(例如,某些项目的措词非常相似),我会这样做;但是,所有度量的措词都类似,并且将所有错误术语关联起来将是奇怪而痛苦的。 我从未见过这样的情况。这项措施在内部是一致的,显然是全民教育中的一个因素,但在CFA中显示不佳。在两个独立的样本(来自不同大陆)中,结果是一致的。我尝试了两因素CFA(将5个随机项目分组),拟合度相同,甚至略胜一筹。 这是我的问题: 考虑到EFA / Cronbach alpha /因子负荷,为什么CFI / TLI / RMSEA的拟合度如此差? 为什么SRMR好,而其他指数却不好?我知道他们会衡量不同的事物,但以我的经验,他们几乎总是会聚在一起。 我应该关联一些错误吗? 示例项目: 你有缺点的想法 您的想法很难忘记 你一直在想情况

2
PCA或因子分析中的变量偏斜
我想基于22个变量对SPSS进行主成分分析(因子分析)。但是,我的一些变量非常偏斜(根据SPSS计算得出的偏斜范围为2–80!)。 所以这是我的问题: 我应该保留这样的偏斜变量,还是可以在主成分分析中转换变量?如果是,我将如何解释因子得分? 我应该进行哪种类型的转换?log10还是ln? 最初,我的KMO(Kaiser–Meyer–Olkin)为0.413。许多文献建议最小值为0.5。我仍然可以进行因子分析,还是需要删除变量以将我的KMO提高到0.5?

2
二元数据的因子分析
一位匿名读者在我的博客上发布了以下问题。 内容: 读者希望通过问卷对量表进行因子分析-但数据来自成对的丈夫和妻子。 题: 可以对二元数据进行因子分析吗?如果是这样,怎么办? 独立性假设是否适用于因子分析?

3
关于PCA术后斜转
几个统计软件包(例如SAS,SPSS和R)使您可以在PCA之后执行某种因子轮换。 为什么要在PCA之后进行轮换? 考虑到PCA的目的是产生正交尺寸,为什么要在PCA之后进行倾斜旋转?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.