4 在什么条件下应该将李克特量表用作序数或区间数据? 社会科学中的许多研究都使用李克特量表。什么时候适合使用Likert数据作为序数,什么时候适合将其用作间隔数据? 52 ordinal-data likert scales measurement
4 归一化与缩放 数据“规范化”和数据“缩放”之间有什么区别?直到现在我都认为这两个术语指的是同一过程,但现在我意识到还有一些我不知道/不了解的事情。另外,如果“规范化”和“缩放”之间存在差异,那么什么时候应该使用“规范化”而不是“缩放”,反之亦然? 请举例说明。 45 data-transformation scales normality-assumption normalization
3 可视化李克特项目响应数据 有什么办法可以形象地显示李克特反应集? 例如,一组询问X在其有关A,B,C,D,E,F和G的决策中的重要性的项目?有没有比堆积条形图更好的东西? 不适用的回应应该怎么做?他们将如何代表? 条形图是否应报告百分比或响应次数?(即条的总长度应相同吗?) 如果是百分比,分母是否应包括无效和/或N / A响应? 我有自己的看法,但我正在寻找其他人的想法。 25 data-visualization scales likert
6 五点李克特项目的分组差异 接下来是这个问题:假设您想测试一下李克特(Likert)项目的5点(例如,对生活的满意度:不满意)对两组(例如,男性和女性)的集中趋势的差异。我认为t检验在大多数情况下都足够准确,但是对组均值之间的差异进行自举检验通常可以提供更准确的置信区间估计。您将使用什么统计检验? 22 t-test ordinal-data likert scales
4 如何将新向量投影到PCA空间上? 执行主成分分析(PCA)之后,我想将一个新向量投影到PCA空间上(即在PCA坐标系中找到其坐标)。 我已经使用R计算了R语言的PCA prcomp。现在,我应该可以将向量乘以PCA旋转矩阵。该矩阵中的主要成分应该按行还是按列排列? 21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial
6 将变量的小数位数更改为0-100 我使用PCA技术构建了社会资本指数。该指数包括正值和负值。我想将此索引转换/转换为0-100比例,以便于解释。请建议我这样做的最简单方法。 20 data-transformation scales
2 是否使用结构方程模型分析心理学中的观察研究 我注意到这个问题在统计咨询设置中经常出现,我很想知道您的想法。 语境 我经常与进行研究的研究学生交谈,大致如下: 观察研究 样本大小可能是100、200、300等。 已经测量了多种心理量表(例如,焦虑,抑郁,性格,态度,其他临床量表,可能是智力等)。 研究人员已经阅读了相关文献,并对可能的因果关系有一些想法。通常,将变量一般概念化为前因,过程变量和结果变量。他们还经常听到结构方程建模更适合测试他们正在研究的变量集之间关系的整体模型。 题 您认为在什么条件下结构方程建模是分析此类研究的合适技术? 如果您不建议结构方程建模,您会推荐哪些替代技术? 对于考虑在这种情况下使用结构方程建模的研究人员,您将提供什么建议? 20 scales causality sem observational-study
3 利克特项目构成的问卷的因子分析 我曾经从心理学的角度分析项目。但是现在我正在尝试分析关于动机和其他主题的其他类型的问题。这些问题都是在李克特量表上。我最初的想法是使用因子分析,因为假设这些问题可以反映一些潜在的方面。 但是因子分析是否合适? 是否有必要验证每个问题的维度? 对李克特项目进行因子分析是否存在问题? 是否有关于如何对李克特和其他分类项目进行因子分析的好的论文和方法? 17 factor-analysis scales psychometrics likert psychology
2 评估问卷的可靠性:维度,有问题的项目以及是否使用alpha,lambda6或其他某种指数? 我正在分析参加实验的参与者给出的分数。我想估计问卷的可靠性,该问卷由6个项目组成,旨在估计参与者对产品的态度。 我计算了克朗巴赫(Cronbach)的alpha值,将所有项目视为一个比例(alpha约为0.6),并一次删除了一项(最大alpha约为0.72)。我知道,根据项目的数量和底层构造的维数,alpha可能会被低估和高估。因此,我还执行了PCA。该分析表明,有三个主要成分解释了大约80%的方差。所以,我所有的问题都是关于我现在该如何进行? 我是否需要在每个维度上执行alpha计算? 我是否已移除影响可靠性的物品? 此外,在网上搜索时,我发现还有另一种可靠性度量:guttman的lambda6。 此度量与alpha的主要区别是什么? lambda的高价值是什么? 16 pca reliability scales psychometrics cronbachs-alpha
3 为了得出“天花板效应”正在发生,必须满足什么条件? 根据SAGE社会科学研究方法百科全书 ... [a]上限效应发生在一项措施具有潜在响应的明显上限并且参与者集中度达到或接近该上限时。尺度衰减是一个方法学问题,每当以这种方式限制方差时都会发生。…例如,某种程度的态度可能会产生天花板效应,其中高分表示一种有利态度,而最高的反应却无法捕捉到最积极的评价。…解决天花板效应的最佳解决方案是试点测试,这可以尽早发现问题。如果发现上限效应,并且[结果]度量标准是任务绩效,则可以使任务更加难以增加潜在响应的范围。1个 [重点添加] 似乎有很多的建议和问题,(在这里)处理分析这表明类似于上述报价的天花板埋入影响的数据。 我的问题可能很简单,也可能很幼稚,但是如何真正检测出数据中存在上限效应呢?更具体地说,例如,创建了一个心理测验,并怀疑其导致了上限效应(仅视觉检查),然后对该测验进行了修改,以产生更大范围的值。如何显示修订后的测试已从其生成的数据中消除了上限效应?是否有一项测试表明数据集a中存在上限效应,但数据集b中没有上限效应? 我幼稚的方法是仅检查分布偏斜,如果不偏斜,则得出结论没有上限效应。这太简单了吗? 编辑 再举一个更具体的例子,我说开发了一种可以测量某些潜在特征x的工具,该特征x随着年龄的增长而增加,但最终趋于平稳,并随着年龄的增长而开始下降。我制作了第一个版本,范围为1-14,进行了一些试验,发现似乎有一个上限效应(很多响应在14或接近14时,最大值。)查看数据,但是为什么呢?是否有严格的方法来支持该主张? 然后,我将度量值修改为1-20,并收集更多数据。我看到趋势更加符合我的期望,但是我怎么知道测量范围足够大。我需要再次修改吗?从外观上看,这似乎还可以,但是有没有一种方法可以验证我的怀疑? 我想知道如何才能在数据中检测到这种上限效应,而不仅仅是查看它。这些图代表实际数据,而非理论数据。扩大仪器的范围可以产生更好的数据分布,但这足够吗?我该如何测试? 1 Hessling,R.,Traxel,N.,&Schmidt,T.(2004)。天花板效果。SAGE社会科学研究方法百科全书,由 Michael S. Lewis-Beck,A。Bryman和Tim Futing Liao(编)撰写。(第107页)。加利福尼亚州千橡市:Sage Publications,Inc. doi:10.4135 / 9781412950589.n102 13 distributions variance scales psychometrics measurement
1 当模型与缩放数据拟合时,如何缩放新的观测值以进行预测? 我了解缩放数据矩阵以用于线性回归模型的概念。例如,在R中,您可以使用: scaled.data <- scale(data, scale=TRUE) 我唯一的问题是,对于要为其预测输出值的新观测值,它们如何正确缩放?会scaled.new <- (new - mean(data)) / std(data)吗? 13 r regression prediction scales
2 如何将问卷中的顺序数据转换为适当的间隔数据? 是否有任何简单的方法可以将序数级别的数据转换为间隔级别(正好相反)?可以在Excel或SPSS中执行吗? 有了数据,说:序数级别上的10个问题(例如0-5比例,其中0 =“完全不”,5 =“一直”),我想对其进行转换,以便可以将其视为适当的问题用于参数测试目的的时间间隔级别数据(正态分布,无法进行的非参数测试)。 将非常感谢您的回答! 13 categorical-data ordinal-data scales psychometrics
4 如何计算变量组之间/组之间的相关性? 我有一个包含1000个观察值和50个变量的矩阵,每个变量以5分制为单位。这些变量被组织成组,但是每个组中变量的数量并不相等。 我想计算两种类型的相关性: 变量组内的相关性(在特征之间):某种程度的变量,用于确定变量组内的变量是否在测量同一事物。 变量组之间的相关性:某种度量(假设每个组反映一个整体特征)是每个特征(组)如何与其他特征相关联。 这些特征先前已被分为几类。我对找到组之间的相关性很感兴趣-即假设组中的特征正在测量相同的基本特征(已在上面完成#1-Cronbach的alpha值),这些特征本身是否相关? 有人对从哪里开始有建议吗? 13 correlation psychometrics scales
3 如何计算大样本的Rousseeuw和Croux(1993)Qn规模估计量? 令因此对于这样的非常短的样本,可以计算得出从找到成对差分的第阶静态: { 1 ,3 ,6 ,2 ,7 ,5 } ķ问ñ= Cñ。{ | X一世- XĴ| ; 我<j }(k )Qn=Cn.{|Xi−Xj|;i<j}(k)Q_n = C_n.\{|X_i-X_j|;i < j\}_{(k)}{ 1 ,3 ,6 ,2,7 ,5 }{1,3,6,2,7,5}\{1,3,6,2,7,5\}ķkk 7 6 5 3 2 1 1 6 5 4 2 1 2 5 4 3 1 3 4 3 2 5 … 13 data-transformation scales robust optimal-scaling
2 评级分数与估计因子分数之和? 我很想收到有关在构建量表时何时使用“ 因子得分 ”而不是简单得分总和的建议。即“精炼”而不是“未精炼”的因素评分方法。来自DiStefano等。(2009; pdf),重点增加了: 因子得分计算方法主要有两类:精炼和非精炼。未精炼的方法是相对简单的累积过程,可提供有关个人在因素分布上的位置的信息。简单性使其具有一些吸引人的功能,即,未经改进的方法既易于计算,又易于解释。完善的计算方法使用更复杂的技术方法来创建因子得分。 与未改进的方法相比,它们更精确,更复杂,并提供标准化分数的估计值。 在我看来,如果目标是创建一个可以在研究和设置中使用的量表,那么所有量表项的简单总和或平均得分就很有意义。但是,可以说,目标是评估程序的治疗效果,而重要的对比在于样品(治疗组与对照组)之间。有什么理由使我们更喜欢因子得分来衡量总和或平均值? 要具体说明替代方案,请考虑以下简单示例: library(lavaan) library(devtools) # read in data from gist ====================================================== # gist is at https://gist.github.com/ericpgreen/7091485 # this creates data frame mydata gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R" source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290") head(mydata) # v1 v2 v3 v4 v5 v6 v7 v8 v9 # 1 3 4 3 4 … 12 factor-analysis sem scales