Questions tagged «spearman-rho»

Spearman等级相关系数,通常表示为 ρ,是两个随机变量之间一致性的度量。





5
连续变量和分类(标称)变量之间的相关性
我想找到连续变量(因变量)和分类变量(标称:性别,自变量)之间的相关性。连续数据不是正态分布。在此之前,我已经使用Spearman的进行了计算。但是,有人告诉我这是不对的。ρρ\rho 在互联网上搜索时,我发现箱线图可以提供有关它们之间关联程度的想法;但是,我一直在寻找量化值,例如Pearson的乘积矩系数或Spearman的。您能帮我怎么做吗?或者,告知哪种方法合适?ρρ\rho 双峰系数会是正确的选择吗?

3
Goodman-Kruskal伽玛和Kendall tau或Spearman rho相关性如何比较?
在我的工作中,我们正在比较某些数据集的预测排名与真实排名。直到最近,我们一直单独使用Kendall-Tau。一个从事类似项目的小组建议我们尝试改用Goodman-Kruskal Gamma,他们更喜欢它。我想知道不同等级相关算法之间的区别是什么。 我找到的最好的答案就是该答案,它声称使用Spearman代替了通常的线性相关,并且Kendall-Tau不太直接,更类似于Goodman-Kruskal Gamma。我正在使用的数据似乎没有任何明显的线性相关性,并且数据严重偏斜且非正态。 而且,对于我们的数据,Spearman通常报告的关联性高于Kendall-Tau,我想知道关于数据的具体含义。我不是统计学家,所以抱歉,我正在阅读的某些论文对我而言像是行话。



1
当且仅当它们的等级相关时,随机变量才相关吗?
假设是具有有限第二矩的连续随机变量。Spearman秩相关系数ρ_s的总体版本可以定义为概率积分变换F_X(X)和F_Y(Y)的皮尔逊积矩系数ρ ,其中F_X,F_Y是X和Y的cdf 。ρ小号˚F X(X )˚F Ý(Ý )˚F X,˚F ÿ X ÿX,YX,YX,Yρsρsρ_sFX(X)FX(X)F_X(X)FY(Y)FY(Y)F_Y(Y)FX,FYFX,FYF_X,F_YXXXYÿY ρs(X,Y)= ρ(F(X),˚F(是))ρs(X,Y)=ρ(F(X),F(Y))ρ_s(X,Y)=ρ(F(X),F(Y))。 我想知道是否可以普遍得出这样的结论: ρ(X,Y)≠ 0 ↔ ρ(˚F(X),˚F(是))≠ 0ρ(X,ÿ)≠0↔ρ(F(X),F(ÿ))≠0ρ(X,Y)≠0↔ρ(F(X),F(Y))≠0? 即,当且仅当秩之间具有线性相关性时,我们才具有线性相关性吗? 更新:在评论中给出了两个例子,为什么 ρ (˚FX(X),˚Fÿ(是))= 0 → ρ (X,Y)= 0ρ(FX(X),Fÿ(ÿ))=0→ρ(X,ÿ)=0\rho(F_X(X),F_Y(Y))=0\rightarrow \rho(X,Y) = 0 即使XXX和ÿÿY具有相同的分布,通常也不是正确的。所以这个问题应该改写为 ρ(X,Y)= 0 → ρ (FX(X),˚Fÿ(是))ρ(X,ÿ)=0→ρ(FX(X),Fÿ(ÿ))\rho(X,Y) = 0 \rightarrow \rho(F_X(X),F_Y(Y))吗? 如果XXX和ÿÿY具有相同的分布,那么这是否为真对我也很感兴趣。 (注意:如果XXX和ÿÿY与正象限相关,即δ(x,y)= FX,Y(x ,y)- ˚FX(x )Fÿ(y)> 0δ(X,ÿ)=FX,ÿ(X,ÿ)-FX(X)Fÿ(ÿ)>0δ(x,y)=F_{X,Y}(x,y)−F_X(x)F_Y(y)>0则霍夫丁的协方差公式CØ v (X,Y)= …

3
为什么Pearson是参数化的,而Spearman是非参数化的
显然,皮尔逊的相关系数是参数性的,而斯皮尔曼的rho是非参数性的。 我很难理解这一点。据我了解,Pearson的计算公式为 而Spearman的计算方法相同,不同之处在于,我们将所有值替换为其等级。[RX ÿ= c o v (X,Y)σXσÿ[RXÿ=CØv(X,ÿ)σXσÿ r_{xy} = \frac{cov(X,Y)}{\sigma_x\sigma_y} 维基百科说 参数模型与非参数模型的区别在于,前者具有固定数量的参数,而后者随着训练数据量的增加而增加。 但是除了样本本身,我看不到任何参数。有人说参数测试假设服从正态分布,接着说皮尔逊确实假设服从正态分布数据,但是我看不出为什么皮尔逊会要求这样做。 所以我的问题是,在统计中,参数和非参数是什么意思?培生和斯皮尔曼如何融入其中?

5
实际使用哪些健壮的相关方法?
我计划进行一次仿真研究,在其中比较几种具有不同分布(偏斜,离群值等)的鲁棒相关技术的性能。对于稳健,我的意思是对a)偏斜分布,b)离群值和c)重尾稳健的理想情况。 除了将Pearson相关性作为基准外,我还想包括以下更可靠的措施: 斯皮尔曼的ρρ\rho 折弯百分比(Wilcox,1994,[1]) 最小体积椭圆形,最小协方差行列式(cov.mve/ cov.mcd与cor=TRUE选项) 温莎相关 当然,还有更多选择(特别是如果您还包括强大的回归技术),但是我想将自己局限于使用最多/很有希望的方法。 现在,我有三个问题(可以只回答一个问题): 我可以/应该包括其他健壮的相关方法吗? 您的领域实际上 使用了 哪些强大的相关技术?(谈到心理研究:除了Spearman的,我从未在技术论文之外见过任何健壮的关联技术。自举技术越来越受欢迎,但到目前为止,其他健壮的统计数据或多或少不存在)。ρρ\rho 您是否已经知道多种相关技术的系统比较? 也可以随意评论上面给出的方法列表。 [1] Wilcox,RR(1994)。百分比弯曲相关系数。心理疗法,59,601-616。

1
lmer模型使用哪种多重比较方法:lsmeans或glht?
我正在使用具有一个固定效果(条件)和两个随机效果(由于主题设计和配对而导致的参与者)的混合效果模型分析数据集。该模型是使用lme4包生成的exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 接下来,我针对没有固定效果(条件)的模型对该模型进行了似然比检验,结果有显着差异。我的数据集中有3个条件,因此我想进行多重比较,但不确定使用哪种方法。我在CrossValidated和其他论坛上发现了许多类似的问题,但我仍然很困惑。 据我所见,人们建议使用 1.该lsmeans包- lsmeans(exp.model,pairwise~condition)这给了我下面的输出: condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

2
具有秩相关的典范相关分析
典型相关分析(CCA)旨在最大化两个数据集的线性组合的通常Pearson乘积矩相关(即线性相关系数)。 现在,考虑该相关系数仅测量线性关联这一事实-这就是为什么我们也使用Spearman- 或Kendall- τ(秩)相关系数来测量之间的任意单调(不一定是线性)联系的原因。变量。ρρ\rhoττ\tau 因此,我想到了以下几点:CCA的一个局限性在于,由于其目标函数,它仅试图捕获所形成的线性组合之间的线性关联。通过最大化Spearman- 而不是Pearson- r在某种意义上扩展CCA是否可行?ρρ\rhorrr 这样的程序会导致任何统计学上可解释和有意义的事情吗?(例如,对等级执行CCA有意义吗??)我想知道当我们处理非常规数据时是否有帮助...

4
证明以下两个公式的等价性为Spearman相关
从维基百科中,通过将变量XiXiX_i和YiYiY_i转换为排名变量和,然后计算排名变量之间的皮尔逊相关性,来计算Spearman的排名相关性:xixix_iyiyiy_i 但是,本文继续指出,如果变量和之间没有联系,则上式等于XiXiX_iYiYiY_i 其中di=yi−xidi=yi−xid_i = y_i - x_i,在行列的差异。 有人可以证明这一点吗?我无权访问维基百科文章所引用的教科书。

1
如何正确评估序数和连续变量之间的相关性?
我想估算以下两者之间的相关性: 一个序数变量:要求受试者以1-5的等级(从非常恶心到非常美味)对6种类型的水果进行偏好评分。平均而言,受试者仅使用该等级的3分。 连续变量:要求相同的对象快速识别这些水果,从而得出6个水果的平均准确度。 Spearman rho是分析这些数据的最佳方法和/或我可以考虑其他好的方法吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.