Questions tagged «pearson-r»

皮尔逊积矩相关系数是两个变量之间的线性关系的度量 XY,其值介于+1和-1之间。



9
y与x的线性回归与x与y的线性回归之间有什么区别?
无论您计算pearson(x,y)还是pearson(y,x),x和y的Pearson相关系数都相同。这表明在给定x的情况下对y进行线性回归或在给定y的情况下对x进行线性回归应该是相同的,但我认为情况并非如此。 当关系不对称时,有人可以阐明这个问题吗?它与皮尔逊相关系数(我一直认为这是总结最佳拟合线)之间有什么关系?

3
如何与时间序列正确使用Pearson相关
我有2个时间序列(均平滑),我想对其进行互相关以了解它们之间的相关性。 我打算使用皮尔逊相关系数。这样合适吗 我的第二个问题是,我可以选择自己喜欢的两个时间序列。即,我可以选择我要我们的数据点数。这会影响输出的相关系数吗?我需要考虑这个吗? 出于说明目的 option(i) [1, 4, 7, 10] & [6, 9, 6, 9, 6] option(ii) [1,2,3,4,5,6,7,8,9,10] & [6,7,8,9,8,7,6,7,8,9,8,7,6]




2
收缩 vs无偏:估计量
关于皮尔逊相关系数总体值的两种估计量,我的头脑有些困惑。 A. Fisher(1915)表明,对于二元正态总体,经验是的负偏差估计量,尽管该偏差实际上仅对于小样本量()才是相当可观的。样本在某种意义上低估了,因为它比更接近于。(除非后者为或,否则是无偏的。)已经提出了几种几乎无偏的估计量,最好的估计可能是Olkin和Pratt(1958)r[RrÑ &lt; 30 [R ρ 0 ρ 0 ± 1 - [Rρρ\rhon&lt;30ñ&lt;30n<30r[Rrρρ\rho000ρρ\rho000±1±1个\pm 1r[Rrρρ\rho更正的:r[Rr runbiased=r[1+1−r22(n−3)][R无偏见的=[R[1个+1个-[R22(ñ-3)]r_\text{unbiased} = r \left [1+\frac{1-r^2}{2(n-3)} \right ] B.据说在回归中观察到高估了相应的总体R平方。或者,通过简单的回归,就是高估了。基于这一事实,我见过很多文章说,是正相关偏向于,这意味着绝对值:是从更远的比(?是说法正确)。文本说这与通过样本值高估标准偏差参数是同样的问题。有许多公式可以“调整”观察到的使其更接近人口参数Wherry's(1931)- [R 2 ρ 2 - [RR2[R2R^2r2[R2r^2ρ2ρ2\rho^2r[Rr[R 0 ρ - [R 2ρρ\rhor[Rr000ρρ\rhoR2[R2R^2 R2adj[R调整2R_\text{adj}^2是最著名的(但不是最好的)。调整后的的根称为收缩:r2adj[R调整2r_\text{adj}^2 r[Rr rshrunk=±1−(1−r2)n−1n−2−−−−−−−−−−−−−−√[R压缩=±1个-(1个-[R2)ñ-1个ñ-2r_\text{shrunk} = \pm\sqrt{1-(1-r^2)\frac{n-1}{n-2}} 当前是两个不同的估计量。非常不同的:第一个膨胀,第二放气。如何调和他们?在哪里使用/报告,在另一个地方?ρρ\rhor[Rrr[Rr 特别是,“收缩”的估计量也(几乎)是无偏的,就像“无偏”的估计一样,但仅在不同的上下文中-在回归的非对称上下文中,这是真的吗?因为,在OLS回归中,我们认为一侧(预测变量)的值是固定的,因此每个样本之间都没有随机误差吗?(要补充一点,回归不需要双变量正态性。)

6
完成3x3相关矩阵:三个给定系数中的两个
采访中有人问我这个问题。 假设我们有一个形式为的相关矩阵 ⎡⎣⎢1个0.60.80.61个γ0.8γ1个⎤⎦⎥[10.60.80.61γ0.8γ1]\begin{bmatrix}1&0.6&0.8\\0.6&1&\gamma\\0.8&\gamma&1\end{bmatrix} 给定该相关矩阵,要求我查找gamma的值。 我以为我可以对特征值做些什么,因为它们都应该大于或等于0(矩阵应该是正半定数)-但我认为这种方法不会产生答案。我想念一个把戏。 您能否提供解决该问题的提示?

1
当且仅当它们的等级相关时,随机变量才相关吗?
假设是具有有限第二矩的连续随机变量。Spearman秩相关系数ρ_s的总体版本可以定义为概率积分变换F_X(X)和F_Y(Y)的皮尔逊积矩系数ρ ,其中F_X,F_Y是X和Y的cdf 。ρ小号˚F X(X )˚F Ý(Ý )˚F X,˚F ÿ X ÿX,YX,YX,Yρsρsρ_sFX(X)FX(X)F_X(X)FY(Y)FY(Y)F_Y(Y)FX,FYFX,FYF_X,F_YXXXYÿY ρs(X,Y)= ρ(F(X),˚F(是))ρs(X,Y)=ρ(F(X),F(Y))ρ_s(X,Y)=ρ(F(X),F(Y))。 我想知道是否可以普遍得出这样的结论: ρ(X,Y)≠ 0 ↔ ρ(˚F(X),˚F(是))≠ 0ρ(X,ÿ)≠0↔ρ(F(X),F(ÿ))≠0ρ(X,Y)≠0↔ρ(F(X),F(Y))≠0? 即,当且仅当秩之间具有线性相关性时,我们才具有线性相关性吗? 更新:在评论中给出了两个例子,为什么 ρ (˚FX(X),˚Fÿ(是))= 0 → ρ (X,Y)= 0ρ(FX(X),Fÿ(ÿ))=0→ρ(X,ÿ)=0\rho(F_X(X),F_Y(Y))=0\rightarrow \rho(X,Y) = 0 即使XXX和ÿÿY具有相同的分布,通常也不是正确的。所以这个问题应该改写为 ρ(X,Y)= 0 → ρ (FX(X),˚Fÿ(是))ρ(X,ÿ)=0→ρ(FX(X),Fÿ(ÿ))\rho(X,Y) = 0 \rightarrow \rho(F_X(X),F_Y(Y))吗? 如果XXX和ÿÿY具有相同的分布,那么这是否为真对我也很感兴趣。 (注意:如果XXX和ÿÿY与正象限相关,即δ(x,y)= FX,Y(x ,y)- ˚FX(x )Fÿ(y)&gt; 0δ(X,ÿ)=FX,ÿ(X,ÿ)-FX(X)Fÿ(ÿ)&gt;0δ(x,y)=F_{X,Y}(x,y)−F_X(x)F_Y(y)>0则霍夫丁的协方差公式CØ v (X,Y)= …

3
为什么Pearson是参数化的,而Spearman是非参数化的
显然,皮尔逊的相关系数是参数性的,而斯皮尔曼的rho是非参数性的。 我很难理解这一点。据我了解,Pearson的计算公式为 而Spearman的计算方法相同,不同之处在于,我们将所有值替换为其等级。[RX ÿ= c o v (X,Y)σXσÿ[RXÿ=CØv(X,ÿ)σXσÿ r_{xy} = \frac{cov(X,Y)}{\sigma_x\sigma_y} 维基百科说 参数模型与非参数模型的区别在于,前者具有固定数量的参数,而后者随着训练数据量的增加而增加。 但是除了样本本身,我看不到任何参数。有人说参数测试假设服从正态分布,接着说皮尔逊确实假设服从正态分布数据,但是我看不出为什么皮尔逊会要求这样做。 所以我的问题是,在统计中,参数和非参数是什么意思?培生和斯皮尔曼如何融入其中?

3
3个变量的Pearson相关性的类比
我对三个变量的“相关性”是否有意义感兴趣,如果是什么,这将是什么? 皮尔逊积矩相关系数 E{(X−μX)(Y−μY)}Var(X)Var(Y)−−−−−−−−−−−−√E{(X−μX)(Y−μY)}Var(X)Var(Y)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)\}}{\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)}} 现在是3个变量的问题:是 E{(X−μX)(Y−μY)(Z−μZ)}Var(X)Var(Y)Var(Z)−−−−−−−−−−−−−−−−−−√E{(X−μX)(Y−μY)(Z−μZ)}Var(X)Var(Y)Var(Z)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)(Z-\mu_Z)\}} {\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)\mathrm{Var}(Z)}} 有什么事吗 在R中似乎可以解释: &gt; a &lt;- rnorm(100); b &lt;- rnorm(100); c &lt;- rnorm(100) &gt; mean((a-mean(a)) * (b-mean(b)) * (c-mean(c))) / (sd(a) * sd(b) * sd(c)) [1] -0.3476942 给定固定的第三个变量的值,我们通常查看2个变量之间的相关性。有人可以澄清吗?

2
如何解释马修斯相关系数(MCC)?
问题的答案phi,Matthews和Pearson相关系数之间的关系?表明三种系数方法都是等效的。 我不是来自统计数据,所以这应该是一个简单的问题。 Matthews的论文(www.sciencedirect.com/science/article/pii/0005279575901099)描述了以下内容: "A correlation of: C = 1 indicates perfect agreement, C = 0 is expected for a prediction no better than random, and C = -1 indicates total disagreement between prediction and observation"`. 根据Wikipedia(http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient),皮尔森相关性描述为: giving a value between +1 and −1 inclusive, where: 1 is total positive correlation, …


1
如何理解相关系数公式?
谁能帮助我了解Pearson相关公式?样本 =变量和的标准分数的乘积平均值。rrrXXXYYY 我有点理解为什么他们需要对和进行标准化,但是如何理解z得分的乘积呢? XXXYYY 该公式也称为“产品-时刻相关系数”,但是产品作用的原理是什么?我不确定是否已经明确说明了我的问题,但是我只想直观地记住该公式。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.