Questions tagged «correlation»

一对变量之间线性关联程度的度量。

6
R:按组计算相关性
已锁定。该问题及其答案被锁定,因为该问题是题外话,但具有历史意义。它目前不接受新的答案或互动。 在R中,我有一个数据帧,包括一个类别标签C(一个因数)和两个测量值M1和M2。如何计算每个类别中M1和M2之间的相关性? 理想情况下,我将返回一个数据帧,其中每个类一行一行,两列:类标签C和相关性。
17 r  correlation 

2
如何解释马修斯相关系数(MCC)?
问题的答案phi,Matthews和Pearson相关系数之间的关系?表明三种系数方法都是等效的。 我不是来自统计数据,所以这应该是一个简单的问题。 Matthews的论文(www.sciencedirect.com/science/article/pii/0005279575901099)描述了以下内容: "A correlation of: C = 1 indicates perfect agreement, C = 0 is expected for a prediction no better than random, and C = -1 indicates total disagreement between prediction and observation"`. 根据Wikipedia(http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient),皮尔森相关性描述为: giving a value between +1 and −1 inclusive, where: 1 is total positive correlation, …

1
变量与PCA分量(在双图/加载图上)的正确关联度量是什么?
我FactoMineR用来将我的测量数据集减少到潜在变量。 变量地图上面很清楚我解释,但是当它涉及到的变量和组件1.纵观可变地图之间的关联我很困惑,ddp并且cov非常接近在地图的组件,ddpAbs是一个远一点远。但是,这不是相关性显示的内容: $Dim.1 $Dim.1$quanti correlation p.value jittAbs 0.9388158 1.166116e-11 rpvi 0.9388158 1.166116e-11 sd 0.9359214 1.912641e-11 ddpAbs 0.9327135 3.224252e-11 rapAbs 0.9327135 3.224252e-11 ppq5 0.9319101 3.660014e-11 ppq5Abs 0.9247266 1.066303e-10 cov 0.9150209 3.865897e-10 npvi 0.8853941 9.005243e-09 ddp 0.8554260 1.002460e-07 rap 0.8554260 1.002460e-07 jitt 0.8181207 1.042053e-06 cov5_x 0.6596751 4.533596e-04 ps13_20 -0.4593369 2.394361e-02 ps5_12 -0.5237125 …


2
使用相关矩阵选择回归的预测变量是否正确?
几天前,我的一位心理学家和研究员向我介绍了他为线性回归模型选择变量的方法。我猜这不好,但是我需要请其他人确保。方法是: 查看所有变量(包括因变量Y)之间的相关矩阵,并选择与Y最相关的那些预测变量Xs。 他没有提到任何标准。 问:他说的对吗? [我认为这种选择方法是错误的,因为有很多事情,比如说应该选择哪个预测变量,甚至是省略变量偏差(OVB)的理论。]

4
为什么独立意味着零相关?
首先,我不是在问这个: 为什么零相关性并不意味着独立? 这在这里得到解决(相当好):https : //math.stackexchange.com/questions/444408/why-does-zero-correlation-not-imply-independence 我要问的是相反的意思...说两个变量完全相互独立。 难道他们偶然之间没有一点联系吗? 不应该...独立意味着非常少的相关性吗?




1
对数正态随机变量的相关性
给定和具有相关系数正常随机变量,我如何找到以下对数正态随机变量和之间的相关性?X 2 ρ ý 1 ÿ 2X1X1X_1X2X2X_2ρρ\rhoY1Y1Y_1Y2Y2Y_2 Y1=a1exp(μ1T+T−−√X1)Y1=a1exp⁡(μ1T+TX1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}X_1) Y2=a2exp(μ2T+T−−√X2)Y2=a2exp⁡(μ2T+TX2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}X_2) 现在,如果X1=σ1Z1X1=σ1Z1X_1 = \sigma_1 Z_1和X2=σ1Z2X2=σ1Z2X_2 = \sigma_1 Z_2,其中Z1Z1Z_1和Z2Z2Z_2是标准法线,则从线性变换属性中,我们得到: Y1=a1exp(μ1T+T−−√σ1Z1)Y1=a1exp⁡(μ1T+Tσ1Z1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}\sigma_1 Z_1) Y2=a2exp(μ2T+T−−√σ2(ρZ1+1−ρ2−−−−−√Z2)Y2=a2exp⁡(μ2T+Tσ2(ρZ1+1−ρ2Z2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}\sigma_2 (\rho Z_1 + \sqrt{1-\rho^2}Z_2) 现在,如何从此处计算Y1Y1Y_1和Y_2之间的相关性Y2Y2Y_2?

1
余弦相似度,皮尔逊相关度和z得分之间是否有任何关系?
我想知道这三项措施之间是否有任何关系。我似乎无法通过引用定义在它们之间建立联系(可能是因为我是这些定义的新手,并且在掌握它们时花了一些时间)。 我知道余弦相似度的范围可以是0-1,并且皮尔逊相关性的范围可以是-1到1,并且我不确定z得分的范围。 但是,我不知道余弦相似度的某个值如何告诉您有关皮尔逊相关性或z分数的信息,反之亦然?

3
我们什么时候可以说共线性
在线性模型中,我们需要检查解释变量之间是否存在关系。如果它们之间的相关性太大,则存在共线性(即,变量在某种程度上相互解释)。我目前仅查看每个解释变量之间的成对相关性。 问题1: 什么被归类为太多的相关性?例如,皮尔逊相关系数是否为0.5? 问题2: 我们是否可以根据相关系数完全确定两个变量之间是否存在共线性,或者它是否取决于其他因素? 问题3: 对两个变量的散点图进行图形检查是否会增加相关系数指示的内容?

2
有什么技术可以对两个相关的随机变量进行采样?
有什么技术可以对两个相关的随机变量进行采样: 如果其概率分布已参数化(例如,对数正态) 如果它们具有非参数分布。 数据是两个时间序列,可以为它们计算非零相关系数。假设历史相关性和时间序列CDF不变,我们希望将来模拟这些数据。 对于情况(2),一维类似物将用于构建CDF并从中采样。所以我想我可以构造一个二维CDF并做同样的事情。但是,我想知道是否有一种方法可以通过使用单个的一维CDF并以某种方式链接这些选项。 谢谢!

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
如何理解相关系数公式?
谁能帮助我了解Pearson相关公式?样本 =变量和的标准分数的乘积平均值。rrrXXXYYY 我有点理解为什么他们需要对和进行标准化,但是如何理解z得分的乘积呢? XXXYYY 该公式也称为“产品-时刻相关系数”,但是产品作用的原理是什么?我不确定是否已经明确说明了我的问题,但是我只想直观地记住该公式。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.