Questions tagged «correlation»

一对变量之间线性关联程度的度量。

18
如果解释变量和响应变量在回归之前被独立排序会怎样?
假设我们有数据集与点。我们想要执行线性回归,但是首先我们将值和值彼此独立地排序,从而形成数据集。对新数据集的回归是否有有意义的解释?这有名字吗?n X i Y i(X i,Y j)(X一世,Y一世)(Xi,Yi)(X_i,Y_i)ñnnX一世XiX_iÿ一世YiY_i(X一世,YĴ)(Xi,Yj)(X_i,Y_j) 我想这是一个愚蠢的问题,所以我很抱歉,我没有接受过统计学方面的正式培训。在我看来,这完全破坏了我们的数据,而回归毫无意义。但是我的经理说,这样做的时候,他“大多数时候会得到更好的回归”(这里“更好”意味着更具预测性)。我觉得他在欺骗自己。 编辑:感谢您所有的好和耐心的例子。我向他展示了@ RUser4512和@gung的示例,他仍然坚定不移。他变得烦躁,我变得精疲力尽。我感到垂头丧气。我可能很快就会开始寻找其他工作。


8
Facebook终结了吗?
最近,本文受到了很多关注(例如,《华尔街日报》的关注)。基本上,作者得出的结论是,到2017年,Facebook将失去80%的成员。 他们的主张基于SIR模型的外推,SIR模型是流行病学中经常使用的隔间模型。他们的数据来自Google搜索“ Facebook”的内容,作者使用Myspace的灭亡来验证他们的结论。 题: 作者是否犯了“相关并不意味着因果关系”的错误?该模型和逻辑可能适用于Myspace,但是对任何社交网络都有效吗? 更新:Facebook回击 与科学原则“相关等于因果关系”相一致,我们的研究明确表明普林斯顿可能有完全消失的危险。 我们真的不认为普林斯顿大学或世界的空气供应很快就会消失。我们热爱普林斯顿大学(和空气),并最后提醒我们:“并非所有研究都是平等的,而且某些分析方法会得出非常疯狂的结论。

6
与无序分类变量的相关性
我有一个包含许多观察结果和许多变量的数据框。其中一些是分类的(无序),其他是数字的。 我正在寻找这些变量之间的关联。我已经能够计算数值变量的相关性(斯皮尔曼相关性),但是: 我不知道如何测量无序分类变量之间的相关性。 我不知道如何测量无序分类变量和数值变量之间的相关性。 有谁知道该怎么做?如果是这样,是否有R函数实现这些方法?


8
因果关系暗示吗?
关联并不表示因果关系,因为可能有很多解释。但是因果关系是否暗示相关性?凭直觉,我认为因果关系的存在必然意味着一定的相关性。但是我的直觉并不总是在统计学上对我有用。因果关系暗示吗?



6
您如何解释相关性和协方差之间的区别?
跟进这个问题,您将如何向仅理解均值的人解释协方差?谈到向外行人解释协方差的问题,我想到了一个类似的问题。 如何向统计学新手解释协方差和相关性之间的区别?似乎两者均指代链接到另一个变量的一个变量的更改。 与提到的问题类似,缺少公式将是可取的。


9
y与x的线性回归与x与y的线性回归之间有什么区别?
无论您计算pearson(x,y)还是pearson(y,x),x和y的Pearson相关系数都相同。这表明在给定x的情况下对y进行线性回归或在给定y的情况下对x进行线性回归应该是相同的,但我认为情况并非如此。 当关系不对称时,有人可以阐明这个问题吗?它与皮尔逊相关系数(我一直认为这是总结最佳拟合线)之间有什么关系?


16
相关在什么条件下暗示因果关系?
我们都知道,所有第一年统计专业的学生都鼓吹“不代表因果关系”的口头禅。有一些很好的例子在这里说明的想法。 但是有时候关联确实暗示了因果关系。以下示例摘自该Wikipedia页面 例如,可以对同一对双胞胎进行一项实验,这些双胞胎在其测试中始终获得相同的成绩。一对双胞胎被送去学习六个小时,而另一对被送往游乐园。如果他们的考试成绩突然出现较大差异,这将有力证据表明学习(或去游乐园)对考试成绩有因果关系。在这种情况下,学习分数和考试分数之间的相关性几乎可以肯定是因果关系。 还有其他情况下关联暗示因果关系吗?


3
示例:使用glmnet获得二进制结果的LASSO回归
我开始与使用的涉猎glmnet与LASSO回归那里我感兴趣的结果是二分。我在下面创建了一个小的模拟数据框: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.