名称“部分”和“边际”相关背后的直觉


12

是否有人知道为什么两个变量之间的条件相关称为“偏”相关,而它们之间的简单相关(因此,当不以任何其他变量为条件时)称为“边际”相关吗?“部分”和“边际”一词的直觉是什么?他们如何处理“零件”或“边距”?

为了更好地理解这些概念,最好学习答案。


Answers:


11

术语“边缘”非常古老。如果您回溯到足够远的历史,就不会有科学期刊(显然,它们始于1665年左右)。取而代之的是,通过手写信件传达中期结果,并将最终结果写在书中。在Playfair之前,数据图形的方式并不太多,但是书籍可能经常在不同条件下使用带有数字的表格。考虑此表:
xIAIAIx

ABCDIxI,AxI,BxI,CxI,DIIxII,AxII,BxII,CxII,DIIIxIII,AxIII,BxIII,CxIII,DIVxIV,AxIV,BxIV,CxIV,D
; 也就是说,它们为条件的特定组合给出了一个数字。但是,有时读者想知道特定条件是什么样,而不考虑其他变量。想象是当第一个变量是而第二个变量是时某事物发生的次数。然后,可能有人想知道,无论第二个变量是什么,当使用第一个变量时,这种情况发生的频率是多少?很容易发现这一点,您只需将求和即可xI,AIAIx在第一行中,忽略列。人们过去通常会做这种事情,(自然地)他们将数字写在桌子旁书的空白处。原始数字是有条件的,而其他类型的数字则没有名称。他们被称为“ 边缘 ”。

这些数字与相关性有什么关系?好吧,这不是直接的联系,但是一旦您有了“不考虑其他变量”的想法,并且有了类似的名称(即相关性),便有了该名称(“边际”)。 ,只需应用名称和构想。


我不知道偏相关的词源,但是我可以给你直觉。实际上,这非常简单:您正在处理一个变量的一部分与另一变量的一部分之间的相关性。考虑一下这个数字:

在此处输入图片说明

我们可以想象一下左边的圆圈是一个变量,右圆是一个变量,顶部圆是一个变量。两个变量之间的相关性与圆的重叠程度有关(实际上,我们可以想象圆的面积代表每个变量的可变性,面积的百分比为)。现在很明显,和之间存在一些相关性,但是和之间以及和之间也存在一些相关性。如果您想知道那些部分之间的相关性怎么办Y Z r 2 X Y X Z Y Z X Y ZXYZr2XYXZYZX和那名无关YZ?那将是部分相关。这与圆的两个部分之间的重叠有关,这两个部分不包括与顶圆相交的顶条。

我喜欢此网页,因为它提供了对部分相关性和相关主题的易于理解的讨论。仅第一部分是关于部分相关性本身的,但是我强烈建议阅读整个页面(即使篇幅很长)。尽管没有直接关系,但有关此主题的讨论:线性多元回归方程中所有IV之间的共享方差在哪里?,也可能会有帮助。


1
谢谢!提出这一点使我想到了另一个有关对称性的问题。我们知道。相同属性是否适用于部分相关,即?使用上面的公式,我们可以这样写:,我认为将总是等于因为分母可以改变(是表示圆的大小和基于该组的度量和该组的度量? )?ρ X ÿ | ž = ρ ÿ X | ž ρ ÿ X | Z = ρ(X,Y)=ρ(Y,X)ρXY|Z=ρYX|Z ρXÿ| žρÿX| ZXYXYρYX|Z=Area(1)Area(X(2+center))ρXY|ZρYX|ZXYXY
Kiran K.

1
这可能是一个新问题,@ KiranK。这是一个很好的问题,我们不希望它被人们无法找到的评论所掩盖。
gung-恢复莫妮卡

好主意,我转贴的问题在这里:stats.stackexchange.com/questions/195410/...
基兰K.

0

两个变量之间的相关性(称为边际相关性)表明两个变量样本都显示出一定的依赖性。ρXYX,Y

一旦通过线性回归消除了混杂变量的影响,偏相关测量之间的残差相关。ρXYZX,YZ

用数学术语表示为:

ρXYZ:=ρXYρXZρYZ1ρXZ21ρYZ2

为了说明此定义的属性,我们可以考虑两种极限情况:

  • 如果和与变量都为0%相关,则部分相关为相关:XYZ

    ρXYZ=ρXY

  • 但是,如果与相关联为100%,则无论的值如何,部分相关始终为0 。YZρXY

ρXYZ=0

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.