现实中独立且不相关的数据的示例,以及测量/检测它们的方法


20

我们总是听到有关此数据向量VS的另一数据向量彼此独立或不相关等信息的信息,尽管很容易就这两个概念进行数学讨论,但我想将它们结合为实际的示例生活,并找到衡量这种关系的方法。

从这个角度出发,我正在寻找具有以下组合的两个信号的示例:(我将从一些内容开始):

  • 独立且(必要)不相关的两个信号:

    • 在讲话时,来自汽车发动机的噪声(称为)和声音()。v1[n]v2[n]
    • 记录每天的湿度()和道琼斯指数()。v1[n]v2[n]

Q1)您如何测量/证明它们与手中的两个向量无关?我们知道独立性意味着它们pdf的乘积等于它们的联合pdf,这很好,但是有了这两个向量,如何证明它们的独立性?

  • 两个信号不是独立的,但是仍然不相关:

Q2)我在这里想不到任何示例...一些示例是什么?我知道我们可以通过对两个这样的向量进行互相关来测量相关性,但是我们如何证明它们也不是独立的呢?

  • 两个相关的信号:
    • 一种矢量,用于测量主厅歌剧院歌手的声音,而有人则在建筑物内某处(例如在排练室())记录其声音。v1[n]v2[n]
    • 如果您连续测量汽车中的心率(),并且还测量了撞击在后挡风玻璃上的蓝光的强度( ...),我想这些可能是非常相关的。 。:-)v1[n]v2[n]

Q3)与q2有关,但是从此经验角度衡量互相关的情况下,查看这些矢量的点积是否足够(因为这是它们互相关的峰值)?为什么我们要关心交叉校正函数中的其他值?

再次感谢,给出更多的例子可以更好地建立直觉!


@DilipSarwate谢谢Dilip,我来看看。就目前而言,一些示例将是不错的。
Spacey 2012年

您不能以同样的理由“证明”他们是独立的,即使是结构良好的民意调查也不能“证明”每个人的投票方式。
Jim Clay 2012年

@JimClay随意放宽“证明”标准-我试图了解的是衡量/量化独立性的方法。我们经常听到这样的话,那么独立,那么,他们怎么知道的?使用什么卷尺?
Spacey 2012年

我想知道是否可以将Cros相关用于两个模拟信号,其中一个高分辨率,另一个用于低分辨率,以进行分析。

如果我们有一些随机变量X并构造2个信号a ** = (x)和** b ** = f 2(x),其中f 1f 2是正交的,并且** x = a + bf1f2f1f2。这是否意味着这些信号是独立的?这是否需要一些其他条件?此属性将很有趣,因为它避免构造ab的联合pdf 。
Mladen

Answers:


9

一些要素...(我知道这并不详尽,更完整的答案可能应该提到片刻)

Q1

要检查两个分布是否独立,您需要测量它们的联合分布与它们的边际分布p x × p y 的乘积有多相似。为此,您可以使用分布之间的任何距离。如果使用Kullback-Leibler散度比较这些分布,则将考虑数量:p(x,y)p(x)×p(y)

xyp(x,y)logp(x,y)p(x)p(y)dxdy

您将已经认识到...相互信息!数值越低,变量越独立。

实际上,要根据观察结果计算该数量,可以使用核密度估计器从数据中估计密度p y p x y 并在精细网格上进行数值积分; 或仅将您的数据量化为N个 bin,然后使用“相互信息”的表达式进行离散分布。p(x)p(y)p(x,y)N

Q2

从Wikipedia页面上的统计独立性和相关性:

分布图

除最后一个示例外,这些2D分布具有不相关的(对角协方差矩阵),但没有独立的边际分布p x p y p(x,y)p(x)p(y)

Q3

实际上,在某些情况下,您可能会查看互相关函数的所有值。它们出现在例如音频信号处理中。考虑两个麦克风捕获相同的信号源,但相距几米。这两个信号的互相关将在与麦克风之间的距离除以声速对应的滞后处具有一个峰值。如果仅查看滞后0处的互相关,您将不会看到一个信号是另一个信号的时移版本!


谢谢你。-1)请您详细介绍一下第一点-我真的很难理解如何从x [n]和y [n]这两个数据向量中得出他们的联合PDF。 ,。我可以理解如何获取x [n]的直方图会给我X的pdf((p(x}),与Y相同),但是在给定两个矢量的情况下,一个地球人怎么想出一个联合呢?具体问-从观察到的样本中准确地映射PDF,这使我最困惑(续)pXÿp(x}
Spacey 2012年

(续)2)总结一下:如果x和y的协方差矩阵是对角线,那么它们是不相关的,但不一定独立正确吗?测试独立性是跟进问题(1)的问题。但是,如果我们表明它们是独立的,那么它们的协方差矩阵当然就是对角线的。我明白吗?我可以在现实生活中测量的两个物理信号的示例是什么,这些信号将是相关但不相关的?再次感谢。
Spacey 2012年

1
假设您有两个信号y n表示为N个元素的向量。例如,您可以使用内核密度估算器获得p x y )的估算值:p x y = i 1XñÿññpXÿ其中K是内核函数。或者,您可以使用与构建直方图相同的技术,但使用2D。建立一个矩形网格,计算有多少对xnyn落入网格的每个像元,并使用pxy=CpXÿ=一世1个ñķX-X一世ÿ-ÿ一世ķXñÿñ,其中N是信号的大小,C是与点xy关联的像元中的元素数。pXÿ=CñCXÿ
pichenettes 2012年

1
“有两个物理信号是相关的,但不相关”:假设我们入侵了纽约出租车的GPS,以记录其位置的(经度,纬度)历史。经纬度很长。数据将不相关-点云没有特权的“方向”。但这几乎是独立的,因为如果要求您猜测驾驶室的纬度,那么如果您知道经度,就会提供更好的猜测(然后您可以查看地图并排除[纬度,长]被建筑物占据的对。
pichenettes 2012年

另一个例子:两个正弦波以相同频率的整数倍波动。零相关(傅立叶基础是正交的);但是,如果您知道一个值,那么只有另一个值可以取有限的一组值(想想李沙育图)。
pichenettes 2012年

5

在没有任何先验知识/假设的情况下,很难推断两个信号是否独立。

如果X的值不提供有关Y值的任何信息(即,不影响我们先前对Y的概率分布),则两个随机变量Y是独立的。这等效于XY的任何非线性变换都是不相关的,即 cov f 1X f 2Y = E f 1X f 2Y XÿXÿÿXÿ 对于任何非线性 f 1 f 2,假设wlog两个变量均具有零均值。独立性和不相关性之间的区别在于,如果满足上述条件,则 X Y不相关,仅对于 f 1x = f 2x = x,即身份函数。

冠状病毒F1个XF2ÿ=ËF1个XF2ÿ=0
F1个F2XÿF1个X=F2X=X

如果我们假设联合高斯性,那么所有大于阶数2的联合矩都等于零,在这种情况下,不相关意味着独立。如果我们没有先验的假设,那么对联合力矩估计将为我们提供有关它们“如何相互依赖”的信息。ËX一世ÿĴ

通过考虑所有频率上的互谱S X Yf S X 2Yf S X Y 2f ,可以将其概括为信号Y t fXŤÿŤ

小号XÿF小号X2ÿF小号Xÿ2F
F

范例

阅读了“小雕像”评论后,我受到启发,以他的想法为例。考虑的信号 ý = 2 π ˚F ķ ķ Žķ 1。显然,没有线性变换将X t 发送到Y t

XŤ=2πFŤ
ÿŤ=2πFŤķ
ķžķ1个XŤÿŤ因为它们以不同的频率振荡。然而,众所周知的是,我们可以写作为函数X ,因此, ÿ = ˚F X 对于某些多项式˚FķXX
ÿŤ=FXŤ
F

因此,尽管是不相关的信号,但Y t 不是独立的。XŤÿŤ


XX2ÿF

X2ŤÿŤ
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.