了解独立成分分析


18

我已经看到并喜欢了“ 使主成分分析有意义”这个问题,现在对于独立成分分析也有相同的问题。我的意思是我想对理解ICA的直观方式提出一个全面的问题?

我想了解。我想达到目的。我想得到它的感觉。我坚信:

除非您可以向祖母解释,否则您并不会真正理解。
- 艾尔伯特爱因斯坦

好吧,我无法向外行或奶奶解释这个概念

  1. 为什么选择ICA?这个概念有什么需要?
  2. 您将如何向外行解释?

我知道这是一个较晚的答复,但是我提供以下链接,我强烈建议所有想要掌握ICA背后的数学和推理部分的人。它帮助我阐明了有关源的非高斯散分布的直觉。
mrt

Answers:


18

这是我的尝试。

背景

考虑以下两种情况。

  1. 您是一个聚会的私人视线。突然,您看到一位老客户正在与某人交谈,您会听到一些话但听不清,因为您还听到了另一位在他旁边的人参加有关运动的不相关讨论。您不想靠近-他会发现您的。您决定拿起伴侣的电话(忙于说服调酒师的无酒精啤酒很棒),然后将其放在您旁边约10米的地方。电话正在录音,电话中还记录了老客户的讲话以及干扰体育的家伙。您可以携带自己的手机,也可以从站立的地方开始录制。大约15分钟后,您将获得两张录音带回家:一张来自您的位置,另一张距离您约10米。这两个录音都包含您的老客户和运动先生,
  2. 您为窗外看到的一只可爱的拉布拉多猎犬狗拍照。您检出图像,很遗憾,您和狗之间的窗户反射了光。您不能打开窗户(是的,是其中之一),您也不能出门,因为您担心他会逃跑。因此,您(出于某些未知原因)会从略有不同的位置拍摄另一张图像。您仍然可以看到反射和狗,但是它们现在处于不同的位置,因为您是从不同的地方拍摄的。还要注意,由于窗口是平坦的而不是凹凸的,所以位置对于图像中的每个像素均匀地变化。

问题在于,在两种情况下,给定两个图像包含相同的两个“来源”,但每个图像的相对贡献略有不同,如何恢复对话(在1.中)或狗的图像(在2中)。 。我受过良好教育的孙子肯定可以理解这一点!

直观的解决方案

至少在原理上,我们如何才能从混合物中找回狗的形象?每个像素包含两个值之和的值!好吧,如果每个像素都没有其他像素,我们的直觉将是正确的-我们将无法猜测每个像素的确切相对贡献。

但是,我们得到了一组像素(或者在记录情况下为时间点),我们知道它们具有相同的关系。例如,如果在第一个图像上,狗总是比反射强两倍,而在第二个图像上,狗正好相反,那么我们也许就能获得正确的贡献。然后,我们可以提出一种正确的方法来减去当前的两个图像,从而完全消除反射![数学上,这意味着找到逆混合矩阵。]

深入细节

假设您有两个信号的混合,

Y1=a11S1+a12S2Y2=a21S1+a22S2

并假设您要根据两个混合物Y 1Y 2获得。并且还假设您需要线性组合:S 1 = b 11 Y 1 + b 12 Y 2。因此,您要做的就是找到最佳向量bS1Y1,Y2S1=b11Y1+b12Y2(b11,b12)S2(b21,b22)

但是如何找到一般信号呢?它们可能看起来相似,统计数据相似等等。因此,让我们假设它们是独立的。如果您有一个干扰信号(例如噪声),或者两个信号都是图像,那是合理的,该干扰信号可能是其他物体的反射(并且您从不同角度拍摄了两个图像)。

现在,我们知道Y1Y2S1,S2X1,X2

X1,X2S1,S2X1,X2bij{aij}{bij}Si

{bij}X1,X2

因此,首先考虑一下:如果我们总结几个独立的非高斯信号,我们得出的总和要比分量高。为什么?由于中心极限定理,您还可以考虑两个indep之和的密度。变量,即密度的卷积。如果我们总结几个独立的。伯努利变量,经验分布将越来越像高斯形状。会是真正的高斯吗?可能不是(没有双关语),但是我们可以通过信号的高斯分布类似于高斯分布的量来度量它。例如,我们可以测量其过量峰度。如果确实很高,则它可能比具有相同方差但峰度接近零的峰高的高斯小。

{bij}X1,X2{bij}

当然,这增加了另一个假设-首先,两个信号必须是非高斯信号。


3
+1。一个很好的答案,但绝对不是奶奶级别的(至少那不是您的普通奶奶)。也许您可以通过一些外行/直观的介绍来作为开头(例如,按照“鸡尾酒会问题”的传统思路)?
变形虫说莫妮卡(Reonica Monica)

谢谢。我添加了有关问题和解决方案的一些背景信息。
yoki

3

很简单的。想象一下,您,您的祖母和家人聚集在桌子周围。较大的人群倾向于在该聊天组特定的聊天主题处分手。您的祖母坐在那里,听到所有人说话的声音,听起来好像是在吵闹。如果她转到一个小组,则可以清楚地将青少年/青年组中的讨论隔离开;如果她转到另一个小组,则可以将成年人聊天隔离。

总而言之,ICA是关于从混合信号(人群交谈)中分离或提取特定信号(一个人或一群人交谈)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.