得出总的(类内+类间)散点矩阵


14

我对PCA和LDA方法很不满意,但我陷入了困境,我感到它是如此简单以至于看不到它。

类内()和类间()散布矩阵定义为:小号SWSB

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

总散射矩阵给出为:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

其中C是类别数,N是样本数是样本,是第i类均值,是总均值。μ μxμiμ

在尝试导出我遇到了一个问题:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

作为一个术语。必须为零,但是为什么呢?


确实:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
答案是,您正在求值的平均值附近的偏差之和,并且总和为零。但是,和到底是什么?如何是和有关和?答案的质量取决于我们猜测的准确性,但您却在强迫我们进行大量的猜测!中号 μ μ xmmimmiμμi
ub

@whuber:您完全正确,我修改了我的问题。
nimcap 2011年

Answers:


8

如果你假设

1Nt=1Nxti=μi

然后

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

和公式成立。您以类似方式处理第二个学期。


2
(+1)第二项,即第一项的转置,也必须为零(-)。
ub

@whuber,是的,这也是:)
mpiktas 2011年

嗨,我不知道为什么这个假设成立?有人可以解释吗?
Mvkt

1
@Mvkt 我假设的不是的定义。也就是说:是第组中观察值的平均值。我希望答案使用“假定”,因为OP没有解释该符号,所以我们不得不猜测组均值是。μ μ μiμiiμi
文森特
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.