贝叶斯和费舍尔的线性判别分析方法


10

我知道2种进行LDA的方法贝叶斯方法费舍尔方法

假设我们有数据Xÿ,其中Xp维预测变量,ÿķ类的因变量。

通过贝叶斯方法,我们计算后验

pÿķ|X=pX|ÿķpÿķpXpX|ÿķpÿķ
,如书中所述,假设pX|ÿķ是高斯函数,那么我们现在将第ķ类的判别函数设为,我可以看到˚FķX是一个线性函数X,所以对于所有的ķ我们有类ķ线性判别函数。
FķX=lnpX|ÿķ+lnpÿķ=ln[1个2πp/2|Σ|1个/2经验值-1个2X-μķŤΣ-1个X-μķ]+lnpÿķ=XŤΣ-1个μķ-1个2μķŤΣ-1个μķ+lnpÿķ
FķXXķķ

然而,费舍尔的做法,我们尝试的项目ķ - 1 维空间中提取的新功能最小化类内变化,最大化类间方差,假设投影矩阵是W¯¯每一列是一个投影方向。这种方法更像是降维技术。Xķ-1个w ^

我的问题是

(1)我们可以使用贝叶斯方法进行降维吗?我的意思是,我们可以使用贝叶斯方法进行分类,方法是找到新函数x 的最大值的判别函数,但是这些判别函数f kx 可以用于将x投影到较低维度子空间?就像费舍尔的方法一样。FķXXFķXX

(2)两种方法相互之间以及如何相互联系?我看不到它们之间的任何关系,因为一个似乎只能用值进行分类,而另一个则主要针对降维。FķX

更新

感谢@amoeba,根据ESL的书,我发现了这一点: 在此处输入图片说明

这是线性判别函数,是通过贝叶斯定理加上所有类具有相同协方差矩阵得出的。这个判别函数就是我上面写的一个f kx ΣFķX

我可以使用作为该项目的方向X,为了做降维?对于AFAIK,我不确定,可以通过进行内部间差异分析来实现降维。Σ-1个μķX

再次更新

从第4.3.3节中可以得出这些预测的方式:

在此处输入图片说明

,当然,它假设类之间共享一个协方差,也就是公共协方差矩阵(对于类内协方差)w ^,对吗?我的问题是如何从数据计算该?如果我尝试根据数据计算W,则我将拥有K个不同的类内协方差矩阵。所以我必须集中所有类的协方差在一起,以获得共同的一个?w ^ķw ^


1
您的问题混淆了两件事。我认为您尚未消化我们对上一个问题的谈话。您首先描述的是贝叶斯分类方法(不是“ LDA的贝叶斯方法”)。此方法可用于(1)将原始变量用作分类器,或(2)将在LDA中获得的判别式用作分类器。费舍尔的方法是什么?
ttnphns 2014年

1
(续)好吧,“ Fisher的LDA”就是K = 2的LDA。在此类LDA中进行分类时,费舍尔发明了自己的公式进行分类。这些公式对于K> 2也适用。由于贝叶斯方法更为通用,因此如今几乎不使用他的分类方法。
ttnphns 2014年

1
@ttnphns,我感到困惑的原因是因为我提到的几乎每本书都使用这种贝叶斯方法谈论了LDA,将LDA视为一种生成模型,他们没有提到组间差异与组内差异的比率。 。
鳄梨

1
@loganecolss:您在下面看到了我的答案吗?您对此有任何疑问吗?我有些困惑,因为我想我已经在评论中再次解释了您现在要问的问题。在假设协方差相等的情况下,“方差之间”方法在数学上等效于“贝叶斯方法”。如果需要,您可以将其视为一个令人惊讶的数学定理。Hastie的书中提供了证明,该书可在线免费获得,其他一些机器学习教科书也提供。因此,我不确定“做LDA的唯一真实方法”的含义是什么。这两种相同的方式。
变形虫

1
@loganecolss:相信我,它们是等效的:)是的,您应该能够得出投影,但是您需要额外的等式相等方差矩阵假设(如我在回答中所写)。见下面我的评论。
变形虫

Answers:


11

我将只提供一个简短的非正式答案,并请您参考“统计学习的要素 ”第4.3节以获取详细信息。

更新: “元素”恰好详细涵盖了您在此处提出的问题,包括您在更新中写的内容。相关部分是4.3,尤其是4.3.2-4.3.3。

(2)两种方法相互之间以及如何相互联系?

X

XX

一个重要的见解是,如果假设所有类具有相同的协方差,则方程将大大简化[ 更新:如果一直假设,这可能是误解的一部分]。在这种情况下,决策边界变为线性,这就是为什么此过程称为线性判别分析LDA的原因。

需要一些代数运算才能意识到,在这种情况下,公式实际上变得完全等同于Fisher使用他的方法得出的结果。可以将其视为数学定理。有关所有数学信息,请参见Hastie的教科书。

(1)我们可以使用贝叶斯方法进行降维吗?

如果使用“贝叶斯方法”是指在每个类别中处理不同的协方差矩阵,则不会。至少因为我上面写的内容,它不会是线性降维(与LDA不同)。

Σ-1个μķķΣ-1个中号中号μķ


1
+1。我可能还会链接到自己的答案,并提及QDA stats.stackexchange.com/a/71571/3277
ttnphns 2014年

X

Σ

FķXFķXXΣ-1个μķ

我更新了帖子,添加了4.3节的片段
鳄梨
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.