线性判别分析和贝叶斯规则:分类


12

线性判别分析与贝叶斯规则之间有什么关系?我知道LDA是通过尝试最小化组方差内和组方差之比来进行分类的,但是我不知道贝叶斯规则在其中的用法。


提取判别函数,以使组间变化与组内变化比率最大化。它与分类无关,这是LDA的第二个独立阶段。
ttnphns 2012年

Answers:


16

LDA中的分类如下(贝叶斯法则)。[关于判别式的提取,请看这里。]

根据贝叶斯定理,在观察当前点x时我们正在处理类期望概率为P k | x = P k P x | k / P x ,其中kxP(k|x)=P(k)P(x|k)/P(x)

-无条件(背景)类的概率 ķ ; P x –点 x的无条件(背景)概率;P X | ķ -点的存在的概率 X ķ,如果类被作了妥善处理是 ķP(k)kP(x)xP(x|k)xkk

“观测当前点 ”是基本条件,P x = 1,因此分母可以省略。因此,P k | x = P k P x | k xP(x)=1P(k|x)=P(k)P(x|k)

x的本征类是 k的先验(分析前)概率;P k 由用户指定。通常,默认情况下,所有类都接收相等的 P k = 1 / number_of_classes。为了计算 P ķ | X ,即后(分析后)的概率,对于本机类 X就是 ķ,一个应该知道 P X | ķ P(k)xkP(k)P(k)P(k|x)xkP(x|k)

-本身的概率-不能确定,对于判别而言,LDA的主要问题是连续的而不是离散的变量。在这种情况下,表示 P x | k 并与之成比例的数量是概率密度(PDF函数)。在此,我们需要计算PDF为点 X ķ P d ˚F X | ķ ,在 p通过的值形成三维正态分布 pP(x|k)P(x|k)xkPDF(x|k)pp判别。[参见Wikipedia多元正态分布]

PDF(x|k)=ed/2(2π)p/2|S|)

其中 –判别空间中从点x到类质心的平方马氏距离(请参阅维基百科的马氏距离);S判别之间的协方差矩阵,在该类别中观察到。dxS

用这种方法为每个类计算。对于点x和类别k,P k * P D F x | k 表示我们想要的P k * P x | k 。但根据上述保留意见,PDF本身并不是概率,仅与之成正比,因此我们应归一化P k P DPDF(x|k)P(k)PDF(x|k)xkP(k)P(x|k)除以所有类上的 P k * P D F x | k s之和。例如,如果总共有3个类 k l m,则P(k)PDF(x|k)P(k)PDF(x|k)klm

P(k|x)=P(k)PDF(x|k)/[P(k)PDF(x|k)+P(l)PDF(x|l)+P(m)PDF(x|m)]

xP(k|x)

SS|S|=1dSSw

xkbkv1V1x+bkv2V2x+...+ConstkV1,V2,...Vp

bkv=(ng)wpsvwV¯kwgsvwp V

Constk=log(P(k))(vpbkvV¯kv)/2

x


这是贝叶斯方法吗?费舍尔对此采取什么方法?
zca0 2012年

1
根据您的要求添加到答案中
ttnphns 2012年

XKp(K|X)p(K|X)K

我认为贝叶斯方法更容易理解,为什么我们需要使用费舍尔方法?
鳄梨

我们不需要 仅出于历史问题。
ttnphns 2014年

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.