Answers:
LDA中的分类如下(贝叶斯法则)。[关于判别式的提取,请看这里。]
根据贝叶斯定理,在观察当前点x时我们正在处理类期望概率为P (k | x )= P (k )∗ P (x | k )/ P (x ),其中
-无条件(背景)类的概率 ķ ; P (x ) –点 x的无条件(背景)概率;P (X | ķ ) -点的存在的概率 X类 ķ,如果类被作了妥善处理是 ķ。
“观测当前点 ”是基本条件,P (x )= 1,因此分母可以省略。因此,P (k | x )= P (k )∗ P (x | k )。
是 x的本征类是 k的先验(分析前)概率;P (k )由用户指定。通常,默认情况下,所有类都接收相等的 P (k ) = 1 / number_of_classes。为了计算 P (ķ | X ),即后(分析后)的概率,对于本机类 X就是 ķ,一个应该知道 P (X | ķ )。
-本身的概率-不能确定,对于判别而言,LDA的主要问题是连续的而不是离散的变量。在这种情况下,表示 P (x | k )并与之成比例的数量是概率密度(PDF函数)。在此,我们需要计算PDF为点 X类 ķ, P d ˚F (X | ķ ),在 p通过的值形成三维正态分布 p判别。[参见Wikipedia多元正态分布]
其中 –判别空间中从点x到类质心的平方马氏距离(请参阅维基百科的马氏距离);S – 判别之间的协方差矩阵,在该类别中观察到。
用这种方法为每个类计算。对于点x和类别k,P (k )* P D F (x | k )表示我们想要的P (k )* P (x | k )。但根据上述保留意见,PDF本身并不是概率,仅与之成正比,因此我们应归一化P (k )∗ P D除以所有类上的 P (k )* P D F (x | k ) s之和。例如,如果总共有3个类 k, l, m,则