什么是马氏距离,如何将其用于模式识别?


11

有人可以向我解释马氏距离的概念吗?例如,两个点x和y之间的马哈拉诺比斯距离是多少,尤其是如何解释模式识别?


3
您现在对此有什么了解?您是否尝试过维基百科?
gung-恢复莫妮卡


您可以使用此链接。它描述的很好people.revoledu.com/kardi/tutorial/Similarity/…–
Zohreh

Answers:


13

马氏距离提供了一种方法来测量一组条件与一组已知条件的相似程度。它说明了变量之间的协方差。

计算公式为: 其中:

d2=X-ŤC-1个X-
d2=马氏距离X=数据向量=自变量平均值的向量C-1个=自变量的逆协方差矩阵Ť=指示矢量应转置

页面提供了详细的解释(包括来自景观分析的示例)。


1
感谢,源给了我开始一个很好的解释
ayariga

5

马氏距离用于查找一组数据中的异常值。我不知道您所处的领域,但是在心理学上,它用于识别与数据集规范不符的情况。例如,如果您的样本由抑郁程度低的个体组成,而您有一个或两个抑郁程度非常高的个体,那么他们的马氏距离将大于预期的临界值。如果这些案例非常极端并且您认为它们不适合您的数据集,则可能要删除这些案例。(使用提供的示例,您的样本由抑郁程度较低的个体组成,因此,那些抑郁程度较高的一个或两个个体与其他人不匹配)。识别异常值非常重要,因为许多统计分析都具有“正态性假设”,即您的数据呈正态分布的期望。离群值也可能导致数据偏斜,因此,也应将其删除。(除非您转换整个变量,否则将纠正偏斜)。许多统计程序(例如SPSS)使您可以计算M距离以及与每个分数相关的概率,以识别异常值。我可以为您提供SPSS说明,但是我不知道您是否正在使用SPSS。(除非您转换整个变量,否则将纠正偏斜)。许多统计程序(例如SPSS)使您可以计算M距离以及与每个分数相关的概率,以识别异常值。我可以为您提供SPSS说明,但是我不知道您是否正在使用SPSS。(除非您转换整个变量,否则将纠正偏斜)。许多统计程序(例如SPSS)使您可以计算M距离以及与每个分数相关的概率,以识别异常值。我可以为您提供SPSS说明,但是我不知道您是否正在使用SPSS。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.