聚类:我应该使用Jensen-Shannon Divergence还是其平方?


Answers:


20

我认为这取决于如何使用它。

仅供其他读者参考,如果Q是概率测度,则詹森-香农散度为 J P Q = 1P 其中[R=1

ĴP=1个2dP∣∣[R+d∣∣[R
是中点测量和d·&||·& 是相对熵。[R=1个2P+d∣∣

现在,我很想使用Jensen-Shannon发散的平方根,因为它是一个度量,即它满足距离度量的所有“直观”属性。

有关更多详细信息,请参见

Endres和Schindelin,一种用于概率分布的新指标IEEE Trans。在信息上。y ,卷 49号 3,2003年7月,第1858-1860页。

当然,从某种意义上讲,这取决于您需要什么。如果您仅使用它来评估成对度量,那么JSD的任何单调变换都将起作用。如果您正在寻找最接近“平方距离”的东西,那么JSD本身就是类似的数量。

顺便说一句,您可能也对先前的问题以及相关的答案和讨论感兴趣。


很酷,我会尽快阅读“概率分布的新指标”。Txh
ocram 2011年

谢谢!我没有意识到JSD本身已经类似于dist ** 2
AlcubierreDrive

感谢您的精彩解释!只是一个简单的问题。我知道J-散度是对称的J(P,Q) = J(Q,P)。我读到JS散度在P和Q中是对称的。这意味着JS(P,Q) = JS(Q,P)什么?我之所以这样问是因为我正在使用包中的KLdiv函数。对于我的两个分布,KLdiv的矩阵输出不是对称的。我期望JS纠正此问题,但JS(使用KL计算)的输出不是对称的。flexmixR
传奇

1
P
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.