什么是赫林格距离和何时使用?


19

我很想知道赫林格距离的实际情况(简单来说)。此外,我也想知道我们可以使用Hellinger Distance的哪些类型的问题?使用赫林格距离有什么好处?


9
赫林格距离是欧几里得距离的概率模拟。一个显着的属性是它的对称性,作为度量。如果您正在写纸并且需要具有某些属性的距离函数以使证明成为可能,则此类数学属性非常有用。在应用程序中,某人可能会发现,对于一项特定任务,一个度量标准会比另一个度量标准产生更好或更佳的结果。例如,Wasserstein距离生成对抗网络中
Emre

谢谢你的意见。我遇到了这个问题,与我现在遇到的问题非常相似。datascience.stackexchange.com/questions/22324/…请让我知道,为什么答案说Hellinger Distance是合适的?
史密斯·沃卡

2
可能在度量空间中可视化主题。另一个很好的特性是,对于具有不同支持的分布,Hellinger距离是有限的。您问这些问题很好。我建议您自己尝试不同的指标并观察结果。
Emre

谢谢。这是一个很好的链接。有很大帮助。但是,Hellinger距离是否仅限于链接中提到的源自潜在狄利克雷分配(LDA)的主题?
史密斯·沃卡

1
不,它与LDA没有固有联系。
Emre

Answers:


7

赫林格距离是一种度量两个概率分布之间差异的度量。它是欧几里得距离的概率模拟。

给定两个概率分布和,赫林格距离定义为:PQ

h(P,Q)=12PQ2

在量化两个概率分布之间的差异时很有用。例如,如果您估计服务的用户和非用户的分配。如果对于某些特征,这些组之间的Hellinger距离很小,则这些特征在统计上对分割没有帮助。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.