何时使用加权欧几里得距离,以及如何确定要使用的权重?


16

我有一组数据,其中每个数据包含n不同的度量。对于每种度量,我都有一个基准值。我想知道每个数据与基准值有多接近。

我想到了像这样使用加权欧几里得距离:

dx,b=(i=1nwi(xibi)2))1/2

哪里

xi是特定数据的第i个度量的值

bi是该度量的相应基准值。

wi是我将附加到第i个度量之间的权重值,但要遵守以下条件:

0<wi<1i=1n1

但是,根据文档,我发现要使用的权重是第i个度量的方差的倒数。我认为这种加权不会解释我对每种度量标准的重视程度。

因此:

  1. 是否有方法提出一组权重来反映观察者对度量的相对重要性,或者观察者可以为权重分配任意值吗?

  2. 使用加权欧几里得距离来解决这个问题是否合适?

Answers:


16

标准化砝码

w

重要的权重

您可以随意放置任何您喜欢的东西作为权重,包括“重要性”的度量(尽管如果度量单位不同,您可能希望在重要性加权之前进行标准化)。

Xb 可能是两个演员在 一世第四期 w一世该问题的突出性。例如,b一世可能是某个维度上的现状位置,各个参与者的位置都与此不同。在此应用程序中,肯定会更倾向于测量而不是强调显着性和位置。无论哪种方式,如果权重是根据您的第一个方程式计算的,则权重较大时会对非突出问题产生影响,因此对角色之间的总体距离的影响较小。还要注意的是,在此版本中,我们隐式地假设仓位之间不存在相关协方差,这是一个相当有力的主张。

现在集中讨论问题2:在应用程序中,我刚刚描述了关于传递性偏好结构等的博弈论假设中权重和距离的理由。最终,这些是这种方式“合适”地计算距离的唯一原因。没有它们,我们只会得到一堆服从三角形不等式的数字。

权重作为隐式度量

关于协方差主题,假设您实际上已经测量了许多相似的事物,那么将您的问题视为识别距离在其中有意义的相关子空间之一可能会有所帮助。测量模型(例如因子分析)将通过加权组合将所有内容投影到可以计算距离的公共空间中。但是,同样,我们必须知道您的研究背景才能说出这是否有意义。


感谢您提供宝贵的信息。但我对如何计算权重感到担忧?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.