统计人员为什么不使用相互信息来衡量关联?


10

我看过一些非统计学家的谈话,他们似乎在使用互信息而不是回归(或等效/密切相关的统计检验)来重新发明相关度量。

我认为统计学家不采用这种方法是有充分理由的。我的外行人的理解是,熵/互信息的估计量往往有问题且不稳定。因此,我认为功能也是有问题的:他们声称自己没有使用参数测试框架来尝试解决此问题。通常,这种工作不会影响功效计算,甚至不会影响置信度/可信度区间。

但是,采取恶魔的拥护者立场,当数据集非常大时,慢速收敛是否有那么大的意义呢?同样,有时这些方法似乎在某种意义上是“有效的”,即关联性已通过后续研究验证。反对使用互信息来衡量关联的最佳批评是什么?为什么不将其广泛用于统计实践中?

编辑:此外,是否有涵盖这些问题的好论文?


3
MI是两个离散变量之间关联的度量。一般统计中的设置并不是很常见(可能在某些专门的子字段中)。但是在这种情况下,我看到它经常使用。当然,当我遇到在二元离散数据集上使用Pearson相关性的应用人员时,我会向他们指出MI。
2013年

1
另请参见stats.stackexchange.com/questions/1052/…但是,在我看来,此处的讨论已经很好,因此关于重复项的常见问题尚无定论。
Nick Cox


2
进一步的参考文献是Matthew Reimherr和Dan L. Nicolae。2013。关于量化依赖性:制定可解释性措施的框架。统计科学 28:116-130。
Nick Cox

Answers:


4

我认为您应该区分分类(离散)数据和连续数据。

对于连续数据,Pearson相关性测量线性(单调)关系,等级相关性为单调关系。

另一方面,MI“检测”任何关系。这通常不是您感兴趣的内容和/或可能是噪音。特别是,您必须估计分布的密度。但是,由于它是连续的,因此您首先要创建一个直方图[discrete bins],然后计算MI。但是由于MI允许任何关系,所以MI会随着您使用较小的垃圾箱而发生变化(即,您允许更多的摆动)。因此,您可以看到,MI的估计将非常不稳定,不允许您在估计等值上放置任何置信区间。 MI。

另一方面,分类数据非常适合MI框架(请参阅G检验),在G检验和卡方检验之间没有太多选择。


我主要是指离散关联的情况(通过回归,我想到的是GLM,而不仅仅是OLS)。实际上,许多研究复杂现象(例如遗传学)的科学家可能会说,他们对您正在描述的内容(检测任何关系)更感兴趣。逃避明显的常见批评的诱惑:“如果关联的功能形式错误,那该怎么办?我当然想发现任何关系!” 很强。但是,我认为这里有一个免费午餐的谬论,但是由于我试图更好地表达/理解,这将被忽略。
user4733 2013年

1
...虽然我不了解LR测试和MI之间的关系,但这很有趣!
user4733 2013年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.