为什么公式和R的fisher.test的优势比不同?应该选择哪一个?


14

在下面的例子中

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891 

我“手动”计算了优势比(#1),0.600;然后(#2)作为Fisher精确检验的输出之一0.616。

为什么我没有得到相同的价值?

为什么存在几种计算赔率的方法,以及如何选择最合适的方法?

Answers:


10

从帮助页面fisher.test()

请注意,使用的是条件最大似然估计(MLE),而不是无条件MLE(样本比值比)。


3

为了增加此处的讨论,有用的是询问在这种“有条件的”可能性中究竟要以什么为条件。Fisher检验与其他分类分析的不同之处在于,它认为表格的所有边距都是固定的,而逻辑回归模型(以及相应的Pearson卡方检验是逻辑模型的得分检验)仅考虑了一个边距是固定的。

然后,Fisher测试将超几何分布视为在4个单元中每个单元中观察到的计数的概率模型。超几何分布具有以下特点:由于始发优势比的分布不连续,因此您通常会获得不同的OR来作为最大似然估计。


2
我认为您的答案无法明确说明这种特殊可能性是如何产生的。例如,如果使用乘积二项式对数据生成过程进行建模,则以边际总数为条件得到的可能性(&MLE)与使用Wallenius的非中心超几何分布进行建模时得到的可能性不同-在这两种情况下,总计都是“被认为是固定的”。
Scortchi-恢复莫妮卡

1

要回答您的第二个问题,生物统计学家不是我的专长,但我相信多重比值统计的原因是要考虑抽样设计和实验设计。

我在这里找到了三个参考资料,它们将使您对为什么条件MLE与无条件的优势比以及其他类型为何有所区别有所了解。

  1. 固定边际的2×2表的组合中的优势比的点和区间估计

  2. 偏差对配对和分层样本相对风险估计量的影响

  3. 常见赔率的条件最大似然估计的比较研究


3
总结一下这些参考文献至少要说的是有用的。
Scortchi-恢复莫妮卡

@Scortchi,同意。我一直在忙于工作,只能阅读每页的第一页或第二页。我将在每个周末添加一个摘要。
乔恩

@Jon如果可以的话,添加简短摘要将很有用
Glen_b-恢复莫妮卡(Monica)

@Jon我只问了一个问题。是bli在我发布原始问题4年后添加了第二个问题。当您提到第二个问题时,我不会改变bli令人讨厌的编辑,但是我不确定如何再接受答案。
winerd
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.