应该使用哪种统计检验来检验基因清单的丰富性?


10

我进行了一项实验,以测试细胞对某种DNA损伤剂的敏感性。我们发现了270个对药物特别敏感的基因,分析的基因总数为3668。在270个敏感基因中,有38个被归类为“ DNA修复基因”。如果基因组中包含“ DNA修复基因”的数目为112,而基因组中的基因总数为3668,那么敏感基因是否富含DNA修复基因?应该使用哪种统计检验?如果您还可以告诉我一些在线计算p值的工具,我们将不胜感激。

Answers:


17

测试基因列表富集的标准做法是进行超几何测试或等效的单面Fisher精确测试。你有以下2×2 列联表:

DNA RepairOtherSensitive38232270Not Sensitive74332433981123556

您可以R按以下方式进行测试:

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

这给出了非常重要的结果:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

请注意,当我们测试过度展示(而非过度展示)时,alternative参数设置为"greater"


1
非常感谢您的回答。我也认为Fisher精确检验可能是一种很好的分析方法。我也没有任何统计软件来执行我也想测试的其他功能类的结果。您是否知道任何“在线”工具来获取带有所有小数位的p值?
劳拉

1
您可以免费下载R。请参阅r-project.org。因此,没有软件可以解决(并且认为您需要一种在线计算方法是不正确的)。但是,请进行一些搜索以自己找出这些问题。请参阅stats.stackexchange.com/help/how-to-ask上的建议来询问一个好问题。
Nick Cox 2013年

@Nick您的建议很好,但是请不要将其用作张贴者的特征:这样的措词很容易被误解为攻击,我对此表示怀疑。因此,我在您的评论中删除了初步短语(该短语未添加任何信息)。
ub

一个很棒的在线工具是:mathcelebrity.com/fishers_exact_test.php

您能否另外说明一下,确切表示正在计算的内容过多?
sdgaw erzswer
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.