如何解释p值的QQ图


17

我正在使用称为plink(http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml)的软件进行GWAS SNP疾病关联研究。

通过关联结果,我得到了所有已分析的SNP的p值。现在,我使用这些p值的QQ图显示一个非常低的p值是否与p值的预期分布(均匀分布)不同。如果p值偏离预期分布,则可以“将该” p值称为统计有效值。

正如您在QQ图中看到的那样,在顶部尾端,最后4点有点难以解释。灰色的最后两个点表明,这些p值位于p值的预期分布中,而其他两个则不在。

现在,如何解释这一点,最后两个点具有较低的 p值,但根据QQ-情节不是“显著”,而其他两个点有较高的 P值“显著”?这怎么可能是真的?

在此处输入图片说明


6
使用QQ图来解释GWAS的一个问题是p值彼此不独立,实际上,最极端的p值很可能相关。我猜想,您的前4个匹配可能位于同一条染色体上,并且彼此之间的距离足够接近,从而导致LD造成它们之间的相关性。如果您运行的测试以pNP值最低的SNP为第二最低p值,我想它的p值将落入非例外范围。其他许多明显的打击也可能发生同样的情况。
山姆·迪克森

3
我已经做到了,我修剪了SNP数据集以仅获取独立的SNP(使用0.8的r平方作为截止值)。此QQ图显示了独立SNP或LD <0.8中的SNP的结果。
eXpander 2014年

1
最低的SNP对应于6号染色体,第二对应于2号染色体,第三对应于5号染色体,第四对应于9号染色体,因此我不确定LD在这里是一个问题。
eXpander 2014年

1
我能问一下你是怎么做的吗?我可以得到类似的东西,但具有卡方值或p值,但没有灰色阴影,我需要一个具有p值和灰色阴影的东西。如果您可以共享使用的代码,那就太好了。谢谢。
Aleix Arnau

这 是针对此问题的经典论文,此文件为american.uio.no/tores/Publications_files /...。
kjetil b halvorsen

Answers:


5

关于p值图的分析的一个很好的参考是[1]。

您看到的结果可能是由信号/效果仅在某些测试子集中存在的事实驱动的。这些被驱动在接受范围之上。确实可以证明仅拒绝频带外的p值是合理的,但也许更重要的是,在选择选择过程(FWER,FDR)时,您应该决定要控制的误差标准是什么。您可以参考[2]进行选择,并在其中参考以选择适当的多重测试程序。

[1] Schweder,T.和E. Spjotvoll。“同时评估许多测试的P值图。” Biometrika 69,没有。3(1982年12月):493-502。doi:10.2307 / 2335984。

[2]罗森布拉特(Rosenblatt),乔纳森(Jonathan)。“多种测试错误率的从业人员指南。” ArXiv电子版。特拉维夫大学,2013年4月17日。http://arxiv.org/abs/1304.4920


1

这是一个比较老的问题,但是我发现它在尝试首次解释QQPlot时很有用。我以为我会补充这些答案,以防将来有更多人偶然发现此问题。

我发现有些棘手的问题是,这些要点到底是什么?我发现查看代码可以很容易地弄清楚。

这是我改编而成的R代码,该代码GWASTools::qqPlot在3行代码中实现了QQPlot:

simpleQQPlot = function (observedPValues) {
  plot(-log10(1:length(observedPValues)/length(observedPValues)), 
       -log10(sort(observedPValues)))
  abline(0, 1, col = "red")
}

这是一个例子。您有5个p值。simpleQQPlot将根据0和1之间的均匀分布生成5个对应的p值。它们将是:.2 .4 .6 .8和1。因此,simpleQQPlot期望您的最低p值约为0.2,而最高p值约为0.2 1. simpleQQPlot将对您的p值进行排序,并将每个p值与相应的生成值配对。因此,.2将与您的最低pvalue配对,1与您的最高pvalue配对,依此类推。然后,绘制这些配对值(取负对数后),其中X为生成的p值,Y为配对的观测值。如果您的观测值也从正态分布中拉出,则这些点应大致位于直线上。由于排序,这些点将始终单调增加。因此,每个后续点将具有更大的X和大于或等于的Y。

因此,在上面的原始示例中,第9,997个排序的p值约为5.2,但如果遵循正态分布,则预计约为4.1。(注意:我实际上不确定上面绘制了多少p值-我只是猜到了10k)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.