阳性和阴性预测值的统计检验


12

我读了一篇论文,看到一张桌子,上面有PPV(正预测值)和NPV(负预测值)之间的比较。他们为他们做了某种统计检验,这是表格的示意图:

PPV    NPV    p-value
65.9   100    < 0.00001
...

每行都引用一个特定的列联表。

他们做了什么样的假设检验?谢谢!

Answers:


17

假设像下面所示的交叉分类(此处为筛查工具)

替代文字

我们可以定义筛查准确性和预测能力的四种度量:

  • 灵敏度(se),a /(a + c),即在存在疾病的情况下筛查提供阳性结果的可能性;
  • 特异性(sp),d /(b + d),即在没有疾病的情况下筛查提供阴性结果的可能性;
  • 阳性预测值(PPV),a /(a + b),即测试结果阳性的患者被正确诊断(阳性)的概率;
  • 负预测值(NPV)d /(c + d),即测试结果阴性的患者被正确诊断(阴性)的概率。

每四个度量都是根据观测数据计算出的简单比例。因此,合适的统计检验应该是二项式(精确)检验,大多数统计软件包或许多在线计算器都应提供该检验。检验的假设是观察到的比例是否显着不同于0.5。但是,我发现提供置信区间而不是单次显着性检验更为有趣,因为它可以提供有关测量精度的信息。无论如何,为了重现显示的结果,您需要知道双向表的总边距(您只将PPV和NPV设置为%)。

例如,假设我们观察到以下数据(CAGE调查表是酒精筛查调查表):

替代文字

那么在R中,PPV将计算如下:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831 

如果您使用的是SAS,则可以查看使用说明24170:如何估算灵敏度,特异性,正负预测值,假正负概率和似然比?

要计算置信区间,请使用高斯近似(1.96是标准正态分布在或时的分位数,其中实际上是使用%),尤其是当比例很小或很大时(在此通常是这种情况)。 p=0.9751-α/2α=5p±1.96×p(1p)/np=0.9751α/2α=5

为了进一步参考,您可以查看

RG,纽科姆。单比例的双向置信区间:七种方法的比较医学统计学,17,857-872(1998)。


谢谢。好的,我在论文的开头就读到他们对所有类别变量都使用卡方检验。编写的分类表尤其不涉及变量,它是分类任务的输出。还不是很清楚!现在,我想他们对比例进行了经典测试。也许是卡方
Simone

我再次看了这个问题,发现p值既不引用PPV也不引用NPV,而是引用整个行。我认为他们进行的测试应该与整个应急表相关联。
西蒙妮

@Simone因此,如果我对您的理解正确,您建议作者提供PPV和NPV值,但给出与2x2表的全局关联测试相对应的p值?是否与最近的这个问题stats.stackexchange.com/questions/9464/…有关
chl

是的,p值是与PPV还是与NPV相关联,都将与该问题相关。在这种情况下,您给出了解决方案。该测试对应于整个2x2表,我永远不知道它是哪种测试!
西蒙妮

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.