Answers:
假设像下面所示的交叉分类(此处为筛查工具)
我们可以定义筛查准确性和预测能力的四种度量:
每四个度量都是根据观测数据计算出的简单比例。因此,合适的统计检验应该是二项式(精确)检验,大多数统计软件包或许多在线计算器都应提供该检验。检验的假设是观察到的比例是否显着不同于0.5。但是,我发现提供置信区间而不是单次显着性检验更为有趣,因为它可以提供有关测量精度的信息。无论如何,为了重现显示的结果,您需要知道双向表的总边距(您只将PPV和NPV设置为%)。
例如,假设我们观察到以下数据(CAGE调查表是酒精筛查调查表):
那么在R中,PPV将计算如下:
> binom.test(99, 142)
Exact binomial test
data: 99 and 142
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.6145213 0.7714116
sample estimates:
probability of success
0.6971831
如果您使用的是SAS,则可以查看使用说明24170:如何估算灵敏度,特异性,正负预测值,假正负概率和似然比?。
要计算置信区间,请使用高斯近似(1.96是标准正态分布在或时的分位数,其中实际上是使用%),尤其是当比例很小或很大时(在此通常是这种情况)。 p=0.9751-α/2α=5
为了进一步参考,您可以查看
RG,纽科姆。单比例的双向置信区间:七种方法的比较。 医学统计学,17,857-872(1998)。
请参见
Kosinski,AndrzejS。加权广义得分统计量,用于比较诊断测试的预测值。医学统计学(http://dx.doi.org/10.1002/sim.5587) 在线发布:2012年8月22日