生物标志物研究的功效计算/样本量


13

我们有一个潜在的生物标志物,可以预测患者是否患有癌症。生物标志物测试结果为二进制为阳性或阴性。我们希望对需要测试的患者数量有所了解,以确定该生物标记物是否是良好的预测指标。

通过在互联网上阅读,似乎要走的路是看灵敏度(对于病例数)和特异性(对于对照数)。建议您将这种情况视为单样本比例测试,但仍不清楚如何估算灵敏度以及准备除的范围。如果说我认为灵敏度高于0.8的任何生物标记物都为“良好”,您将如何设置这两个变量?我希望我的零假设是生物标记,并不比随机分配好,即灵敏度为0.5。任何人都可以举例说明执行此操作的最佳方法(尤其是在R中)。


您是说要从一组已知病例开始,然后执行生物标志物测试(收集数据)并估算敏感性吗?然后您将从一组已知的控件开始,收集数据并估算特异性?

对于有效的计算,是。实际上,在招募患者之前我们不会知道,但是会一直招募直到有足够的病例和控制措施。另外,我们有一个病人可能患病的估计比率,因此我们可以用它来估计我们需要招募的总数,
danielsbrewer 2012年

如果生物标记仅给出是/否答案,那么您可能会选择敏感性/特异性,并在上下文中进行比例测试计划。其中一个的值是“好”还是“坏”取决于错误决定的现实生活后果。如果生物标志物最初进行连续测量,则ROC曲线和AUC统计以及相应的样本量计划方法可能更合适。但这一切都只是刮擦了与诊断测试有关的方法的表面……
psj 2012年

Answers:


11

p

nxxppp^=x/np^p

np=0.5np=0.57α=0.05

至少有两种方法-分析和模拟。中的pwr软件包R已存在以帮助进行此设计-您需要先安装它。接下来,您需要一个效果大小,然后您想要的功能是pwr.p.test

library(pwr)
h1 <- ES.h(0.57, 0.5)
pwr.p.test(h = h1, n = NULL, sig.level = 0.05, power = 0.9, alt = "greater")

     proportion power calculation for binomial distribution (arc... 

              h = 0.1404614
              n = 434.0651
      sig.level = 0.05
          power = 0.9
    alternative = greater

4350.570.900.050.57

一旦获得数据,运行测试的方法就是(为了争辩,我将模拟数据)。

n <- 435
sens <- 0.57
x <- rbinom(n, size = 1, prob = sens)
binom.test(sum(x), n, p = 0.5, alt = "greater")

    Exact binomial test

data:  sum(x) and n 
number of successes = 247, number of trials = 435,
p-value = 0.002681
alternative hypothesis: true probability of success is greater than 0.5 
95 percent confidence interval:
 0.527342 1.000000 
sample estimates:
probability of success 
             0.5678161 

0.568p[0.527,1]

编辑:如果您更喜欢模拟方法,则可以通过以下方式进行:设置

n <- 435
sens <- 0.57
nSim <- 1000

runTest

runTest <- function(){
  x <- rbinom(1, size = n, prob = sens)
  tmp <- binom.test(x, n, p = 0.5, alt = "greater")
  tmp$p.value < 0.05
}

所以功率的估计是

mean(replicate(nSim, runTest()))
[1] 0.887
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.