比较发生率


9

我想比较两组之间的发生率(一组没有疾病,一组有疾病)。

我打算计算发病率比率(IRR),即发病率组B /发病率组A,然后测试该比率是否等于1,最后计算IRR的95%CI间隔。

我在书中找到了一种计算95%CI的方法(Rosner's Fundamentals of Biostatistics):

exp[log(IRR)±1.96(1/a1)+(1/a2)]

其中,和是事件数。但是,这种近似值仅适用于足够大的样本量,我认为事件的数量很小(也许对于总体比较来说还可以)。a1a2

所以我认为我应该使用另一种方法。

我使用R和extraci包,发现可以使用poisson.test()。但是此函数有3种方法来定义两个侧面的p值:中心,minlike和blaker。

所以我的问题是:

  1. 使用比较泊松率的检验比较两个发生率比率im是否正确?

  2. 在使用来自确切代码包的R中的poisson.test函数时,哪种方法最好?

小品exactci说:

中心:是上面由1限定的单侧p值的最小值的2倍。名称“中心”是由相关的反转条件间隔(即中心间隔)引起的,即,它们保证真实参数小于小于(大于)100(1-)%置信区间的下(上)尾的概率。这被Hirji(2006)称为TST(较小尾法的两倍)。α/2α

minlike:是可能性小于或等于观察到的可能性的结果概率之和。这被Hirji(2006)称为PB(基于概率)方法。

blaker:将观察到的较小尾巴的概率与相对尾巴的最小概率(不超过观察到的尾巴概率)相结合。Blaker(2000)提出了“ blaker”这个名字,该名字全面研究了有关置信区间的相关方法。这被Hirji(2006)称为CT(组合尾巴)方法。

我的数据是:

Group A: 
Age group 1: 3 cases    in 10459 person yrs.   Incidence rate: 0.29 
Age group 2: 7 cases    in 2279 person yrs.    Incidence rate: 3.07
Age group 3: 4 cases    in 1990 person yrs.    Incidence rate: 2.01
Age group 4: 9 cases    in 1618 person yrs.    Incidence rate: 5.56
Age group 5: 11 cases   in 1357 person yrs.    Incidence rate: 8.11
Age group 6: 11 cases   in 1090 person yrs.    Incidence rate: 10.09
Age group 7: 9 cases    in 819 person yrs.     Incidence rate: 10.99
  Total:    54 cases in 19612 person yrs.      Incidence rate: 2.75

Group B: 
Age group 1: 3 cases    in 3088 person yrs.   Incidence rate: 0.97 
Age group 2: 1 cases    in 707 person yrs.    Incidence rate: 1.41
Age group 3: 2 cases    in 630 person yrs.    Incidence rate: 3.17
Age group 4: 6 cases    in 441 person yrs.    Incidence rate: 13.59
Age group 5: 10 cases   in 365 person yrs.    Incidence rate: 27.4
Age group 6: 6 cases   in 249 person yrs.    Incidence rate: 24.06
Age group 7: 0 cases    in 116 person yrs.     Incidence rate: 0
  Total:    28 cases in 5597 person yrs.      Incidence rate: 5.0

Answers:


2

一些想法:

首先,您建议的比较-A和B之间的发生率之比-目前不以任何协变量为条件。这意味着,对于A组来说,您的事件数是54,对于B组来说,则是28。这与通常的基于大样本的置信区间方法相比绰绰有余。

其次,即使您打算针对年龄的影响进行调整,而不是计算每个组的比率,也可以使用回归方法更好地为您服务。通常,如果要对变量的多个层次进行分层,则与回归方程相比,它将变得相当麻烦,因为回归方程将为您提供在控制年龄的同时A与B的比率。我相信标准方法仍然适用于您的样本量,尽管如果您担心它,可以使用glmperm之类的方法


1

数据中每组的发生率只是独立的伯努利(0/1)变量之和的平均值-每个患者都有其自己的变量,其值为0或1,将它们加总并取平均值,即是发生率。

如果样本很大(样本很大),则均值将呈正态分布,因此您可以使用简单的z检验来测试两个比率是否不同。

在R中,看看prop.test:http ://stat.ethz.ch/R-manual/R-patched/library/stats/html/prop.test.html

如果您想充分利用数据,请尝试查看A组和B组之间的发病率分布是否不同。为此,独立性测试可能会成功,例如G的卡方-test:http : //udel.edu/~mcdonald/statchiind.html


0

确保样本足够大的唯一方法(或者如查理·盖尔(Charlie Geyer所言)-您实际上处于渐近状态)是进行大量的蒙特卡洛模拟,或者如EpiGard建议使用glmperm这样的方法。

至于哪种方法最好的精确度,这里没有最好的方法-或费舍尔曾经说过

最适合什么?

迈克尔·费伊(Michael Fay)在此提供了一些说明

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.