Answers:
是的,theta
是负二项式分布的形状参数,否,您不能真正将其解释为偏度的度量。更确切地说:
theta
,但也取决于均值theta
将保证您没有偏斜如果我不搞砸的话,在负二项式回归中使用的mu
/ theta
参数化中,偏度为
在这种情况下,通常将解释为相对于泊松分布的过度分散的度量。负二项式的方差是μ + μ 2 / θ,所以θ真正控制过量变性相比泊松(这将是μ),并没有歪斜。
我的一位学生在“ 建模计数数据”课程中将我转介到此站点。关于负二项式模型,尤其是关于色散统计量和色散参数,似乎存在很多误导。
弥散统计量是皮尔逊统计量除以残余自由度,它表示计数模型的超分散性。是位置或形状参数。对于计数模型,比例参数设置为1。R 和θ是离散参数或辅助参数。我在本书第一版《负二项式回归》(2007年,剑桥大学出版社)中将其称为异质性参数,但在2011年第二版中将其称为弥散参数。我在即将出版的即将出版的《建模计数数据(剑桥)》一书中对NB模型中的各个术语给出了完整的理由。它应该在7月15日之前出售(平装)。 glm
glm.nb
glm.nb
并且glm
在定义色散参数的方式上很不寻常。方差被给定为,而不是μ+αμ2,这是直接参数化。这是在SAS,Stata,Limdep,SPSS,Matlab,Genstat,Xplore和大多数所有软件中对NB建模的方式。将结果与其他软件结果进行比较时,请记住这一点。作者(来自S-plus)和glm.nb
glm
glm.nb
显然是从McCullagh&Nelder那里获得的间接关系,但是Nelder(他是1972年GLM的联合创始人)在1993年将他的kk system附加组件写到Genstat上,他认为直接关系是首选。从1993年初到他去世前,他和他的妻子过去每两年一次在亚利桑那州探访我和我的家人。我们已经进行了非常彻底的讨论,因为我已经将1992年后期为Stata和Xplore软件以及1994年为SAS宏编写的glm程序与直接关系纳入了该程序。
CRAN上msme软件包中的nbinomial
函数允许用户使用直接(默认)或间接(作为选项,复制glm.nb)参数化,并提供Pearson统计信息和残差输出。输出还显示色散统计量,并允许用户参数化α(或θ),从而给出色散的参数估计。这使您可以评估哪些预测变量会增加模型的额外离散度。这种类型的模型通常称为异质负二项式。在新书问世之前,我将把该函数放入COUNT包中,以及一些新的图形函数和脚本。 nbinomial