计数数据选择的最“常用”分布是泊松分布。最常见的是使用其首次实际使用的示例进行说明:
拉迪斯劳斯·博特凯维奇(Ladislaus Bortkiewicz)在1898年提出了这一分配的实际应用,当时他的任务是调查普鲁士军队中因踢马意外丧生的士兵人数。该实验将Poisson分布引入了可靠性工程领域。
λλ
Ë(是| X,β)= λ = 经验值(β0+ β1个X1个+ ⋯ + βķXķ)
λ
将Poisson分布用于实际数据的问题在于,它假设均值等于方差。违反此假设的方法称为过度分散。在这种情况下,您始终可以使用拟泊松模型,非泊松对数线性模型(对于大量泊松可以通过正态分布进行近似),负二项式回归(与泊松密切相关;请参见Berk和MacDonald,2008年)或其他模型,如Stephan Kolassa所述。
对于泊松回归的一些友好介绍,您还可以查看Lavery(2010)或Coxe,West和Aiken(2009)的论文。
Lavery,R.(2010年)。动画指南:泊松回归简介。NESUG纸,sa04。
Coxe,S.,West,SG和Aiken,LS(2009)。计数数据分析:泊松回归及其替代方法的简要介绍。人格评估杂志,91(2),121-136。
Berk,R。和MacDonald,JM(2008)。过度分散和泊松回归。Journal of Quantitative Criminology,24(3),269-284。