我正在glmer
为一些业务数据拟合随机效应模型。目的是分析分销商的销售业绩,并考虑到地区差异。我有以下变量:
distcode
:发行商ID,大约有800个级别region
:顶级地理ID(北,南,东,西)zone
:嵌套在中层地理区域内region
,总共约30个层级territory
:嵌套在zone
约150层中的低层地理
每个分销商仅在一个地区运营。棘手的部分是这是汇总数据,每个分发服务器只有一个数据点。因此,我有800个数据点,尽管有规律地尝试,但我试图(至少)容纳800个参数。
我已经安装了一个模型,如下所示:
glmer(ninv ~ 1 + (1|region/zone/territory) + (1|distcode), family=poisson)
尽管可以打印出注释,但运行没有问题:
随机效应的分组因子的级别数等于 n,即观察数
这是明智的做法吗?我得到了所有系数的有限估计,而且AIC也不是不合理的。如果我尝试使用带身份链接的泊松GLMM,则AIC会更糟,因此日志链接至少是一个不错的起点。
如果我绘制拟合值与响应的关系图,我得到的基本上是完美拟合,我猜这是因为每个分配器有一个数据点。那合理吗,还是我做的事完全愚蠢?
这正在使用一个月的数据。我可以获取多个月的数据并以这种方式进行一些复制,但是我必须添加新的术语来表示逐月的变化以及可能的交互作用,对吗?
ETA:我再次运行了上面的模型,但是没有family
参数(所以只是一个高斯LMM而不是GLMM)。现在lmer
给我以下错误:
(函数(fr,FL,start,REML,verbose)中的错误:用于随机效应的分组因子的数量级必须小于观察值的数量
因此,我想我做的事情不明智,因为改变家庭不会产生影响。但是现在的问题是,为什么它首先起作用?