我有一个重复测量实验,其中因变量是一个百分比,并且我有多个因素作为自变量。我想glmer
从R包中使用lme4
它(通过指定family=binomial
)作为逻辑回归问题,因为它似乎可以直接容纳此设置。
我的数据如下所示:
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
这是我希望合适的R命令:
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
问题是该命令抱怨我的因变量不是整数:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
对这些(试点)数据的分析给出了奇怪的答案。
我知道为什么这个binomial
家庭期望整数(是-没有计数),但是直接对百分比数据进行回归似乎应该可以。这该怎么做?
1
在我看来,这并不好,因为十分之五的信息与1000分之500的信息不同。将响应表示为否。“成功”和一项计数。“失败”。
—
Scortchi-恢复莫妮卡
@Scortchi谢谢,我想你可能是对的。我部分地在思考与这个问题类似的百分比(取自概率决策)的连续性质:stats.stackexchange.com/questions/77376/…但我相信我可以通过有意义地转换为整数来表达我的数据。
—
Dan Stowell