计算具有可变等级数的R中的等级间可靠性?


9

Wikipedia建议,查看评估者之间可靠性的一种方法是使用随机效应模型来计算类内相关性。类内相关的例子讨论了看

σα2σα2+σϵ2

从模型

Yij=μ+αi+ϵij

“其中Y ij i 组的 j 观测值,μ是未观察到的总体均值,αi是组i中所有值共享的未观察到的随机效应,而εij是未观察到的噪声项。”

这是一个有吸引力的模型,尤其是因为在我的数据中,没有任何评分者对所有事物进行了评分(尽管大多数人的评分为20+),并且事物的评分次数是可变的(通常为3-4)。

问题#0:在该示例中,“组i”(“组i”)是否是一组被评级的事物?

问题#1:如果我正在寻找评估者之间的可靠性,我是否不需要一个包含两个术语的随机效应模型,一个用于评估者,一个用于评估的事物?毕竟,两者都有可能发生变化。

问题2:如何最好地用R表达此模型?

这个问题似乎有一个不错的建议:

lmer(measurement ~ 1 + (1 | subject) + (1 | site), mydata)

我看了几个 问题,而lme的“ random”参数的语法对我来说是不透明的。我阅读了lme帮助页面,但是没有示例,我对“随机”的描述是难以理解的。

这个问题有点类似于一个 名单问题,与最接近的一次。但是,大多数都没有详细介绍R。


混合效果模型和随机效果模型在R中的编码方式相同。有关更多Tuto信息,请参见ncbi.nlm.nih.gov/pmc/articles/PMC3402032

Answers:


6

您在问题中引用的模型称为“单向模型”。假定随机行效应是唯一的方差系统性来源。在评估者之间具有可靠性的情况下,行对应于测量对象(例如,对象)。

单向模型:其中是所有对象的均值,是行效应,是残余效应。

xij=μ+ri+wij
μriwij

但是,也有“双向模式”。这些假设存在与随机行效应以及随机或固定列效应相关的方差。在评估者之间具有可靠性的情况下,列对应于度量来源(例如评估者)。

双向模型:其中是所有均值对象,是行效应,是列效应,是交互效应,是剩余效应。这两个模型之间的区别是交互作用的包含或排除。

xij=μ+ri+cj+rcij+eij
xij=μ+ri+cj+eij
μricjrcijeij

给定双向模型,您可以计算四个ICC系数之一:单分数一致性ICC(C,1),平均分数一致性ICC(C,k),单分数一致性ICC(A,1)或平均得分协议ICC(A,k)。单分数ICC适用于单个度量值 (例如,各个评估者),而平均分数ICC适用于平均度量值(例如,所有评估者的平均值)。一致性ICC将分母方差从分母方差中排除(例如,允许评估者按照自己的均值来变化),而一致性ICC将分母方差的列方差包括在分母方差中(例如,要求分摊者在同一均值附近变化)。xijx¯i

如果假设随机列效果,则为以下定义:

双向随机效应ICC定义(有无交互作用)

ICC(C,1)=σr2σr2+(σrc2+σe2) or σr2σr2+σe2
ICC(C,k)=σr2σr2+(σrc2+σe2)/k or σr2σr2+σe2/k
ICC(A,1)=σr2σr2+(σc2+σrc2+σe2) or σr2σr2+(σc2+σe2)
ICC(A,k)=σr2σr2+(σc2+σrc2+σe2)/k or σr2σr2+(σc2+σe2)/k

您也可以使用方差分析的均方值估算这些值:

双向ICC估算

ICC(C,1)=MSRMSEMSR+(k1)MSE
ICC(C,k)=MSRMSEMSR
ICC(A,1)=MSRMSEMSR+(k1)MSE+k/n(MSCMSE)
ICC(A,k)=MSRMSEMSR+(MSCMSE)/n

您可以使用irr包在R中计算这些系数:

icc(ratings, model = c("oneway", "twoway"),
type = c("consistency", "agreement"),
unit = c("single", "average"), r0 = 0, conf.level = 0.95)

参考文献

McGraw,KO和Wong,SP(1996)。关于一些类内相关系数的推论。心理方法,1(1),30-46。

Shrout,PE和Fleiss,JL(1979)。类内关联:用于评估评估者的可靠性。心理通报,86(2),420–428。


感谢您的出色回答!在R中icc中的双向模型中,我们如何表示每行评估者的随机选择?我的意思是,想象一下我们有100个评估人,每个主题都被5-10个评估。icc软件包可以处理这种情况吗?
michal's

每个评估者在提供给icc函数的矩阵中应有自己的列。否则,随机和混合效应模型的计算是相同的-主要区别在于解释(可以考虑结果的一般性)。
杰弗里·吉拉德

感谢您的回答!我正在尝试这样做,使单元格中的NA最多(只有很少的值具有每列的实际数字,其中特定的评估者对与行对应的主题进行了评分)。但是,在输出中,我得到一条文本,说没有记录任何主题(例如Subjects = 0 Ratingrs = 9)。也许这意味着无论在哪里找到至少一个NA,整个行都会被过滤掉?但是,我该如何表示评分者缺少评分呢?
michal's

可能是此特定icc功能的局限性。我有一个可以处理这种情况的MATLAB脚本。您碰巧可以访问MATLAB吗?
杰弗里·吉拉德

1
是的,请访问我的网站:mreliability.jmgirard.com
Jeffrey Girard
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.