具有时间不确定性的时间序列中事件的评估者间可靠性


13

我有多个独立的编码人员,他们试图确定时间序列中的事件-在这种情况下,观看面对面对话的视频并查找特定的非语言行为(例如,头点头),并对每个事件的时间和类别进行编码事件。可以将这些数据合理地视为具有高采样率(30帧/秒)的离散时间序列或连续时间序列,以较易处理的形式为准。

我想计算的互信度的一些措施,但我认为会有一些不确定性,当事件发生; 也就是说,例如,我希望一个编码器可以编码某个特定运动开始的时间比其他编码器认为的开始晚四分之一秒。这些是罕见的事件,如果有帮助的话;事件之间通常至少需要几秒钟(数百个视频帧)。

有没有一种评估评估者之间可靠性的好方法,可以同时考虑到这两种同意和不同意见:(1)评估者是否同意发生什么事件(如果有),以及(2)他们同意什么时候发生?第二点对我很重要,因为我有兴趣了解这些事件相对于对话中发生的其他事件的时机,例如人们所说的话。

我领域的标准做法似乎是将事情分成多个时间片,例如1/4秒左右,汇总每个编码器每个时间片报告的事件,然后计算科恩的kappa或类似的度量。但是切片持续时间的选择是临时的,我对事件时间的不确定性也不太了解。

到目前为止,我最好的想法是我可以计算某种可靠性曲线。像kappa一样,它是窗口大小的函数,在该窗口中,我认为两个事件在同一时间被编码。不过,我不太确定从那里去哪里。


看起来可以应用功能数据分析方法。您考虑过吗?
mpiktas,2010年

我曾考虑过功能数据分析,但这不是我非常熟悉的领域。我现在正在研究拉姆齐和西尔弗曼的书。但是我没有立即看到如何处理多项式结果变量...?

是否有用于这些测量的黄金标准(即,您知道感兴趣的事件何时发生)?这项研究包括多少位编码员?我们可以期待多少个不同的事件?
chl 2010年

Answers:


2

这里有几种思考的方法。

1个

A)您可以将每个完整的编码序列视为一组有序的事件(即[“头点头”,“头点头”,“头点头”,“眉毛抬起”]和[“头点头”,“头点头” ,“抬起眉毛”]),然后使用对您有意义的算法(http://en.wikipedia.org/wiki/Sequence_alignment)比对序列。然后,您可以计算整个序列的编码器间可靠性。

B)然后,再次使用对齐的序列,假设他们都观察到事件,则可以比较他们何时说事件发生。

2)或者,您可以将此模型建模为“隐马尔可夫模型”,并使用诸如Baumn-Welch算法之类的方法来推算在给定某些实际事件的情况下,每个编码器实际正确编码数据的概率。http://en.wikipedia.org/wiki/Baum-Welch_algorithm


这项技术似乎类似于Grafsgaard 2012为类似的发声任务所做的工作。
KevinL 2015年

0

与其将数据分割成任意片段,不如考虑实际的时差。编码器1报告时间和操作:

049 D
113 C
513 C
724 G

查看其他编码器最可靠的编码器的一种简单方法是给他一个分数,如下所示:

Add a point for each other coder that reported a D between (049-025) and (049+025)
Add a point for each other coder that reported a C between (113-025) and (113+025)
Add a point for each other coder that reported a C between (513-025) and (513+025)
Add a point for each other coder that reported a C between (724-025) and (724+025)
Subtract a point for each reported action.

如果亲密性对您很重要,请考虑以下替代方法:

Add 25/(Time_Thiscoder-Time_Othercoder)^2 points for each other coder that reported a matching observation.

有了所有可用的问题信息,以实际的方式实施该想法应该不难。


1
“ 25”来自哪里?您有参考资料还是可以解释证明该建议合理的理论?
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.