使用时间序列分析来分析/预测暴力行为


13

这是一个很简单的问题,但是我对答案很感兴趣。我在精神病院工作,我有三年的数据,每天从每个病房收集有关该病房暴力程度的信息。

显然,适合这些数据的模型是时间序列模型。为了使它们更加正常,我不得不改变分数。我用差异数据拟合ARMA模型,而我认为最合适的模型是滞后2时具有一阶差分和一阶自相关的模型。

我的问题是,该模型到底可以用于什么?关于野兔数量和油价,时间序列在教科书中似乎总是非常有用,但是现在我已经做了我自己的研究,结果似乎是如此抽象以至于完全不透明。得分的差异在第二个滞后时彼此相关,但是我不能真正建议所有人在所有严重事件发生后的第二天都保持高度警惕。

可以吗


您可以将标题编辑为“使用时间序列分析来分析/预测暴力行为”吗?
保罗

1
我真的很喜欢这种类型的问题,我认为这种类型的精确实际问题将增加站点的兴趣。如果您有可能在数据中添加链接,或者告诉我们(作为帖子的补充),甚至更好,那么结论是什么呢。但是,我理解这可以机密...
罗宾吉拉德

我希望我能再次投票赞成,让您跳过有关随机变量定义的问题;)
罗宾吉拉德

我将再次告诉您结果是什么,但是要花很多时间,因为我正在与其他许多任务一起工作。不确定“传递有关随机变量的问题”是什么意思?您有没有建议我看的问题?
克里斯·比利

抱歉,如果我不清楚,我的意思是说我不喜欢像您这样的(个人主观意见)问题,而不是询问“什么是随机变量”的问题……但我想我的荣幸不是所有人的:)
罗宾吉拉德

Answers:


9

适合数据的模型不必是时间序列模型;我建议在框外思考一下。

如果您有多个变量(例如年龄,性别,饮食,种族,疾病,药物),则可以将其用于其他模型。也许将某些患者放在同一个房间是一个重要的预测指标?还是与参会人员有关?或者,如果您还有其他可以使用的变量,可以考虑使用多元时间序列模型(例如VECM)。看一下患者之间暴力之间的关系:某些患者会一起行动吗?

如果时间在行为中起着重要作用,则时间序列模型很有用。例如,可能会聚集暴力。查看波动率聚类文献。正如@Jonas所建议的,滞后阶数为2,在暴力事件爆发后的第二天,您可能需要提高警惕。但这并不能帮助您避免出现第一天的情况:您可以将其他信息链接到分析中,以实际了解暴力的起因,而不是以时间序列的方式进行简单地预测。

最后,作为技术建议:如果您使用R进行分析,则可以查看Rob Hyndman(此站点的创建者)提供的预测软件包。它具有许多非常好的功能。请参阅统计软件杂志上的论文“自动时间序列预测:R的预测软件包”


1
同意-只是在建模方面提出一些其他想法:逻辑分析以预测哪些患者将发生1次以上的暴力爆发,泊松(esque)回归分析可预测哪些患者将进行多次爆发,多级检查各个房间之间的差异和/还是病房...
Matt Parker 2010年

1
+1由于自相关问题,在时间序列上不使用线性模型等很容易被劝阻蒙蔽,而当LM,GLM等功能非常强大时,很容易陷入ARIMA,DLM等问题有点谨慎。
韦恩

6

您使模型适应了差异,这意味着您正在描述暴力程度的变化。您会滞后2天。滞后表示该进程的内存。换句话说,今天的暴力程度变化在一定程度上取决于最近两天的暴力程度变化。对于更长的时间尺度,随机影响的贡献变得足够强,因此不再存在明确的联系。

自相关为正吗?如今,暴力程度的变化表明两天内暴力程度也发生了类似的变化。是负面的吗?然后暴力可能会持续两天。

当然,您可能需要控制混淆效果。例如,在发生严重事件之后,人们可能更容易报告较小事件,但是这种“敏感”现象将在两天后消失。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.