我还有另一个关于时间序列的问题。
我有一个数据集,可以提供三年内精神病医院的暴力事件的每日记录。在上一个问题的帮助下,我一直在摆弄它,现在对此感到高兴。
我现在要知道的是,每日系列非常嘈杂。它从0时到20时上下波动剧烈。使用黄土图和预测软件包(我可以为像我这样的新手强烈推荐),我得到一条完全平坦的线,且预测的置信区间很大。
但是,每周或每月汇总数据更有意义。它们从系列开始时就开始下降,然后在中间再次上升。黄土图和预测包都产生了看起来更有意义的东西。
确实感觉有点像作弊。我是不是更喜欢聚合版本,因为它们看起来不错,没有任何实际有效性?
还是计算移动平均值并以此为基础会更好?恐怕我对所有这些背后的理论还不够了解,无法对可以接受的东西充满信心