具有许多零值的时间序列分析


19

这个问题实际上是关于火灾探测的,但是它与某些放射性衰变探测问题非常相似。观察到的现象既是零星的,也是高度可变的;因此,时间序列将由被可变值中断的零个长字符串组成。

目的不仅是捕获事件(零中断),而且是事件本身的定量表征。但是,传感器受到限制,因此即使“真实性”为非零,有时也会记录为零。因此,比较传感器时必须包括零。

传感器B可能比传感器A更为敏感,我希望能够从统计角度进行描述。对于此分析,我没有“真相”,但是我有一个独立于传感器A&B的传感器C。因此,我的期望是A / B与C之间更好的协议表示与“真相”的更好协议。(这似乎有些不稳定,但您必须相信我-根据其他有关传感器的研究,我在这里站稳了脚跟)。

因此,问题在于如何量化“时间序列的更好一致性”。相关性是显而易见的选择,但是会受到所有这些零(不能遗漏)的影响,当然也会受到最大值的不成比例的影响。也可以计算RMSE,但在接近零的情况下,RMSE的权重将强于传感器的行为。

问题1:将对数缩放应用于非零值然后在时序分析中与零组合的最佳方法是什么?

问题2:对于这种类型的时间序列分析,您可以推荐哪些“最佳实践”,其中非零值的行为是重点,但是零值占主导地位并且不能被排除?

Answers:


11

重申您的问题“分析师如何应对长期无需求且无特定模式的需求?”

您的问题的答案是间歇性需求分析或稀疏数据分析。这通常在相对于非零数有“零个数”时出现。问题是有两个随机变量;事件之间的时间与事件的预期大小。就像您说的那样,由于零序列错误地增强了acf,所以整个读数集的自相关(acf)毫无意义。您可以使用诸如“克罗斯顿方法”之类的线程,该线程是基于模型的过程,而不是基于数据的过程。克罗斯顿的方法容易受到异常率和需求率变化/趋势/水平变化的影响,即需求除以需求数量最严格的方法可能是追求“稀疏数据-不等距数据”或类似的搜索。OSU的Ramesh Sharda教授向我提出了一个相当巧妙的解决方案,我在咨询实践中已经使用了很多年。如果一个系列中有发生销售的时间点,而有较长时间没有销售的时间,则可以通过将观察到的销售量除以无销售的时期数,将销售转换为每个期间的销售,从而获得比率。这样就可以确定价格和销售之间的间隔的模型,最终达到预测的价格和预测的间隔。您可以在autobox.com和Google“间歇性需求”中找到有关此问题的更多信息 如果一个系列中有发生销售的时间点,而有较长时间没有销售的时间,则可以通过将观察到的销售量除以无销售的时期数,将销售转换为每个期间的销售,从而获得比率。这样就可以确定价格和销售之间的间隔的模型,最终达到预测的价格和预测的间隔。您可以在autobox.com和Google“间歇性需求”中找到有关此问题的更多信息 如果一个系列中有发生销售的时间点,而有较长时间没有销售的时间,则可以通过将观察到的销售量除以无销售的时期数,将销售转换为每个期间的销售,从而获得比率。这样就可以确定价格和销售之间的间隔的模型,最终达到预测的价格和预测的间隔。您可以在autobox.com和Google“间歇性需求”中找到有关此问题的更多信息


1
我有一个间歇性需求预测的问题。我被要求解决。我知道有一些特定于这次预测的软件,但它们并非免费。您能否告诉我是否知道开源软件(例如R)中的任何内置函数来解决此问题?我一直在搜索,但到目前为止找不到...谢谢!
阿苏

1
@assu:我不知道可以满足您需求的任何免费软件。
IrishStat

4
@assu。R croston()中的forecast软件包中的函数将实现Croston的方法来预测间歇性需求数据。
罗布·海德曼
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.