Google趋势返回每周数据,因此我必须找到一种将它们与我的每日/每月数据合并的方法。
到目前为止,我所做的就是将每个系列分解为每日数据,例如:
从:
2013-03-03-2013-03-09 37
至:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
但这给我的问题增加了很多复杂性。我试图根据最近6个月的值或每月数据中的6个值来预测Google搜索。每日数据意味着需要对180个过去的值进行处理。(我有10年的数据,因此每月数据为120点/每周数据为500 + /每日数据为3500+)
另一种方法是将每日数据“合并”到每周/每月数据中。但是这个过程引起了一些问题。可以对某些数据求平均,因为它们的总和代表某些东西。例如,降雨,一周中的降雨量将等于构成一周的每一天的降雨量之和。
就我而言,我正在处理价格,财务汇率等问题。对于价格,在我的领域中通常会考虑交易量,因此每周数据将是加权平均值。对于财务费率来说,它要复杂一些,其中涉及一些公式来从每日费率中建立每周费率。对于其他事情,我不知道基础属性。我认为这些属性对于避免无意义的指标非常重要(例如,平均财务利率是无稽之谈)。
所以三个问题:
对于已知和未知的属性,我应该如何处理从每日到每周/每月的数据?
我觉得像每周一样将每周/每月数据分解为每日数据有点不对劲,因为我介绍的是现实生活中没有意义的数量。所以几乎是相同的问题:
对于已知和未知的属性,我应该如何从每周/每月变为每日数据?
最后但并非最不重要的一点:给定两个具有不同时间步长的时间序列时,哪个更好:使用最低或最大时间步长?我认为这是数据数量和模型复杂性之间的折衷,但是我看不出有任何强有力的论据可供选择。
编辑:如果您知道一个工具(在R Python甚至Excel中)很容易做到,将不胜感激。