我看到了一个回归模型,该模型正在回归滞后(12个月)的按年股票指数回报率,相同股票指数的按年回报率,信用利差(无风险债券和公司债券的月均值之差)收益率),同比通胀率和工业生产同比指数。
因此看起来(尽管在这种情况下,您可以替换印度的特定数据):
SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)
SP500YOY是SP500指数的按年回报。要计算此值,请计算SP500值的每月平均值,然后转换为每个月的按年回报(即Jan'10-Jan'11,Feb'10- 11月2日,3月10日至11月3日...)。在解释变量方面,SP500YOY的12个月滞后值与时间T处的CREDITSPREAD以及提前两个月的INFLATION和INDUSTRIALPRODUCTION一起使用。对于通货膨胀率是否高于阈值5.0%,INFLATIONASYMM是一个虚拟对象。括号中的索引显示每个变量的时间索引。
这是通过标准OLS线性回归估算的。要使用此模型预测SP500的同比1,2和3个月的同比回报,就必须对通货膨胀和工业生产指数产生3-4和5个月的提前预测。这些预测是在将ARIMA模型分别适合两个模型之后进行的。提前1,2和3个月的CreditSpread预测只是作为心理估计。
我想知道这种OLS线性回归是正确/不正确,有效/无效还是普遍有效的统计实践。
我看到的第一个问题是使用重叠数据。即,将股票指数的每日价值每月平均,然后用于计算按月结转的年收益。这应该使错误项自相关。我认为必须在以下其中一种情况下使用“更正”:
- 怀特的异方差一致性协方差估计器
- Newey&West异方差和自相关一致(HAC)估计量
- Hans&Hodrick的异方差一致版本
对这些重叠数据应用标准OLS线性回归(不进行任何校正)是否真的有意义,并且更进一步,使用3周期ARIMA提前预测值作为解释变量,以在原始OLS线性回归中预测SP500YOY?我以前从未见过这样的形式,因此,除非对重叠观察的使用进行校正,否则无法真正判断它。