市场间分析是一种通过查找不同市场之间的关系来对市场行为建模的方法。通常,会计算两个市场之间的相关性,比如说标准普尔500和30年期美国国债。这些计算通常不是基于价格数据,这对每个人来说都是显而易见的,它不符合固定时间序列的定义。
除了可能的解决方案(改为使用收益)以外,相关性计算(其数据是非平稳的)甚至是有效的统计计算吗?
您是否会说这样的相关性计算有些不可靠,或者只是胡说八道?
市场间分析是一种通过查找不同市场之间的关系来对市场行为建模的方法。通常,会计算两个市场之间的相关性,比如说标准普尔500和30年期美国国债。这些计算通常不是基于价格数据,这对每个人来说都是显而易见的,它不符合固定时间序列的定义。
除了可能的解决方案(改为使用收益)以外,相关性计算(其数据是非平稳的)甚至是有效的统计计算吗?
您是否会说这样的相关性计算有些不可靠,或者只是胡说八道?
Answers:
相关性测量线性关系。在非正式场合,关系意味着稳定。当我们计算平稳变量的样本相关性并增加可用数据点的数量时,该样本相关性趋向于真正相关。
可以证明,对于通常是随机游走的价格,样本相关性倾向于随机变量。这意味着无论我们拥有多少数据,结果总是会有所不同。
请注意,我尝试表达没有数学的数学直觉。从数学的角度来看,这种解释非常清楚:平稳过程的样本矩以概率收敛为常数。随机游动的样本矩收敛到布朗运动积分,这是随机变量。由于关系通常表示为数字而不是随机变量,因此不计算非平稳变量的相关性的原因变得显而易见。
更新由于我们对两个变量之间的相关性感兴趣,因此首先假设它们来自平稳过程。平稳性意味着和不依赖于。所以相关E Z t c o v (Z t,Z t - h)t
也不依赖于,因为公式中的所有量都来自不依赖于矩阵。所以样本相关性的计算c o v (Z t)t
ρ=Çø- [R[R (X吨,ÿ吨)ρ→交通ρŤ→交通∞√
现在假设不平稳。然后,可能取决于。因此,当我们观察大小为的样本时,我们可能需要估计不同的相关性。当然这是不可行的,因此在最佳情况下,我们只能估计某些功能,例如均值或方差。但是结果可能没有明智的解释。 Ç ø - [R [R (X 吨,ÿ 吨)吨Ť Ť ρ 吨ρ 吨
现在,让我们检查一下可能研究最多的非平稳过程随机游动的相关性会发生什么。如果,过程称为随机游走,其中是平稳过程。为了简单起见,假设。然后Z t = ∑ t s = 1(U t,V t)C t = (U t,V t)E C t = 0
为了进一步简化问题,假设是白噪声。这意味着,对于,所有相关均为零。请注意,这并不将限制为零。E (C t C t + h)h > 0 c o r r (U t,V t)
然后
到目前为止,尽管过程还不稳定,但相关性还是有意义的,尽管我们必须做出相同的限制性假设。
现在,要查看样本相关性发生了什么,我们将需要使用以下有关随机游动的事实,称为函数中心极限定理:
š∈[0,1]w ^小号=(w ^1级小号,w ^2个小号)中号小号=(M1s,M2s)=(
再次为简单起见,让我们将样本相关性定义为
让我们从差异开始。我们有
随着增加,它达到无穷大,因此我们遇到了第一个问题,样本方差不会收敛。另一方面, 连续映射定理和泛函中心极限定理给我们提供了
Ť→交通∞
同样,我们得到
1
最后,对于随机游走的样本相关性,我们得到
Ť→交通∞
因此,尽管相关性得到了很好的定义,但样本相关性并未像固定过程中那样趋向于收敛。相反,它收敛到某个随机变量。
...其相关数据不稳定的相关性计算甚至是有效的统计计算吗?
令为离散的随机游动。选择一个正数。如果定义过程和,则,,否则;和。换句话说,开始时与相同,但是每次超过,它就会切换符号(否则在所有方面都模拟)。h P V P (0 )= 1 P (t + 1 )= − P (t )V (t )> h P (t + 1 )= P (t )V (t )= P (t )W (t )V W V h W
(在该图中(对于)为蓝色,为红色。符号中有四个开关。)w ^ V
实际上,在短时间内,倾向于与完全相关或与完全反相关。但是,使用相关函数来描述和之间的关系将无济于事(这个词比“不可靠”或“胡说八道”更能抓住问题的发生)。W V W
Mathematica代码产生图:
With[{h=5},
pv[{p_, v_}, w_] := With[{q=If[v > h, -p, p]}, {q, q w}];
w = Accumulate[RandomInteger[{-1,1}, 25 h^2]];
{p,v} = FoldList[pv, {1,0}, w] // Transpose;
ListPlot[{w,v}, Joined->True]]