Questions tagged «autocorrelation»

自相关(串行相关)是一系列数据与自身之间的滞后关系。这是时间序列分析中的重要主题。

3
ARMA(2,1)过程的自协方差
我需要为ARMA(2,1)进程的自协方差函数导出解析表达式,γ(k)γ(k)\gamma\left(k\right)表示为: yt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵtyt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵty_t=\phi_1y_{t-1}+\phi_2y_{t-2}+\theta_1\epsilon_{t-1}+\epsilon_t 因此,我知道: γ(k)=E[yt,yt−k]γ(k)=E[yt,yt−k]\gamma\left(k\right) = \mathrm{E}\left[y_t,y_{t-k}\right] 所以我可以写: γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]\gamma\left(k\right) = \phi_1 \mathrm{E}\left[y_{t-1}y_{t-k}\right]+\phi_2 \mathrm{E}\left[y_{t-2}y_{t-k}\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_{t-k}\right]+\mathrm{E}\left[\epsilon_{t}y_{t-k}\right] 然后,要导出自协方差函数的解析版本,我需要替换kkk -0、1、2 ...的值,直到获得对大于某个整数的所有有效的递归kkk。 因此,我将k=0k=0k=0并通过计算得出: γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt]γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt] \gamma \left(0\right) = \mathrm{E}\left[y_t,y_t\right] = \phi_1 \mathrm{E}\left[y_{t-1}y_t\right] + \phi_2 \mathrm{E}\left[y_{t-2}y_t\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_t\right]+\mathrm{E}\left[\epsilon_ty_t\right]\\ 现在,我可以简化这些术语的前两个,然后像以前一样替换:ytyty_t γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)] \gamma\left(0\right) = \phi_1 \gamma\left(1\right) + \phi_2 \gamma\left(2\right)\\ + \theta_1 \mathrm{E}\left[\epsilon_{t-1} \left(\phi_1 y_{t-1} +\phi_2 y_{t-2} +\theta_1 \epsilon_{t-1} + \epsilon_t \right)\right]\\ …

2
自相关如何处理?
为此,我有相当深的数学背景,但是我从未真正涉及过时间序列或统计建模。所以你不必对我很温柔:) 我正在阅读有关对商业建筑中的能源使用进行建模的论文,作者提出了这一主张: [出现自相关的出现]是因为该模型是根据能源使用的时间序列数据开发的,该数据固有地是自相关的。时间序列数据的任何纯确定性模型都将具有自相关。如果在模型中包含[更多傅里叶系数],则会发现自相关会降低。但是,在大多数情况下,傅立叶模型的CV较低。因此,该模型对于实际用途而言可能是可以接受的,但实际上并不需要很高的精度。 0.)“时间序列数据的任何纯确定性模型将具有自相关”是什么意思?我可以模糊地理解这是什么意思,例如,如果您有0个自相关,那么您如何期望预测时间序列中的下一个点?可以肯定,这不是一个数学论点,这就是为什么它是0的原因:) 1.)我的印象是自相关基本上杀死了您的模型,但考虑到这一点,我不明白为什么会这样。那么,自相关为什么不好(或好)呢? 2.)我听到的关于自相关的解决方案是区分时间序列。如果没有尝试读取笔者的脑海,为什么一个没有,如果不可忽略的自相关存在做一个差异? 3.)不可忽略的自相关对模型有哪些限制?这是某个假设吗(即使用简单线性回归建模时的正态分布残差)? 无论如何,如果这些是基本问题,我们深表歉意,并在此先感谢您的帮助。

1
线性回归与空间自相关
我想使用通过遥感获得的一些变量来预测某个地区的树高。像近似生物量,等等。我想首先使用线性回归(我知道这不是最好的主意,但这对我的项目来说是必不可少的步骤)。我想知道空间自相关对它的影响有多严重,如果可能的话,最简单的纠正方法是什么。顺便说一下,我正在R中做所有事情。

1
重叠数据的时间序列回归
我看到了一个回归模型,该模型正在回归滞后(12个月)的按年股票指数回报率,相同股票指数的按年回报率,信用利差(无风险债券和公司债券的月均值之差)收益率),同比通胀率和工业生产同比指数。 因此看起来(尽管在这种情况下,您可以替换印度的特定数据): SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) + b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2) SP500YOY是SP500指数的按年回报。要计算此值,请计算SP500值的每月平均值,然后转换为每个月的按年回报(即Jan'10-Jan'11,Feb'10- 11月2日,3月10日至11月3日...)。在解释变量方面,SP500YOY的12个月滞后值与时间T处的CREDITSPREAD以及提前两个月的INFLATION和INDUSTRIALPRODUCTION一起使用。对于通货膨胀率是否高于阈值5.0%,INFLATIONASYMM是一个虚拟对象。括号中的索引显示每个变量的时间索引。 这是通过标准OLS线性回归估算的。要使用此模型预测SP500的同比1,2和3个月的同比回报,就必须对通货膨胀和工业生产指数产生3-4和5个月的提前预测。这些预测是在将ARIMA模型分别适合两个模型之后进行的。提前1,2和3个月的CreditSpread预测只是作为心理估计。 我想知道这种OLS线性回归是正确/不正确,有效/无效还是普遍有效的统计实践。 我看到的第一个问题是使用重叠数据。即,将股票指数的每日价值每月平均,然后用于计算按月结转的年收益。这应该使错误项自相关。我认为必须在以下其中一种情况下使用“更正”: 怀特的异方差一致性协方差估计器 Newey&West异方差和自相关一致(HAC)估计量 Hans&Hodrick的异方差一致版本 对这些重叠数据应用标准OLS线性回归(不进行任何校正)是否真的有意义,并且更进一步,使用3周期ARIMA提前预测值作为解释变量,以在原始OLS线性回归中预测SP500YOY?我以前从未见过这样的形式,因此,除非对重叠观察的使用进行校正,否则无法真正判断它。

1
在R中没有lm对象的情况下计算Newey-West标准误差
我昨天在StackOverflow上问了这个问题,并得到了答案,但我们同意,它似乎有点骇人听闻,并且也许有一种更好的方法来查看它。 问题:我想计算向量(在本例中为股票收益向量)的Newey-West(HAC)标准误差。该功能NeweyWest()在sandwich包这样做,但需要一个lm对象作为输入。Joris Meys提供的解决方案是将向量投影到1上,这会将我的向量转换为残差并馈入NeweyWest()。那是: as.numeric(NeweyWest(lm(rnorm(100) ~ 1))) 均值的方差。 我应该这样吗?还是有一种方法可以更直接地做我想做的事情?谢谢!

3
残差自相关与滞后因变量
当对时间序列建模时,有可能(1)对误差项的相关结构进行建模,例如AR(1)过程(2)包括滞后因变量作为解释变量(在右侧) 我了解他们有时是选择(2)的重要理由。 但是,进行(1)或(2)或什至两者都进行的方法学原因是什么?

1
如何解释自相关
我已经根据鱼的位置:X(x.ts)和Y(y.ts)在时间序列数据上计算了鱼的运动模式的自相关。 通过使用R,我运行了以下函数并生成了以下图: acf(x.ts,100) acf(y.ts,100) 我的问题是,如何解释这些图?报告任何类型的模式都需要什么信息?我一直在浏览互联网,还没有找到一种有效的解释方式的简洁方法。 另外,您如何确定要使用的正确滞后量?我用了100,但我不确定这是否太多。

2
R vs.Excel中的自相关公式
我试图弄清楚R如何计算滞后k自相关(显然,它与Minitab和SAS使用的公式相同),以便可以将其与使用适用于该系列及其k滞后版本的Excel CORREL函数进行比较。R和Excel(使用CORREL)给出的自相关值略有不同。 我也想知道一种计算是否比另一种更正确。
13 r  sas  autocorrelation  excel 

1
如何为ACF函数计算置信区间?
例如,在R中,如果调用该acf()函数,则默认情况下会绘制相关图,并绘制95%的置信区间。查看代码,如果调用plot(acf_object, ci.type="white"),您将看到: qnorm((1 + ci)/2)/sqrt(x$n.used) 作为白噪声类型的上限。有人可以解释这种方法背后的理论吗?为什么我们得到的qnorm为1 + 0.95,然后除以2,然后除以观察数?

1
如何在MCMC中解释自相关图
通过阅读John K. Kruschke 的《做贝叶斯数据分析》一书,我也熟悉贝叶斯统计数据,该书也被称为“小狗书”。在第9章中,通过以下简单示例介绍了层次模型: 和伯努利观察是3枚硬币,每次10个翻转。一个显示9个头,另一个显示5个头,另一个显示1个头。yjiθjμκ∼Bernoulli(θj)∼Beta(μκ,(1−μ)κ)∼Beta(Aμ,Bμ)∼Gamma(Sκ,Rκ)yji∼Bernoulli(θj)θj∼Beta(μκ,(1−μ)κ)μ∼Beta(Aμ,Bμ)κ∼Gamma(Sκ,Rκ)\begin{align} y_{ji} &\sim {\rm Bernoulli}(\theta_j) \\ \theta_j &\sim {\rm Beta}(\mu\kappa, (1-\mu)\kappa) \\ \mu &\sim {\rm Beta}(A_\mu, B_\mu) \\ \kappa &\sim {\rm Gamma}(S_\kappa, R_\kappa) \end{align} 我已经使用pymc来推断超参数。 with pm.Model() as model: # define the mu = pm.Beta('mu', 2, 2) kappa = pm.Gamma('kappa', 1, 0.1) # define the prior …

1
是什么导致空间相关图中出现U形图案?
在我自己的工作中,我注意到在检查不同距离的空间相关图时会出现这种模式,在相关中出现了U形模式。更具体地,在小距离箱处的强正相关随距离而减小,然后在特定点到达凹坑,然后向上爬回。 这是来自自然生态保护博客“ 宏观生态游乐场”(3)–空间自相关的示例。 这些在更远距离上更强的正自相关理论上违反了Tobler的第一地理定律,因此我希望它是由数据中的其他某种模式引起的。我希望它们在某个距离处达到零,然后在更远的距离处徘徊在0左右(这在具有低阶AR或MA项的时间序列图中通常会发生)。 如果您执行Google图片搜索,则可以找到这种相同类型的图案的其他一些示例(另请参见此处)。在GIS站点的用户发布了两个例子,该模式出现莫兰的我,但不会出现Geary的C(1,2)。结合我自己的工作,这些模式对于原始数据是可观察到的,但是当使用空间项拟合模型并检查残差时,它们似乎不会持续存在。 我没有在时间序列分析中遇到过显示相似的ACF图的示例,因此我不确定原始数据中的哪种模式会导致这种情况。此评论中的Scortchi推测正弦曲线模式 可能是由于该时间序列中省略的季节性模式引起的。同一类型的空间趋势会在空间相关图中导致这种模式吗?还是相关性计算方式的其他人工产物? 这是我工作的一个例子。样本很大,浅灰色的线是原始数据的19个排列的集合,以生成参考分布(因此可以看到红线的变化预计会很小)。因此,尽管该图并不像第一个所示的那样戏剧性,但是在该图中很容易出现深坑,然后再上升。(还请注意,我的陷阱与其他示例一样不是负面的,如果这在本质上使示例有所不同,我不知道。) 这是数据的核密度图,以查看产生所述相关图的空间分布。

2
为什么在完全分散的点模式中,Moran的I不等于“ -1”
维基百科是错的...还是我听不懂? 维基百科:白色和黑色正方形(“象棋图案”)完全分散,因此莫兰的I为-1。如果将白色方块堆叠到板子的一半,将黑色方块堆叠到板子的另一半,则莫兰的I将接近+1。正方形颜色的随机排列将使Moran's I的值接近于0。 # Example data: x_coor<-rep(c(1:8), each=8) y_coor<-rep(c(1:8), length=64) my.values<-rep(c(1,0,1,0,1,0,1,0,0,1,0,1,0,1,0,1), length=64) rbPal <- colorRampPalette(c("darkorchid","darkorange")) my.Col <- rbPal(10)[as.numeric(cut(my.values,breaks = 10))] # plot the point pattern... plot(y_coor,x_coor,col = my.Col, pch=20, cex=8, xlim=c(0,9),ylim=c(0,9)) 如您所见,点完全分散 # Distance matrix my.dists <- as.matrix(dist(cbind(x_coor,y_coor))) # ...inversed distance matrix my.dists.inv <- 1/my.dists # diagonals are "0" diag(my.dists.inv) …


1
(熊猫)自相关图显示什么?
我是一个初学者,我想了解自相关图显示的内容。 我已经从不同来源(例如此页面或相关的Wikipedia页面)中阅读了一些解释,这里我不在此引用。 我有这个非常简单的代码,在那里我有我的索引日期一年和值简单地从0增加至365对每个指标。( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365) import numpy as np import pandas as pd from pandas.plotting import autocorrelation_plot import matplotlib.pyplot as plt dr = pd.date_range(start='1984-01-01', end='1984-12-31') df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"]) autocorrelation_plot(df) plt.show() 打印的图形将在哪里 我可以理解并查看为什么图形从以下位置1.00开始: 滞后为零的自相关始终等于1,因为这表示每个项与其自身之间的自相关。值和滞后为零的值将始终相同。 很好,但是为什么此图在滞后50时的值约为0.65?为什么会降到0以下?如果我没有显示自己的代码,是否可以推断出该自相关图显示了一个递增值的时间序列?如果是这样,您可以尝试向初学者解释它如何演绎吗?

2
在R中拟合多元线性回归:自相关残差
我正在尝试使用以下方程式估算R中的多元线性回归: regr <- lm(rate ~ constant + askings + questions + 0) 问和问题是按季度构建的季度数据时间序列askings <- ts(...)。 现在的问题是我得到了自相关残差。我知道可以使用gls函数拟合回归,但是我不知道如何识别必须在gls函数中实现的正确的AR或ARMA错误结构。 我现在尝试再次估算, gls(rate ~ constant + askings + questions + 0, correlation=corARMA(p=?,q=?)) 但是很遗憾,我既不是R专家也不是统计学专家来确定p和q。 如果有人可以给我一个有用的提示,我将很高兴。提前非常感谢您! 乔

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.