Questions tagged «time-series»

时间序列是随时间(连续时间或离散时间段)观察到的数据。

6
短时间序列的最佳方法
我有一个与短时间序列建模有关的问题。建模是否不是问题,而是如何建模。你会推荐建模(非常)短的时间序列(说长的什么方法)?“最好”是指最可靠的一种,即由于观察次数有限,因此最不容易出错。对于短序列,单个观测值可能会影响预测,因此该方法应提供谨慎的误差估计以及与预测相关的可能变异性。我通常对单变量时间序列感兴趣,但是了解其他方法也将很有趣。Ť≤ 20T≤20T \leq 20

5
自相关测试:Ljung-Box与Breusch-Godfrey
我习惯于看到Ljung-Box测试非常频繁地用于测试原始数据或模型残差中的自相关。我几乎忘记了还有另一个自相关检验,即布劳希-哥德弗雷检验。 问题: Ljung-Box和Breusch-Godfrey检验的主要区别和相似之处是什么?何时应优先选择另一个? (欢迎提供参考。尽管我看了几本教科书并在线搜索了材料,但是我还是无法找到这两个测试的任何比较。我能够分别找到每个测试的描述,但是我感兴趣的是两者的比较。)

1
使用R中的tsoutliers包检测时间序列中的离群值(LS / AO / TC)。如何用公式格式表示离群值?
评论: 首先,我要非常感谢新的tsoutliers软件包的作者,该软件包实现了Chen和Liu的时间序列离群值检测,该软件包于1993年在《美国统计协会杂志》上的开源软件。[R[RR 程序包在时间序列数据中迭代检测5种不同类型的离群值: 附加异常值(AO) 创新离群值(IO) 电平转换(LS) 临时变更(TC) 季节性水平变动(SLS) 更妙的是,此程序包从预测程序包实现了auto.arima,因此可以无缝检测异常值。软件包还可以生成漂亮的图,以更好地了解时间序列数据。 以下是我的问题: 我尝试使用此程序包运行一些示例,但效果很好。加法离群值和电平移位很直观。但是,在处理临时更改离群值和创新离群值方面,我有两个问题,我无法理解。 临时更改异常值示例: 考虑以下示例: library(tsoutliers) library(expsmooth) library(fma) outlier.chicken <- tsoutliers::tso(chicken,types = c("AO","LS","TC"),maxit.iloop=10) outlier.chicken plot(outlier.chicken) 该程序正确地检测到以下位置的电平变化和临时变化。 Outliers: type ind time coefhat tstat 1 LS 12 1935 37.14 3.153 2 TC 20 1943 36.38 3.350 以下是情节和我的问题。 如何以等式格式写入临时更改?(电平移位可以很容易地写为二进制变量,在1935 / Obs 12之前的任何时候为0,在1935年之后和之后的任何时候为1。) 包装手册和本文中的临时更改公式为: L (B …


4
数据有两个趋势。如何提取独立的趋势线?
我有一组数据,这些数据不是以任何特定的方式排序的,但是在绘制时显然具有两个不同的趋势。由于两个系列之间有明显区别,因此简单的线性回归在此实际上并不足够。是否有一种简单的方法来获取两个独立的线性趋势线? 作为记录,我使用Python,并且对编程和数据分析(包括机器学习)相当满意,但在绝对必要的情况下愿意跳到R。

3
手动计算逻辑回归95%置信区间与在R中使用confint()函数之间为什么会有区别?
亲爱的大家-我注意到我无法解释的怪事,可以吗?总之:在logistic回归模型中计算置信区间的手动方法和R函数confint()得出不同的结果。 我一直在研究Hosmer&Lemeshow的Applied Logistic回归(第二版)。在第3章中,有一个计算比值比和95%置信区间的示例。使用R,我可以轻松地重现模型: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

3
如何用R拟合ARIMAX模型?
我有四个不同的每小时测量时间序列: 房屋内部的热量消耗 屋外温度 太阳辐射 风速 我希望能够预测房屋内部的热量消耗。每年和每天都有明显的季节性趋势。由于不同系列之间存在明显的相关性,因此我想使用ARIMAX模型拟合它们。可以使用包TSA中的arimax函数在R中完成。 我试图阅读有关此函数的文档,并阅读传递函数,但到目前为止,我的代码是: regParams = ts.union(ts(dayy)) transferParams = ts.union(ts(temp)) model10 = arimax(heat,order=c(2,1,1),seasonal=list(order=c(0,1,1),period=24),xreg=regParams,xtransf=transferParams,transfer=list(c(1,1)) pred10 = predict(model10, newxreg=regParams) 给我: 黑线是实际测量的数据,绿线是我的比较模型。这不仅不是一个好的模型,而且显然有些错误。 我承认我对ARIMAX模型和传递函数的了解有限。在函数arimax()中(据我了解),xtransf是我要使用(使用传递函数)来预测我的主要时间序列的外生时间序列。但是xreg和xtransf到底有什么区别? 一般来说,我做错了什么?我希望能够获得比从lm(热〜临时辐射风*时间)获得的更好的拟合度。 编辑: 基于一些评论,我删除了transfer,并添加了xreg: regParams = ts.union(ts(dayy), ts(temp), ts(time)) model10 = arimax(heat,order=c(2,1,1),seasonal=list(order=c(0,1,1),period=24),xreg=regParams) 其中dayy是“一年中的第几天”,而时间是一天中的小时。温度再次是外界温度。这给了我以下结果: 更好,但远不及我所期望的。

2
如何使用时间序列数据进行引导?
我最近了解了有关使用自举技术来计算估计器的标准误差和置信区间的信息。我了解到的是,如果数据是IID,则可以将样本数据视为总体,并进行替换抽样,这将使您能够对测试统计信息进行多次模拟。 对于时间序列,您显然无法执行此操作,因为可能存在自相关。我有一个时间序列,想计算固定日期前后的数据平均值。是否有使用修改后的引导程序来执行此操作的正确方法?

1
时态网络中的链路异常检测
我碰到了一篇使用链接异常检测来预测趋势主题的论文,并且发现它非常有趣:该论文是“通过链接异常检测在社交流中发现新兴主题”。 我想将其复制到不同的数据集上,但是我对如何使用它们的方法并不熟悉。假设我有六个月的一系列节点网络快照。节点具有长尾度分布,大多数节点只有几个连接,而有些则有很多。新节点将在此时间段内出现。 我如何实现本文中使用的顺序折算归一化的最大似然计算来检测我认为可能是爆发的先兆的异常链接?还有其他更合适的方法吗? 我在理论上和实践上都在问。如果有人可以指出我用python或R实现该方法的方法,那将非常有帮助。 任何人?我知道你们那里的聪明人有一些开始思考的答案,


9
为什么要使用矢量纠错模型?
我对向量错误校正模型(VECM)感到困惑。 技术背景: VECM提供了将向量自回归模型(VAR)应用于集成多元时间序列的可能性。在教科书中,他们列举了将VAR应用于集成时间序列时遇到的一些问题,其中最重要的是所谓的虚假回归(t统计量非常重要,R ^ 2很高,尽管变量之间没有关系)。 估计VECM的过程大致包括以下三个步骤,其中一个令人困惑的是我的第一个步骤: 集成多元时间序列的VAR模型的规范和估计 计算似然比检验以确定协整关系数 确定协整次数后,估算VECM 在第一步中,用适当的滞后数(使用通常的拟合优度)来估计VAR模型,然后检查残差是否与模型假设相对应,即没有序列相关性和异方差,并且残差呈正态分布。因此,可以检查VAR模型是否恰当地描述了多元时间序列,只有在这样做的情况下,才可以继续进行下一步。 现在我的问题是:如果VAR模型能够很好地描述数据,为什么我完全需要VECM?如果我的目标是生成预测,那么估计VAR和检查假设还不够,如果这些假设已实现,则仅使用此模型即可吗?

3
如何知道时间序列是固定的还是非固定的?
我使用R,我搜索在谷歌和了解到kpss.test(),PP.test()和adf.test()用来了解时间序列的平稳性。 但是我不是统计学家,他可以解释他们的结果 > PP.test(x) Phillips-Perron Unit Root Test data: x Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01 > kpss.test(b$V1) KPSS Test for Level Stationarity data: b$V1 KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1 Warning message: In kpss.test(b$V1) : p-value greater than …

7
时间序列分析的重点是什么?
时间序列分析的重点是什么? 还有很多其他统计方法,例如回归和机器学习,它们都有明显的用例:回归可以提供有关两个变量之间关系的信息,而机器学习非常适合预测。 但是与此同时,我看不到时间序列分析有什么用。当然,我可以拟合ARIMA模型并将其用于预测,但是当该预测的置信区间将很大时,这有什么好处呢?尽管这是世界历史上数据驱动最多的行业,但没有人能预测股市是有原因的。 同样,如何使用它来进一步了解我的流程?当然,我可以绘制ACF并进行“啊哈!有一些依赖!”,那又如何呢?重点是什么?当然存在依赖性,这就是为什么要开始进行时间序列分析的原因。您已经知道存在依赖性。但是您打算将其用于什么?

4
通过算法识别记录的错误中的峰值的简单方法
我们需要一个预警系统。我正在处理一台已知在负载下具有性能问题的服务器。错误和时间戳一起记录在数据库中。可以采取一些手动干预的步骤来减少服务器负载,但前提是有人知道该问题... 给定一组错误发生的时间,我如何(实时)识别错误尖峰的开始?我们可以定期或针对每个错误发生进行计算。 我们对偶尔的错误并不关心,但是没有特定的阈值。只要我们在五分钟内遇到三个错误,我就可以通知某人,但我敢肯定有更好的方法... 我希望能够根据系统管理员的反馈来调整算法的敏感性。就目前而言,他们希望它相当敏感,即使我们知道我们可以预期会有一些误报。 我不是统计学家,我敢肯定这是显而易见的,并且使用我们现有的工具(SQL Server和老式的ASP JScript)来实现此操作相对简单。我不是在寻找代码的答案,但是,如果它需要其他软件,则可能对我们不起作用(尽管出于我的好奇心,我欢迎提出不切实际但理想的解决方案作为评论)。

2
用正则化或罚分拟合ARIMAX模型(例如,套索,弹性网或岭回归)
我在预测包中使用了auto.arima()函数来拟合具有各种协变量的ARMAX模型。但是,我经常有很多变量可供选择,并且通常最终得到一个最终模型,该模型可以使用其中的一个子集。我不喜欢用于变量选择的临时技术,因为我是人类并且容易受到偏见的影响,但是交叉验证时间序列比较困难,因此我没有找到一种自动尝试可用变量的不同子集的好方法,并且我无法根据自己的最佳判断来调整模型。 当我拟合glm模型时,可以通过glmnet软件包使用弹性网或套索进行正则化和变量选择。R中是否存在用于在ARMAX模型上使用弹性网的现有工具包,还是我必须自己开发?这是个好主意吗? 编辑:手动计算AR和MA项(例如,直到AR5和MA5)并使用glmnet拟合模型是否有意义? 编辑2:看来,FitAR软件包使我受益匪浅,但并非全部。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.