Questions tagged «forecasting»

未来事件的预测。在[时间序列]的上下文中,这是[预测]的特例。

1
如何比较观察到的事件与预期的事件?
假设我有一个频率为4个可能的事件的样本: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 并且我具有发生事件的预期概率: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 利用我四个事件的观测频率之和(18),我可以计算事件的预期频率,对吗? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 



2
混合模型的参数,半参数和非参数引导
接下来的嫁接摘自本文。我是新手,要引导并尝试为带有R boot包的线性混合模型实现参数,半参数和非参数自举。 R代码 这是我的R代码: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out 问题 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
季节性调整后的每月逐月增长以及潜在的每周季节性
作为附带的兴趣,我一直在探索预测时间序列(尤其是使用R)。 就我的数据而言,我有每天的访问次数,可以追溯到将近4年的每天。在此数据中,有一些不同的模式: 周一至周五的访问量很多(周一/周二最高),但周六至周日的访问量则大大减少。 一年中的某些时段下降(例如,美国假期前后的访问量减少,夏季显示出较少的增长) 年比显着增长 能够使用这些数据来预测未来的一年,并使用它来进行季节性调整后的逐月增长,这将是很好的。每月查看的主要内容是: 某些月份的星期一/星期二会比其他月份要多(而且多年以来也不一致)。因此,需要对平日较多的一个月进行相应的调整。 探索周似乎也很困难,因为周编号系统会根据年份从52-53更改,并且似乎ts无法解决这一问题。 我正在考虑为一个月的工作日取平均值,但是结果得出的单位有点奇怪(平均工作日访问次数的增长),并且会删除有效的数据。 我觉得这种数据在时间序列中很常见(例如,办公楼中的用电量可能是这样的),有人对如何建模有任何建议,尤其是在R中? 我正在使用的数据非常简单,它开始如下: [,1] 2008-10-05 17607 2008-10-06 36368 2008-10-07 40250 2008-10-08 39631 2008-10-09 40870 2008-10-10 35706 2008-10-11 18245 2008-10-12 23528 2008-10-13 48077 2008-10-14 48500 2008-10-15 49017 2008-10-16 50733 2008-10-17 46909 2008-10-18 22467 并以这种方式一直延续到现在,总体呈增长趋势,在美国假期周前后有所下降,而夏季的增长总体上放缓。

1
当预测模型中的响应变量不同时,如何合并预测?
介绍 在预测组合中,一种流行的解决方案是基于某些信息准则的应用。以对模型估计的Akaike准则为例,可以从计算的差,然后将RP_j = e ^ {(AIC ^ *-AIC_j)/ 2}解释为模型j的相对概率是真实的。然后将权重定义为一个我CĴAICjAIC_jĴjj一个我CĴAICjAIC_j一个我C∗=分Ĵ一个我CĴAIC∗=minjAICjAIC^* = \min_j{AIC_j}[RPĴ=Ë(一我C∗− A ICĴ)/ 2RPj=e(AIC∗−AICj)/2RP_j = e^{(AIC^*-AIC_j)/2}Ĵjj wĴ=[RPĴ∑Ĵ[RPĴwj=RPj∑jRPjw_j = \frac{RP_j}{\sum_j RP_j} 问题 我试图克服的一个困难是,这些模型是根据不同转换的响应(内生)变量估算的。例如,某些模型基于年增长率,另一种模型基于季度间增长率。因此,提取的一个我CĴAICjAIC_j值不能直接比较。 尝试过的解决方案 由于重要的是一个我CAICAIC的差异,因此可以采用基本模型的一个我CAICAIC(例如,我尝试提取lm(y~-1)不带任何参数的模型),该AIC对于响应变量转换是不变的,然后比较第Ĵjj个模型与AIC的差异。基本模型一个我CAICAIC。然而在这里似乎不足之处遗迹-区别是由响应变量的转型的影响。 结束语 注意,可以使用“根据相同的响应变量估计所有模型”之类的选项,但是非常耗时。如果没有其他方法可以解决问题,我想在做出痛苦的决定之前先寻求快速的“治愈”方法。

3
如何对时间序列进行预测?
我对时间序列数据的分析并不熟悉。但是,我有一个简单的预测任务要解决。 我从一个普通的生成过程中获得了大约五年的数据。每年代表具有非线性成分的单调递增函数。在每年的40周周期中,我每周都有计数。过程开始,函数从零开始,在函数的前半部分相当快地增加,在后半部分中变慢,然后在最后五周内变平。多年以来,这一过程是一致的,每年各个细分市场的变化率和数量差异很小。 y1={0,Nt1,Nt2,...Nt39,Nt40}y1={0,Nt1,Nt2,...Nt39,Nt40} y_{1}=\{0, N_{t1}, N_{t2}, ... N_{t39}, N_{t40}\} ⋮⋮ \vdots y5={0,Nt1,Nt2,...Nt39,Nt40}y5={0,Nt1,Nt2,...Nt39,Nt40} y_{5}=\{0, N_{t1}, N_{t2}, ... N_{t39}, N_{t40}\} 哪里 NtxNtxN_{tx} 等于时间x的计数。 目标是 NNN 在 txtxtx (或更好 t0t0t0 至 txtxtx,或指向该点的坡度)并预测 NNN 在 t40t40t40。例如,如果Nt10Nt10N_{t10} 是5000的期望值是多少 Nt40Nt40N_{t40}那年。因此,问题是,您将如何为此类数据建模?总结和可视化非常容易。但是我想要一个模型来促进预测并结合误差度量。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.