Questions tagged «stochastic-processes»

随机过程描述了随机变量/系统随时间和/或空间和/或任何其他索引集的演变。它在诸如计量经济学,天气,信号处理等领域具有应用。示例-高斯过程,马尔可夫过程等。

1
在R中修改线性弹道累加器(LBA)仿真
“线性弹道累加器”模型(LBA)是在快速简单决策任务中用于人类行为的相当成功的模型。唐金等人(2009,PDF)提供代码,允许估计给人类行为数据模型的参数,我已经复制代码(有一些小的格式更改)的要点在这里。但是,我想对模型进行微小的修改,但是我不确定如何在代码中实现此修改。 首先从规范模型开始,LBA将每个响应替代方案表示为一个相当奇怪的比赛中的竞争者,从而使竞争者可以具有以下不同特征: 起始位置:根据U(0,X1)界定的均匀分布,种族之间的差异很大。 速度:在给定的比赛中保持恒定(无加速度),但根据N(X2,X3)定义的高斯分布,不同的比赛之间会有所不同 终点线位置(X4) 因此,每个竞争对手对于X1,X2,X3和X4都有自己的一组值。 比赛重复了很多次,冠军和他们的时间记录在每场比赛之后。X5常数将添加到每个获胜时间。 现在,我要进行的修改是将起点的可变性交换到终点。也就是说,我希望所有竞争者和所有种族的起点都为零,从而消除X1,但是我想添加一个参数X6,该参数指定以X4为中心的均匀分布范围的大小,每个竞争对手从每场比赛都采集终点线。这样,在此模型中,每个竞争对手的价值将分别为X2,X3,X4和X6,而我们的竞争对手价值仍为X5。 如果有人愿意为此提供帮助,我将非常感谢。 哦,并提供从上述“ X”命名参数到我链接的LBA代码使用的变量名的映射:X1 = x0max; X2 =漂移率;X3 =标准差 X4 =气; X5 = Ter。

3
确定性模型和随机模型有什么区别?
简单线性模型: ε 吨 Ñ (0 ,σ 2)x=αt+ϵtx=αt+ϵtx=\alpha t + \epsilon_t其中 〜IIDϵtϵt\epsilon_tN(0,σ2)N(0,σ2)N(0,\sigma^2) 与和V 一- [R (X )= σ 2E(x)=αtE(x)=αtE(x) = \alpha tVar(x)=σ2Var(x)=σ2Var(x)=\sigma^2 AR(1): ε 吨 Ñ (0 ,σ 2)Xt=αXt−1+ϵtXt=αXt−1+ϵtX_t =\alpha X_{t-1} + \epsilon_t其中 〜IIDϵtϵt\epsilon_tN(0,σ2)N(0,σ2)N(0,\sigma^2) 与和V 一- [R (X )= 吨σ 2E(x)=αtE(x)=αtE(x) = \alpha tVar(x)=tσ2Var(x)=tσ2Var(x)=t\sigma^2 因此,简单的线性模型被视为确定性模型,而AR(1)模型被视为随机模型。 根据本·兰伯特(Ben Lambert)-确定性与随机性的Youtube视频,将AR(1)称为随机模型的原因是因为它的方差随时间增加。那么,非恒定方差的特征是否是确定随机或确定性的标准? 我也认为简单线性模型不是完全确定性的,因为我们有一个项与模型相关联。因此,我们总是在具有随机性。那么我们可以说模型是确定性的还是随机的呢? Xϵtϵt\epsilon_txxx

2
如果时间序列是二阶平稳的,这是否意味着它严格是平稳的?
如果X t 1,X t 2,...的联合分布,则过程XŤXŤX_t严格地是平稳的。。。,X t m与X t 1 + k,X t 2 + k,...的联合分布相同。。。,X t m + k对于所有m,对于所有k以及对于所有t 1,t 2,XŤ1个,XŤ2,。。。,XŤ米XŤ1个,XŤ2,。。。,XŤ米X_{t_1},X_{t_2},...,X_{t_m}XŤ1个+ k,XŤ2+ k,。。。,XŤ米+ kXŤ1个+ķ,XŤ2+ķ,。。。,XŤ米+ķX_{t_1+k},X_{t_2+k},...,X_{t_m+k}米米mķķk。Ť1个,Ť2,。。。,Ť米Ť1个,Ť2,。。。,Ť米t_1,t_2,...,t_m 如果过程的均值是常数且其自协方差函数仅取决于滞后,则该过程为二阶平稳过程。 因此二阶平稳意味着严格平稳吗? 同样在二阶平稳条件下,它说没有假设比一阶和二阶更高的力矩。第一个矩对应于均值,第二个矩对应于自协方差吗?

1
钓鱼问题
假设您想在上午8点至晚上8点去附近的湖钓鱼。由于过度捕捞,已经制定了一项法律,规定您每天只能捕捞一条鱼。当您抓到一条鱼时,您可以选择保留它(然后将其带回家),或将其扔回湖中继续捕鱼(但要冒着以后再用较小的鱼或根本不养鱼的风险)的选择。您想钓到尽可能多的鱼;具体来说,您想使您带回家的鱼的预期数量最大化。 形式上,我们可能会这样设置此问题:以一定的速度捕获鱼(因此,捕获下一条鱼所需的时间遵循已知的指数分布),并且捕获的鱼的大小遵循某些(也称为)分布。我们需要一些决策过程,根据当前时间和您刚抓到的鱼的大小,来决定是保留鱼还是将其扔回去。 所以问题是:该如何做出决定?是否有一些简单(或复杂)的方法来决定何时停止钓鱼?我认为问题等同于在给定的时间t内确定最佳渔民在时间t开始要带回家的预期鱼群数量。当且仅当鱼比预期的质量重时,最佳决策过程才能保留鱼。但这似乎是自指的。我们正在根据最佳渔民来定义最佳捕捞策略,但我不确定如何进行。

1
如何测试“先前状态”是否对R中的“后续状态”有影响
想象一个情况:我们有三个矿山的历史记录(已有20年)。白银的存在是否会增加明年发现黄金的可能性?如何测试这样的问题? 这是示例数据: mine_A <- c("silver","rock","gold","gold","gold","gold","gold", "rock","rock","rock","rock","silver","rock","rock", "rock","rock","rock","silver","rock","rock") mine_B <- c("rock","rock","rock","rock","silver","rock","rock", "silver","gold","gold","gold","gold","gold","rock", "silver","rock","rock","rock","rock","rock") mine_C <- c("rock","rock","silver","rock","rock","rock","rock", "rock","silver","rock","rock","rock","rock","silver", "gold","gold","gold","gold","gold","gold") time <- seq(from = 1, to = 20, by = 1)

1
如何在ARIMA模型的观察值48中加入创新的离群值?
我正在处理数据集。使用一些模型识别技术后,我得出了一个ARIMA(0,2,1)模型。 我使用R detectIO包TSA中的函数在对原始数据集进行第48次观察时检测到创新的离群值(IO)。 如何将这个离群值合并到模型中,以便将其用于预测?我不想使用ARIMAX模型,因为我可能无法根据R中的模型做出任何预测。还有其他方法可以做到吗? 以下是我的价值观: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
无限随机几何图中随机行走的机器人的密度
考虑一个无限随机的几何图,其中节点位置遵循密度为的泊松点过程,并且边距比更近。因此,边的长度遵循以下PDF:dρρ\rhoddd F(l )= { 2 ld2升≤ d0升> dF(升)={2升d2升≤d0升>d f(l)= \begin{cases} \frac{2 l}{d^2} \;\quad l \le d \\ 0 \qquad\; l > d \end{cases} 在上图中,考虑半径的圆内以原点为中心的节点。假设在时间,我们在每个提到的节点内放置了一个微型机器人。也就是说,飞机上机器人的密度由下式给出:吨= 0[R[Rrt = 0Ť=0t=0 G(l )= { ρ升≤ [R0升> dG(升)={ρ升≤[R0升>d g(l)= \begin{cases} \rho \quad l \le r \\ 0 \quad\; l > d \end{cases} ,其中是到原点的距离。下图显示了机器人初始放置的示例。升升l 在每个时间步上,机器人都会随机走近一个邻居。 现在,我的问题是:在,机器人的密度函数是多少?时可以计算密度函数吗?t …

3
给定连续M次,预期抛硬币的次数将连续N次
1月,Interviewstreet进行了第二次CodeSprint,其中包括以下问题。程序化答案已发布,但不包含统计解释。 (您可以使用Google信用登录到Interviewstreet网站,然后从此页面转到Coin Tosses问题,以查看原始问题和已发布的解决方案。) 投币 您有一个不偏不倚的硬币,您想要一直扔下去,直到获得N个连续的正面。您已经抛硬币了M次,令人惊讶的是,所有抛硬币都导致了正面的损失。 在您连续获得N个脑袋之前,需要进行的额外抛球次数是多少? 输入: 第一行包含个案T的数量。接下来的T行每一行包含两个数字N和M。 输出: 输出T行,其中包含相应测试用例的答案。打印答案,精确到小数点后两位。 样本输入: 4 2 0 2 1 3 3 3 2 样本输出: 6.00 4.00 0.00 8.00 示例说明: 如果N = 2且M = 0,则需要不断掷硬币,直到连续获得2个头。不难证明平均需要掷6枚硬币。 如果N = 2且M = 1,则需要连续2个头,并且已经有1个头。无论如何,都需要再次抛掷。在第一个折腾中,如果您有头脑,那就完成了。否则,您需要重新开始,因为连续计数器会重置,并且您需要不断掷硬币,直到获得N = 2个连续头。因此,预期的抛硬币次数为1 +(0.5 * 0 + 0.5 * 6)= 4.0如果N = 3且M = 3,您已经有3个头,因此您不再需要抛硬币。 …


1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

4
如何解释考克斯风险模型的生存曲线?
您如何从考克斯比例风险模型解释生存曲线? 在这个玩具示例中,假设我们对数据age变量有一个cox比例风险模型kidney,并生成了生存曲线。 library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() 例如,在时间,哪个说法是正确的?还是两者都不对?200200200 陈述1:我们将剩下20%的主题(例如,如果我们有人,那么到200天时,我们应该剩下200个左右), 100010001000200200200200200200 陈述2:对于一个给定的人,他/她有200 20%20%20\%机会在200天生存200200200。 我的尝试:我不认为这两个陈述是相同的(如果我错了,请纠正我),因为我们没有iid假设(所有人的生存时间不是独立地来自一个分布)。在这里我的问题类似于逻辑回归,每个人的危险率取决于该人的。βTxβTx\beta^Tx
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.