Questions tagged «poisson-process»

对于有关泊松过程的理论或应用的问题,这是统计学和其他领域中应用最广泛的点过程之一。

5
请解释等待的悖论
几年前,我设计了一种辐射探测器,该探测器通过测量事件之间的间隔而不是对事件进行计数来工作。我的假设是,在测量非连续样本时,平均而言,我将测量实际间隔的一半。但是,当我用校准过的信号源测试电路时,读数的因数太高了两个,这意味着我一直在测量整个间隔。 在关于概率和统计的一本旧书中,我找到了关于“等待的悖论”的部分。它提供了一个示例,其中公交车每15分钟到达公交车站,一名乘客随机到达,它表示乘客平均等待整整15分钟。我一直无法理解示例提供的数学知识,并继续寻找解释。如果有人能解释为什么会这样,以便乘客等待整个间隔,我会睡得更好。

8
是否有用于模拟不规则间隔时间序列的金标准?
在经济学领域(我认为),我们有ARIMA和GARCH用于规则间隔时间序列,而Poisson,Hawkes用于建模点过程,那么尝试对不规则(不均匀)间隔时间序列进行建模的尝试-是否存在(至少)任何常见实践? (如果您对该主题有一定的了解,还可以展开相应的Wiki文章。) 版本(关于缺失值和不规则间隔的时间序列): 回答@Lucas Reis评论。如果测量或实现变量之间的间隙由于(例如)泊松过程而间隔开,则这种正则化的空间就不大了,但它存在一个简单的过程:t(i)是变量x的第i个时间索引(x的第i个时间)实现x),则限定间隙的测量值作为时间之间g(i)=t(i)-t(i-1),那么我们就离散g(i)使用常数c,dg(i)=floor(g(i)/c并与原来的时间序列的老观测之间的空白值的数量创建新的时间序列i和i+1等于DG(我),但问题是,这该过程很容易产生时间序列,而缺失数据的数量远大于观测值的数量,因此,对缺失观测值的合理估计可能是不可能的,而且可能太大c删除“时间结构/时间依赖性等”。分析的问题(极端情况是通过将c>=max(floor(g(i)/c))简单地将不规则间隔的时间序列分解为规则间隔而给出的 Edition2(只是为了好玩):图像说明了在不规则间隔的时间序列甚至点过程中缺失的值。

2
如何知道数据是否遵循R中的泊松分布?
我是一名本科生,并且为我的概率课程设计了一个项目。基本上,我有一个数据集,介绍了影响了我国多年的飓风。 在我的概率书((概率与统计数为R)中,有一个(不完整的)示例,说明如何检查数据是否遵循泊松分布,他们开始尝试证明遵循了这三个条件: 120(标准)第122-123页示例) 1-非重叠间隔中的结果数是独立的。换句话说,时间间隔(0,t]中的结果数与时间间隔(t,t + h],h> 0的结果数无关 2-在足够短的间隔内出现两个或更多结果的可能性实际上为零。换句话说,如果h足够小,则与在相同时间间隔中获得一个或零个结果的概率相比,在时间间隔(t,t + h]中获得两个或多个结果的概率可以忽略不计。 3-在足够短的间隔或较小区域中恰好一个结果的概率与间隔或区域的长度成正比。换句话说,在长度为h的区间中一个结果的概率为lambda * h。 但是标准3被“作为练习”。 A-有人可以告诉我是否有更“简便”的方法来查看我的数据集是否遵循泊松分布吗? B-有人可以用某种示例向我解释准则1和3(如果使用R的话,太棒了)? 谢谢! 注意:很抱歉,冗长的帖子。另外,我必须转换数据,以便有一个像这样的表: number of hurricanes | 0 | 1 | 2 etc. ----------------------------------------- total years that have | | | that number of hurricanes | | |

2
从使用泊松分布对过程进行建模转换为使用负二项分布?
\newcommand{\P}{\mathbb{P}}我们有一个随机过程,该过程在设定的时间段内可能不会发生多次。我们有一个来自此过程的预先存在模型的数据馈送,该数据馈送提供了在期间内发生许多事件的概率。这个现有模型很旧,我们需要对Feed数据进行实时检查,以获取估计错误。产生数据馈送的旧模型(提供了在剩余时间发生事件的概率)近似为Poisson Distributed。TTT0≤t&lt;T0≤t&lt;T0 \leq t < Tnnnttt 因此,为了检查异常/错误,我们让为剩余时间,为在剩余时间发生的事件总数。旧模型隐含了估计。因此,在我们的假设我们有: 为了从旧模型的输出(观测值y_ {t})中得出事件发生率\ lambda_t,我们使用状态空间方法,并将状态关系建模为: y_t = \ lambda_t + \ varepsilon_t \ quad(\ varepsilon_t \ sim N( 0,H_t))\ ,. tttXtXtX_ttttP(Xt≤c)P(Xt≤c)\P(X_t \leq c)Xt∼Poisson(λt)Xt∼Poisson⁡(λt)X_t\sim \operatorname{Poisson}(\lambda_{t})P(Xt≤c)=e−λ∑k=0cλktk!.P(Xt≤c)=e−λ∑k=0cλtkk!. \P(X_t \leq c) = e^{-\lambda}\sum_{k=0}^c\frac{\lambda_t^k}{k!}\,. λtλt\lambda_tytyty_{t}yt=λt+εt(εt∼N(0,Ht)).yt=λt+εt(εt∼N(0,Ht)). y_t = \lambda_t + \varepsilon_t\quad (\varepsilon_t \sim N(0, H_t))\,. 我们使用状态空间[恒定速度衰减]模型对\ lambda_t的演化使用旧模型进行λtλt\lambda_t过滤,以获取过滤后的状态E(λt|Yt)E(λt|Yt)E(\lambda_t|Y_t)并从如果E(λt|Yt)&lt;ytE(λt|Yt)&lt;ytE(\lambda_t|Y_t) < y_t。 这种方法在处理整个时间段T内估计事件计数中的错误时效果非常好TTT,但是如果我们想在另一个时间段0≤t&lt;σ0≤t&lt;σ0 \leq …

1
如何使用R估计泊松过程?(或者:如何使用NHPoisson包?)
我有一个事件数据库(即日期变量)和相关的协变量。 这些事件是由非平稳泊松过程生成的,参数是某些协变量的未知(但可能是线性)函数。 我认为NHPoisson软件包仅用于此目的。但是经过15个小时的失败研究,我仍然不知道如何使用它。 哎呀,我什至尝试阅读两本参考书:Coles,S.(2001)。极值统计建模简介。施普林格。Casella,G.和Berger,RL,(2002年)。统计推断。布鲁克斯/科尔。 fitPP.fun文档中的一个示例似乎不适合我的设置;我没有极端的价值观!我只是裸露事件。 有人可以帮我举一个简单的例子,用单个协变量拟合参数的泊松过程,并假设吗?我对和估计很感兴趣。我提供了一个包含事件时间的两列数据集(假设是在任意时间之后以秒为单位测量),而另一列则提供了协变量?的值。λλ\lambdaXXXλ=λ0+α⋅Xλ=λ0+α⋅X\lambda = \lambda_0 + \alpha \cdot Xλ0λ0\lambda_0αα\alphat0t0t_0XXX

1
生存分析和泊松回归之间有什么区别?
我正在使用给定用户访问站点的次数来处理经典客户流失预测问题,并且我认为泊松回归是建模该用户未来参与度的正确工具。那时我碰到一本关于生存分析和危害建模的书,但我不知道哪种技术最好。 我不想同时研究两个主题,那么使用过去的数据和人口统计来建模用户参与度的最佳方法是什么?

1
Fisher精确检验和超几何分布
我想更好地理解费舍尔的精确测试,因此设计了以下玩具示例,其中f和m分别对应于男性和女性,而n和y对应于“苏打水消耗”,如下所示: &gt; soda_gender f m n 0 5 y 5 0 显然,这是一个极大的简化,但是我不希望上下文妨碍您。在这里,我只是假设男性不喝苏打水,女性不喝苏打水,并想看看统计程序是否得出相同的结论。 在R中运行fisher精确测试时,得到以下结果: &gt; fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.0000000 0.4353226 sample estimates: odds ratio 0 在这里,由于p值为0.007937,我们可以得出结论,性别和苏打水消费是相关的。 我知道费舍尔精确检验与超基因组分布有关。因此,我想使用该方法获得相似的结果。换句话说,您可以按以下方式查看此问题:有10个球,其中5个标记为“雄性”,5个标记为“雌性”,您随机抽出5个球而不进行替换,并且看到0个雄性球。这种观察的机会是什么?为了回答这个问题,我使用了以下命令: &gt; …

1
我们如何预测罕见事件?
我正在开发保险风险预测模型。这些模型具有“罕见事件”的特征,例如航空公司的空机预测,硬件故障检测等。准备数据集时,我尝试应用分类,但是由于否定案例的比例很高,因此无法获得有用的分类器。 除了高中统计课程外,我在统计和数据建模方面没有太多经验,所以我有点困惑。 首先想到的是,我一直在考虑使用不均匀的泊松过程模型。我根据事件数据(日期,纬度,经度)对它进行了分类,从而可以很好地估计在特定日期,特定地点的特定时间发生风险的可能性。 我想知道,预测稀有事件的方法/算法是什么? 您如何建议您解决此问题?

1
如何在ARIMA模型的观察值48中加入创新的离群值?
我正在处理数据集。使用一些模型识别技术后,我得出了一个ARIMA(0,2,1)模型。 我使用R detectIO包TSA中的函数在对原始数据集进行第48次观察时检测到创新的离群值(IO)。 如何将这个离群值合并到模型中,以便将其用于预测?我不想使用ARIMAX模型,因为我可能无法根据R中的模型做出任何预测。还有其他方法可以做到吗? 以下是我的价值观: VALUE &lt;- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
独立泊松过程超越另一个泊松过程的可能性
我之前已经在其他stackexchanges上以其他方式问过这个问题,因此对您的重新发布感到抱歉。 我问过我的教授和几个博士生,但没有确切的答案。我将首先陈述问题,然后陈述我的潜在解决方案以及我的解决方案所存在的问题,对不起。 问题: 假设两个独立的Poisson进程MMM和,和的间隔相同,但受。在任何时间点,随着时间趋于无穷大,流程的合计输出大于流程加的合计输出即的概率是多少。为了举例说明,假设有两个桥和,平均和汽车在桥和RRRλRλR\lambda_RλMλM \lambda_MλR&gt;λMλR&gt;λM\lambda_R>\lambda_MMMMRRRDDDP(M&gt;R+D)P(M&gt;R+D)P(M>R+D)RRRMMMλRλR\lambda_RλMλM\lambda_MRRRλ ř &gt; λ 中号 d - [R 中号řMMM每个时间间隔和。辆汽车已经驶过桥,那么在任何时间点上总共有超过辆汽车驶过桥的概率是多少。λR&gt;λMλR&gt;λM\lambda_R>\lambda_MDDDRRRMMMRRR 解决这个问题的方法: 首先,我们定义两个泊松过程: M(I)∼Poisson(μM⋅I)R(I)∼Poisson(μR⋅I)M(I)∼Poisson⁡(μM⋅I)R(I)∼Poisson⁡(μR⋅I)M(I) \sim \operatorname{Poisson}(\mu_M\cdot I ) \\ R(I) \sim \operatorname{Poisson}(\mu_R\cdot I ) \\ 下一步是在给定数量的间隔之后找到描述的函数。这将在发生的情况下的条件上的输出,对于所有非负值。为了说明,如果总产是然后总产必须大于。如下所示。P(M&gt;R+D)P(M&gt;R+D)P(M>R+D)IIIM(I)&gt;k+DM(I)&gt;k+DM(I)>k+DR(I)=kR(I)=kR(I)=kkkkRRRXXXMMMX+DX+DX+D P(M(I))&gt;R(I)+D)=∑k=0n[P(M(I)&gt;k+D∪R(I)=k)]P(M(I))&gt;R(I)+D)=∑k=0n[P(M(I)&gt;k+D∪R(I)=k)]P(M(I))>R(I)+D)=\sum_{k=0}^n \bigg [P(M(I) >k+D\cup R(I)=k) \bigg] n→∞n→∞n\rightarrow \infty 由于独立性,可以将其重写为两个元素的乘积,其中第一个元素是Poisson分布的1-CDF,第二个元素是Poisson pmf: P(M(I)&gt;R(I)+D)=∑k=0n[P(M(I)&gt;k+D)1−Poisson CDF⋅P(R(I)=k)Poisson pmf]P(M(I)&gt;R(I)+D)=∑k=0n[P(M(I)&gt;k+D)⏟1−Poisson CDF⋅P(R(I)=k)⏟Poisson pmf]P(M(I)>R(I)+D)=\sum_{k=0}^n \bigg [\underbrace{P(M(I)> k+D)}_{1-\text{Poisson CDF}}\cdot \underbrace{P(R(I)=k)}_\text{Poisson pmf} \bigg] …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.