二项式随机变量的预测间隔的公式(近似或精确)是什么?
假设,和我们观察(从绘制)。该是已知的。
我们的目标是从获得新抽签的95%预测间隔。
点估计是,其中p = ÿ。对于A置信区间 p是直截了当的,但我不能找到针对预测时间间隔的公式ÿ。如果我们知道p(而不是 p ),那么95%的预测区间只是涉及寻找一个二项式的位数。有什么明显的我可以忽略的吗?
二项式随机变量的预测间隔的公式(近似或精确)是什么?
假设,和我们观察(从绘制)。该是已知的。
我们的目标是从获得新抽签的95%预测间隔。
点估计是,其中p = ÿ。对于A置信区间 p是直截了当的,但我不能找到针对预测时间间隔的公式ÿ。如果我们知道p(而不是 p ),那么95%的预测区间只是涉及寻找一个二项式的位数。有什么明显的我可以忽略的吗?
Answers:
好的,让我们尝试一下。我将给出两个答案-贝叶斯答案(在我看来是简单自然的)和可能的常问问题之一。
我们假设一个测试之前对,I,E。,p 〜乙Ë 吨一个(α ,β ),这是因为β-二项式模型是共轭的,这意味着后验分布也是Beta分布与参数α = α + ķ ,β = β + ñ - ķ,(我使用ķ表示在成功的次数ñ试验中,代替ÿ)。因此,推断被大大简化。现在,如果您对...的可能值有一些先验知识,则可以使用它来设置的值 α和 β,即,事先定义贝塔,否则可能呈现均匀(无信息)之前,用 α = β = 1,或其他无信息先验(参见例如这里)。无论如何,你的后
在贝叶斯推理中,重要的是后验概率,这意味着一旦知道,就可以对模型中的所有其他量进行推理。您想对可观测值进行推论:尤其是在新结果的向量y = y 1,… ,y m上,其中m不一定等于n。具体来说,对于每个j = 0 ,… ,m,假设我们得到k个,我们要计算在接下来的m个试验中恰好有j个成功的概率在前试验中成功;后预测质量函数:
但是,我们的的二项式模型意味着,在p具有一定值的条件下,m次试验中j次成功的概率不取决于过去的结果:
因此,表达式变为
该积分的结果是一个众所周知的Beta-Binomial分布:跳过段落,我们得到了可怕的表达式
给定二次损失,我们对点估计当然是该分布的平均值,即
现在,让我们寻找一个预测间隔。由于这是离散分布,因此我们没有的封闭形式表达式,因此。原因是,对于离散分布,取决于分位数的定义方式,分位数函数不是函数还是不连续函数。但是,这不是一个大问题:对于小米,你可以写下米概率P [R (Ĵ = 0 |米,ñ ,ķ ),P [R (Ĵ ≤ 1 |米P - [R (Ĵ 1 ≤ Ĵ ≤ Ĵ 2)= 0.95并从这里找到 Ĵ 1,Ĵ 2使得
当然,您会发现不止一对,因此理想情况下,您会寻找最小的来满足上述要求。注意
只是Beta-Binomial分布的CMF(累积质量函数)的值,因此存在一个封闭形式的表达式,但这在广义超几何函数方面非常复杂。我宁愿只安装R包extraDistr
并调用pbbinom
以计算Beta-Binomial分布的CMF。具体来说,如果您想一次性计算所有概率,则只需编写:
library(extraDistr)
jvec <- seq(0, m-1, by = 1)
probs <- pbbinom(jvec, m, alpha = alpha + k, beta = beta + n - k)
其中alpha
和beta
是Beta先验参数的值,即和β(如果在p上使用统一先验,则为1 )。当然,如果R为Beta-Binomial分布提供分位数函数,则一切都会简单得多,但不幸的是,事实并非如此。
令,k = 70(因此,我们最初在100个试验中观察到了70次成功)。我们希望在接下来的m = 20次试验中获得成功次数j的点估计和95%的预测间隔。然后
n <- 100
k <- 70
m <- 20
alpha <- 1
beta <- 1
我在上假设一个统一的先验,这取决于您特定应用程序的先验知识,这可能是一个好的先验,也可能不是一个好的先验。从而
bayesian_point_estimate <- m * (alpha + k)/(alpha + beta + n) #13.92157
显然,的非整数估计没有意义,因此我们可以舍入到最接近的整数(14)。然后,对于预测间隔:
jvec <- seq(0, m-1, by = 1)
library(extraDistr)
probabilities <- pbbinom(jvec, m, alpha = alpha + k, beta = beta + n - k)
概率是
> probabilities
[1] 1.335244e-09 3.925617e-08 5.686014e-07 5.398876e-06
[5] 3.772061e-05 2.063557e-04 9.183707e-04 3.410423e-03
[9] 1.075618e-02 2.917888e-02 6.872028e-02 1.415124e-01
[13] 2.563000e-01 4.105894e-01 5.857286e-01 7.511380e-01
[17] 8.781487e-01 9.546188e-01 9.886056e-01 9.985556e-01
对于相同的尾概率区间,我们希望最小,使得P - [R (Ĵ ≤ Ĵ 2 |米,Ñ ,ķ )≥ 0.975和最大Ĵ 1,使得P - [R (Ĵ < Ĵ 1 |米,Ñ ,ķ )= P [R (Ĵ ≤ Ĵ 1 - 1 |米,ñ ,ķ。这样,我们将拥有
因此,通过查看上述概率,我们看到和j 1 = 9。该贝叶斯预测间隔的概率为0.9778494,大于0.95。我们可以找到较短的时间间隔,使得P - [R (Ĵ 1 ≤ Ĵ ≤ Ĵ 2 |米,Ñ ,ķ )≥ 0.95,但在这种情况下,两个不等式尾概率中的至少一个不被满足。
我将关注Krishnamoorthy和Peng(2011)的治疗方法。让和X 〜乙我Ñ ø 米(Ñ ,p )被独立地Binominally分布。我们希望有一个1 - 2 α -用于预测的间隔ÿ,基于的观察X。换句话说,我们寻找I = [ L (X ; n使得:
该“ ”是因为我们正在处理一个离散型随机变量,因此,我们不能期望得到准确的报道的事实......但我们可以寻找具有总是至少标称覆盖的间隔,因此是一个保守的间隔。现在,可以证明给定X + Y = k + j = s时X的条件分布是超几何的,样本大小为s,总体中成功的次数为n,总体大小为n + m。因此,条件pmf为
n <- 100
k <- 70
m <- 20
frequentist_point_estimate <- m * k/n #14
jvec <- seq(0, m, by = 1)
probabilities <- phyper(k,n,m,k+jvec)
jvec[which.min(probabilities > 0.025) - 1] # 18
probabilities <- 1-phyper(k-1,n,m,k+jvec)
jvec[which.max(probabilities > 0.025) - 1] # 8