Questions tagged «beta-binomial»

11
Beta发行背后的直觉是什么?
免责声明:我不是统计学家,而是软件工程师。我在统计学方面的大部分知识都来自自我教育,因此我在理解概念上仍然有很多空白,这些概念对于这里的其他人而言似乎微不足道。因此,如果答案包含较少的具体术语和更多的解释,我将非常感激。想象一下,你在跟奶奶说话:) 我试图把握性质的beta分布 -它应该用于和如何解释它在各种情况下。如果我们说的是正态分布,则可以将其描述为火车的到站时间:最经常到达的时间是准时到达的,更不常见的是早到1分钟或晚到1分钟的时间,很少有差异到达的距离平均值20分钟 均匀分配尤其描述了彩票中每张彩票的机会。二项分布可以用硬币翻转等来描述。但是,对beta分布有这样直观的解释吗? 假设和。Beta分布在这种情况下看起来像这样(在R中生成):α = 0.99α=.99\alpha=.99β= .5β=.5\beta=.5B (α ,β)B(α,β)B(\alpha, \beta) 但这实际上是什么意思?Y轴显然是概率密度,但是X轴上是什么? 我非常感谢您对本示例或任何其他示例所做的任何解释。

6
二项式和Beta分布之间的关系
我不是程序员而是统计学家,所以我希望这个问题不要太幼稚。 它发生在随机执行的采样程序执行中。如果我对程序状态进行N = 10个随机时间采样,则可以看到函数Foo在例如这些采样中的I = 3上执行。我对这能告诉我有关Foo执行的实际时间F的时间感兴趣。 我知道我是二项分布的,均值F * N。我也知道,给定I和N,F遵循beta分布。实际上,我已经通过程序验证了这两个分布之间的关系,即 cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1 问题是我对这种关系没有直觉。我无法“想象”它为什么起作用。 编辑:所有答案都是具有挑战性的,尤其是@whuber,我仍然需要了解,但整理订单统计数据非常有帮助。尽管如此,我已经意识到我应该问一个更基本的问题:给定I和N,F的分布是什么?每个人都指出它是Beta,我知道。我终于从维基百科(先前的共轭)中弄清楚了Beta(I+1, N-I+1)。使用程序进行探索之后,这似乎是正确的答案。所以,我想知道我是否错。而且,我仍然对上面显示的两个CDF之间的关系,为什么它们求和为1,以及它们甚至与我真正想知道的事情有什么关系感到困惑。

3
分散数据计数的合适模型是什么?
我正在尝试对R中的计数数据进行建模,R的数据显然分散不足(分散参数〜.40)。这可能就是为什么glm具有family = poisson二项式(glm.nb)模型或负二项式()模型不重要的原因。当我查看数据的描述时,我没有计数数据的典型偏斜,并且在我的两个实验条件下的残差也是均匀的。 所以我的问题是: 如果我的计数数据确实不像计数数据那样运行,我是否还需要对计数数据使用特殊的回归分析?有时我会遇到非正态性(通常是由于峰度),但是我使用百分位数自举法比较修整后的均值(Wilcox,2012年)以解决非正态性问题。可以用Wilcox建议并在WRS软件包中实现的任何可靠方法代替计数数据的方法吗? 如果必须对计数数据使用回归分析,如何计算色散不足?泊松分布和负二项式分布具有较高的色散,所以这不合适吗?我当时正在考虑应用拟泊松分布,但是通常建议将其用于过度分散。我阅读了有关R包中似乎能够解释过度散布和欠散的beta二项式模型VGAM的信息。但是,作者似乎建议使用倾斜的Poisson分布,但我在包中找不到它。 谁能推荐用于散布数据的过程,并可能提供一些示例R代码?

3
为什么β分布密度函数为-1?
Beta分布出现在两个参数设置下(或在此处) f(x)∝xα(1−x)βf(x)∝xα(1−x)β(1) f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} 或似乎更常用的一种 f(x)∝xα−1(1−x)β−1f(x)∝xα−1(1−x)β−1(2) f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} 但是,为什么第二个公式中确切有“ ”呢?−1−1-1 第一个公式在直观上似乎更直接对应于二项式分布 g (k )∝ p k(1 - p )n - kg(k)∝pk(1−p)n−k(3) g(k) \propto p^k (1-p)^{n-k} \tag{3} 但是从的角度来看“可见”ppp。这在beta二项式模型中尤其明显,其中可理解为先前的成功次数,是先前的失败次数。αα\alphaββ\beta 那么,为什么第二种形式确切地受到欢迎,其背后的原理是什么?使用任何一种参数化(例如,用于与二项分布的连接)有什么后果? 如果有人可以另外指出这种选择的起源和最初的论点,那就太好了,但这对我来说不是必需的。

3
什么时候终止贝叶斯A / B测试?
我正在尝试对贝叶斯方法进行A / B测试,就像在针对黑客的概率编程和贝叶斯A / B测试中一样。这两篇文章都假定决策者仅根据某些准则(例如的概率来决定哪个变量更好,因此更好。这种可能性无法提供有关是否有足够数据量可以得出任何结论的任何信息。因此,我不清楚何时停止测试。P(p一个> p乙)= 0.97P(pA>pB)=0.97P(p_A > p_B) = 0.97 一个AA 假设有两个二进制RV,即和,我想根据和的观察来估计和的可能性是多少。此外,假设和是beta分布的。B p A > p B一个AA乙BBp一个> p乙pA>pB p_A > p_B ABpApBp一个- p乙p一个> 5 %pA−pBpA>5% \frac{p_A - p_B}{p_A} > 5\% 一个AA乙BBp一个pAp_Ap乙pBp_B 由于我可以找到和的参数,可以对后验样本进行采样,并估计。python中的示例:p 甲α ,βα,β\alpha, \betap Bp一个|数据pA|datap_A\,|\,\text{data} P (p A > p B | data )p乙|数据pB|datap_B\,|\,\text{data} P(p一个> p乙 | 数据) …

1
二项式条件下未来成功比例的预测间隔
假设我拟合了二项式回归并获得了点估计和回归系数的方差-协方差矩阵。这样一来,我就可以为将来的实验的预期成功比例获得CI ,但是我需要为观察到的比例获得CI。已经发布了一些相关的答案,包括模拟(假设我不想这样做)和指向Krishnamoorthya等人的链接(并不能完全回答我的问题)。ppp 我的推理如下:如果仅使用二项式模型,则不得不假定是从正态分布中采样的(具有相应的Wald CI),因此不可能以封闭形式获得观察比例的CI。如果我们假设p是从beta分布中采样的,那么事情就容易多了,因为成功次数将遵循Beta-Binomial分布。我们将不得不假设估计的beta参数α和β没有不确定性ppppppαα\alphaββ\beta。 有三个问题: 1)理论上:仅使用beta参数的点估计值可以吗?我知道在多元线性回归中构造CI以便将来观察 ÿ= x′β+ ε ,ε 〜Ñ(0 ,σ2)ÿ=X′β+ϵ,ϵ〜ñ(0,σ2)Y = x'\beta + \epsilon, \epsilon \sim N(0, \sigma^2) 他们这样做的WRT误差项方差,。我把它(如果我错了纠正我)的理由是,在实践中σ 2估计比回归系数远远更高的精度,我们不会得到太多的试图将不确定性σ 2。类似的理由适用于估计的beta参数α和β吗?σ2σ2\sigma^2σ2σ2\sigma^2σ2σ2\sigma^2αα\alphaββ\beta 2)哪种软件包更好(R:gamlss-bb,betareg,odd ?;我也可以使用SAS)。 3)给定估计的beta参数,是否有(近似)捷径来获得未来成功计数的分位数(2.5%,97.5%),或者更好的是,根据Beta-Binomial分布获得未来成功的比例。

4
如何在2 X 3桌子上进行多个事后卡方检验?
我的数据集包括近海,中海道和近海三种地点类型的生物的总死亡率或生存率。下表中的数字表示站点数。 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 我想知道根据地点​​类型,发生100%死亡率的地点数量是否显着。如果我运行2 x 3卡方,则会得到显着的结果。我是否可以进行事后成对比较,或者实际上应该使用对数方差分析或二项分布的回归?谢谢!
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.