Questions tagged «beta-distribution»

在区间上定义的两参数单变量分布族。 [0,1]

11
Beta发行背后的直觉是什么?
免责声明:我不是统计学家,而是软件工程师。我在统计学方面的大部分知识都来自自我教育,因此我在理解概念上仍然有很多空白,这些概念对于这里的其他人而言似乎微不足道。因此,如果答案包含较少的具体术语和更多的解释,我将非常感激。想象一下,你在跟奶奶说话:) 我试图把握性质的beta分布 -它应该用于和如何解释它在各种情况下。如果我们说的是正态分布,则可以将其描述为火车的到站时间:最经常到达的时间是准时到达的,更不常见的是早到1分钟或晚到1分钟的时间,很少有差异到达的距离平均值20分钟 均匀分配尤其描述了彩票中每张彩票的机会。二项分布可以用硬币翻转等来描述。但是,对beta分布有这样直观的解释吗? 假设和。Beta分布在这种情况下看起来像这样(在R中生成):α = 0.99α=.99\alpha=.99β= .5β=.5\beta=.5B (α ,β)B(α,β)B(\alpha, \beta) 但这实际上是什么意思?Y轴显然是概率密度,但是X轴上是什么? 我非常感谢您对本示例或任何其他示例所做的任何解释。


3
结果(比率或分数)在0到1之间的回归
我正在考虑建立一个预测比率的模型,其中和且。因此,该比率将在和之间。一个≤ b 一> 0 b > 0 0 1a/ba/ba/ba≤ba≤ba \le ba>0a>0a > 0b>0b>0b > 0000111 我可以使用线性回归,尽管它自然不限于0.1。我没有理由相信这种关系是线性的,但是无论如何,它当然经常被用作简单的第一个模型。 我可以使用逻辑回归,尽管通常将其用于预测两态结果的概率,而不是从0.1.1范围内预测连续值。 一无所知,您将使用线性回归,逻辑回归还是隐藏选项c?


5
常见分布的真实示例
我是一名研究生,对统计感兴趣。我总体上喜欢这种材料,但是有时我很难考虑将其应用于现实生活中。具体来说,我的问题是关于常用的统计分布(正态-β-伽玛等)。我猜在某些情况下,我得到了使分布变得非常漂亮的特定属性-例如指数的无记忆属性。但是对于其他许多情况,我对教科书中常见发行版的重要性和应用领域都没有直觉。 可能有很多很好的消息源可以解决我的问题,如果您能分享这些问题,我将非常高兴。如果我可以将其与现实生活中的示例联系起来,那么我会更加热衷于该材料。

6
二项式和Beta分布之间的关系
我不是程序员而是统计学家,所以我希望这个问题不要太幼稚。 它发生在随机执行的采样程序执行中。如果我对程序状态进行N = 10个随机时间采样,则可以看到函数Foo在例如这些采样中的I = 3上执行。我对这能告诉我有关Foo执行的实际时间F的时间感兴趣。 我知道我是二项分布的,均值F * N。我也知道,给定I和N,F遵循beta分布。实际上,我已经通过程序验证了这两个分布之间的关系,即 cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1 问题是我对这种关系没有直觉。我无法“想象”它为什么起作用。 编辑:所有答案都是具有挑战性的,尤其是@whuber,我仍然需要了解,但整理订单统计数据非常有帮助。尽管如此,我已经意识到我应该问一个更基本的问题:给定I和N,F的分布是什么?每个人都指出它是Beta,我知道。我终于从维基百科(先前的共轭)中弄清楚了Beta(I+1, N-I+1)。使用程序进行探索之后,这似乎是正确的答案。所以,我想知道我是否错。而且,我仍然对上面显示的两个CDF之间的关系,为什么它们求和为1,以及它们甚至与我真正想知道的事情有什么关系感到困惑。

3
维中两个随机单位向量的标量积的分布
如果和是中的两个独立的随机单位矢量(均匀分布在单位球面上),它们的标量积(点积)的分布是什么吗?xx\mathbf{x}yy\mathbf{y}RDRD\mathbb{R}^Dx⋅yx⋅y\mathbf x \cdot \mathbf y 我猜想随着的分布迅速增长(?)成为均值为零的正态值,并且在较高维度方差减小但是对于\ sigma ^ 2(D)?DDDlimD→∞σ2(D)→0,limD→∞σ2(D)→0,\lim_{D\to\infty}\sigma^2(D) \to 0,σ2(D)σ2(D)\sigma^2(D) 更新资料 我进行了一些快速模拟。首先,为D = 1000生成10000对随机单位向量,D=1000D=1000D=1000很容易看到它们的点积分布完全是高斯分布(实际上对于D=100D=100D=100,它已经是高斯分布了),请参见左侧的子图。其次,对于从1到10000的每个DDD(以递增的步长),我生成了1000对并计算了方差。对数-对数图显示在右侧,很明显公式很容易被1 / D近似1/D1/D1/D。请注意,对于D=1D=1D=1和D=2D=2D=2此公式甚至可以给出准确的结果(但我不确定以后会发生什么)。

0
Jaynes的分布
在Jaynes的《概率论:科学的逻辑》一书中,Jaynes有一章(第18章)标题为“分布和继承规则”,在其中他介绍了分布的概念,这一段有助于说明:一种p一种pA_p一种p一种pA_p [...]要看到这一点,请想象获得新信息的效果。假设我们将硬币扔了五次,每次都掉到尾巴上。你问我下一次投篮的可能性是多少?我还是说1/2。但是,如果您再告诉我一个有关火星的事实,我已经准备好完全改变我的概率分配[ 火星上曾经有生命 ]。一分钱都使我的信念状态非常稳定,而火星则使我的信念状态非常不稳定 这似乎是对概率论作为逻辑的致命反对。也许我们需要将一个命题关联起来,不仅仅是一个代表合理性的数字,而是两个数字:一个代表合理性,另一个在面对新证据时其稳定性如何。因此,将需要一种二值理论。[...] 他接着介绍了一个新的命题,使得 一种p一种pA_pP(A | ApË)≡ pP(一种|一种pË)≡pP(A|A_pE) ≡ p “其中E是任何额外的证据。如果我们要渲染。作为一个口头声明,它会出来这样的事: 不论任何其他可能已被告知,A的概率为p。”一种p一种pA_p一种p一种pA_p ≡≡≡ 我试图仅使用满足这些标准的Beta分布来查看两个数的概念(“合理性,以及面对新证据时另一个稳定性”)之间的区别。 图18.2与使用(例如)非常相似,而对于火星,它可能是Beta(1 / 2,1 / 2),信念状态为“非常不稳定”α = β= 100α=β=100\alpha=\beta=100 上面的原始命题可以是非常大的 Beta(),这样 /(。则没有证据可以改变p和P(A | A_pE)≡p的分布一种p一种pA_pα ,βα,β\alpha,\betaα ,βα,β\alpha,\betaαα\alphaα + β)= pα+β)=p\alpha+\beta)=ppppP(A | ApË)≡ pP(一种|一种pË)≡pP(A|A_pE) ≡ p 在本书中都讨论了Beta分布,因此我是否错过了一些区别,这里的区别是微妙的,需要一种新的理论(分布)?他确实在下一段提到“似乎好像我们在谈论'概率的可能性'。”一种p一种pA_p

3
每日时间序列分析
我正在尝试进行时间序列分析,并且是该领域的新手。我每天都在统计2006-2009年的某个事件,因此我想为其拟合时间序列模型。这是我取得的进步: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) 我得到的结果图是: 为了验证是否存在季节性和趋势数据,或者不是,我按照此提到的步骤后: ets(x) fit <- tbats(x) seasonal <- !is.null(fit$seasonal) seasonal 在Rob J Hyndman的博客中: library(fma) fit1 <- ets(x) fit2 <- ets(x,model="ANN") deviance <- 2*c(logLik(fit1) - logLik(fit2)) df <- attributes(logLik(fit1))$df - attributes(logLik(fit2))$df #P value 1-pchisq(deviance,df) 两种情况都表明没有季节性。 当我绘制该系列的ACF和PACF时,得到的是: 我的问题是: 这是处理每日时间序列数据的方式吗?该页面建议我应该同时查看每周和年度模式,但是这种方法对我来说并不明确。 一旦有了ACF和PACF图,我将不知道如何进行。 我可以简单地使用auto.arima函数吗? 适合<-arima(myts,order = c(p,d,q) *****更新了Auto.Arima结果****** 当我根据罗布海德门的评论的数据的频率改变为7 这里,auto.arima选择一个季节性ARIMA模型和输出: …

4
在beta回归中处理0.1值
我在[0,1]中有一些数据,希望通过beta回归进行分析。当然,需要做一些事情来容纳0,1值。我不喜欢修改数据以适合模型。我也不认为通货膨胀为零和1是个好主意,因为我认为在这种情况下,应将0视为很小的正值(但我不想确切地说出什么值是合适的。一个合理的选择我相信应该选择.001和.999这样的较小值,并使用beta的累积距离来拟合模型,因此对于观测值y_i,对数似然度LL_i应该为 if y_i < .001 LL+=log(cumd_beta(.001)) else if y_i>.999 LL+=log(1.0-cum_beta(.999)) else LL+=log(beta_density(y_i)) 我喜欢这个模型的地方在于,如果beta回归模型有效,那么该模型也是有效的,但是它消除了对极值的敏感性。但是,这似乎是一种自然的方法,我想知道为什么我在文献中找不到任何明显的参考文献。所以我的问题是不是修改数据,而不是修改模型。修改数据会使结果产生偏差(基于原始模型有效的假设),而通过对极值进行装仓来修改模型不会使结果产生偏差。 也许有一个我忽略的问题?

5
Beta回归比例数据,包括1和0
我正在尝试生成一个模型,该模型的响应变量的比例在0和1之间,其中包括相当多的0和1,但也有介于两者之间的许多值。我正在考虑尝试beta回归。我为R(betareg)找到的程序包只允许0到1之间的值,但不包括0或1。我在其他地方读过,从理论上讲,β分布应该能够处理0或1的值,但是我不知道如何在RI中处理此问题,因为看到有人将0.001加到零并从中取0.001,但是我不是确定这是个好主意? 或者,我可以logit变换响应变量并使用线性回归。在这种情况下,我有0和1的相同问题,无法对它们进行日志转换。

3
为什么β分布密度函数为-1?
Beta分布出现在两个参数设置下(或在此处) f(x)∝xα(1−x)βf(x)∝xα(1−x)β(1) f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} 或似乎更常用的一种 f(x)∝xα−1(1−x)β−1f(x)∝xα−1(1−x)β−1(2) f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} 但是,为什么第二个公式中确切有“ ”呢?−1−1-1 第一个公式在直观上似乎更直接对应于二项式分布 g (k )∝ p k(1 - p )n - kg(k)∝pk(1−p)n−k(3) g(k) \propto p^k (1-p)^{n-k} \tag{3} 但是从的角度来看“可见”ppp。这在beta二项式模型中尤其明显,其中可理解为先前的成功次数,是先前的失败次数。αα\alphaββ\beta 那么,为什么第二种形式确切地受到欢迎,其背后的原理是什么?使用任何一种参数化(例如,用于与二项分布的连接)有什么后果? 如果有人可以另外指出这种选择的起源和最初的论点,那就太好了,但这对我来说不是必需的。

2
为什么beta回归不能在响应变量中正确处理0和1?
通常建议使用beta回归(即具有beta分布的GLM,通常是logit链接函数)来处理响应aka因变量,其取值介于0和1之间,例如分数,比率或概率:结果的回归(比率或分数)在0和1之间。 但是,总是声称一旦响应变量至少等于0或1,就不能使用beta回归。如果是这样,则需要使用零/一膨胀的beta模型,或者对响应进行某种转换,等等。:Beta回归比例数据,包括1和0。 我的问题是:β分布的哪个属性阻止β回归处理精确的0和1,为什么? 我猜这是和不支持beta发行版的原因。但是对于所有形状参数和,零和一个都支持beta分布,只有较小的形状参数的分布在一侧或两侧达到无穷大。也许样本数据使得提供最佳拟合的和都将大于。000111α>1α>1\alpha>1β>1β>1\beta>1αα\alphaββ\beta111 这是否意味着在某些情况下,即使使用零/ 一,实际上也可以使用beta回归吗? 当然,即使0和1支持beta分布,准确观察0或1的概率也为零。但是观察其他给定可计数值集合的可能性也是如此,所以这不是问题吗?(参见@Glen_b的评论)。 \hskip{8em} 在beta回归的上下文中,beta分布的参数设置不同,但是对于,对于所有,仍应在进行明确定义。ϕ=α+β>2ϕ=α+β>2\phi=\alpha+\beta>2[0,1][0,1][0,1]μμ\mu

1
在无信息的Beta先验之间进行选择
我正在寻找无信息的先验信息,以进行Beta分发以使用二项式过程(命中率/小姐)。最初,我考虑使用生成统一的PDF,或者使用Jeffrey 优先使用。但是我实际上是在寻找对后验结果影响最小的先验,然后我考虑使用的不正确的先验。这里的问题是,只有当我至少有一次命中和一次错过时,我的后验分布才起作用。为了克服这个问题,我然后考虑使用一个非常小的常数,例如,只是为了确保后和将。α=1,β=1α=1,β=1\alpha=1, \beta=1α=0.5,β=0.5α=0.5,β=0.5\alpha=0.5, \beta=0.5α = 0,β= 0α=0,β=0\alpha=0, \beta=0α = 0.0001 ,β= 0.0001α=0.0001,β=0.0001\alpha=0.0001, \beta=0.0001αα\alphaββ\beta> 0>0>0 有谁知道这种方法是否可以接受?我看到了更改这些先验的数值效果,但是有人可以给我一种将像这样的小常数放在先验的解释吗?

3
Beta分布与逻辑回归模型之间有什么关系?
我的问题是:Beta分布与逻辑回归模型的系数之间的数学关系是什么? 为了说明: logistic(Sigmoid)函数由下式给出 f(x)=11+exp(−x)f(x)=11+exp⁡(−x)f(x) = \frac{1}{1+\exp(-x)} 它用于对逻辑回归模型中的概率进行建模。设为二分式评分结果,为设计矩阵。逻辑回归模型由下式给出AAA(0,1)(0,1)(0,1)XXX P(A=1|X)=f(Xβ).P(A=1|X)=f(Xβ).P(A=1|X) = f(X \beta). 注意XXX的第一列为常数111(截距),ββ\beta为回归系数的列向量。例如,当我们有一个(标准正态)回归变量xxx并选择β0=1β0=1\beta_0=1(拦截)和β1=1β1=1\beta_1=1,我们可以模拟所得的“概率分布”。 此图使人想起了密度由下式给出的Beta分布(与其他选择的图一样)。ββ\beta g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p−1)(1−y)(q−1).g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p−1)(1−y)(q−1)。g(y;p,q) = \frac{\Gamma(p)\Gamma(q)}{\Gamma(p+q)} y^{(p-1)} (1-y)^{(q-1)}. 使用最大似然或矩量方法,可以根据的分布估算和。因此,我的问题归结为:与和选择之间是什么关系?首先,这解决了上面给出的双变量情况。q P (甲= 1 | X )β p qpppqqqP(A = 1 |X)P(一种=1|X)P(A=1|X)ββ\betapppqqq

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.