Questions tagged «bernoulli-distribution»

伯努利分布是由单个“成功”概率参数化的离散分布。这是二项式分布的特例。

2
贝努利抽样的置信区间
我有一个伯努利随机变量的随机样本,其中是iidrv,,而是未知参数。X1...XNX1...XNX_1 ... X_NXiXiX_iP(Xi=1)=pP(Xi=1)=pP(X_i = 1) = pppp 显然,一个可以找到的估计:。pppp^:=(X1+⋯+XN)/Np^:=(X1+⋯+XN)/N\hat{p}:=(X_1+\dots+X_N)/N 我的问题是如何建立的置信区间?ppp

6
测试两个二项分布在统计上是否彼此不同
我有三组数据,每组都有二项式分布(即,每组都有成功或失败的元素)。我没有成功的预测概率,而是只能依靠每个成功率作为真实成功率的近似值。我只发现了这个问题,虽然很接近,但似乎并不能完全解决这种情况。 为了简化测试,我们只说我有2个小组(在这个基本案例中可以扩展3个小组)。 第1组试验: = 2455ñ1个n1n_1 第2组试验: = 2730ñ2n2n_2 第1组成功: = 1556ķ1个k1k_1 第2组成功: = 1671ķ2k2k_2 我没有预期的成功概率,只有我从样本中知道的概率。因此,我对这两个组的隐含成功率是: 第1组的成功率: = 1556/2455 = 63.4%p1个p1p_1 第2组的成功率: = 1671/2730 = 61.2%p2p2p_2 每个样本的成功率都相当接近。但是我的样本量也很大。如果我检查二项式分布的CDF来查看它与第一个分布有何不同(我假设第一个是零检验),那么第二个可以实现的可能性很小。 在Excel中: 1-BINOM.DIST(1556,2455,61.2%,TRUE)= 0.012 但是,这没有考虑第一个结果的任何方差,它只是假设第一个结果是测试概率。 有没有更好的方法来测试这两个数据样本在统计上是否彼此实际上有所不同?

2
逻辑回归:伯努利与二项式响应变量
我想使用以下二项式响应并以和作为预测因子进行逻辑回归。 X1个X1个X_1X2X2X_2 我可以采用以下格式提供与伯努利回复相同的数据。 逻辑回归输出用于这2个数据集是大多相同的。偏差残差和AIC不同。(两种情况下零偏差和残余偏差之间的差异相同,为0.228。) 以下是R的回归输出。这些数据集称为binom.data和bern.data。 这是二项式输出。 Call: glm(formula = cbind(Successes, Trials - Successes) ~ X1 + X2, family = binomial, data = binom.data) Deviance Residuals: [1] 0 0 0 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.9649 21.6072 -0.137 0.891 X1Yes -0.1897 2.5290 -0.075 0.940 X2 0.3596 1.9094 0.188 …


3
伯努利试验或乔治·卢卡斯电影实验获得K成功
我正在阅读“醉汉小径”,因此无法理解其中的一个故事。 它去了: 想象一下,乔治·卢卡斯(George Lucas)拍了一部新的《星球大战》(Star Wars)电影,并且在一个测试市场上决定进行疯狂的实验。他发行了两部相同的电影:《星球大战:情节A》和《星球大战:情节B》。每部电影都有自己的营销活动和发行时间表,相应的细节相同,只是一部电影的预告片和广告说“第A集”,而另一部电影的广告和预告片说“第B集”。 现在我们进行一次竞赛。哪部电影会更受欢迎?假设我们看了前20,000名观众,并记录了他们选择看的电影(忽略了那些顽固的粉丝,他们将同时前往两者,然后坚持认为两者之间存在细微但有意义的差异)。由于电影和他们的营销活动是相同的,因此我们可以用数学方法对游戏进行建模:想象一下将所有观众排成一排,然后依次为每个观众掷硬币。如果硬币降落,则他或她会看到情节A;如果硬币掉落了,那就是第B集。由于硬币有两种上升的机会均等,您可能会认为在这场实验性的票房大战中,每部电影的首映时间应占一半。 但是随机性的数学则相反:主角变化的最可能次数是0,而两部影片中的一部​​将率过20,000个客户的可能性比主角不断跷跷板要高88倍” 我(可能是错误地)将其归因于一个简单的伯努利试验问题,并且必须说我不明白为什么领导者平均不会跷跷板!谁能解释?

2
如何推导二项式分布的似然函数以进行参数估计?
根据Miller和Freund的《工程师概率与统计》,第8版(第217-218页),对于二项分布(伯努利试验),最大化的似然函数为 L(p)=∏ni=1pxi(1−p)1−xiL(p)=∏i=1npxi(1−p)1−xiL(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} 如何得出这个方程式?对于其他分布,泊松和高斯,对我来说似乎很清楚。 L(θ)=∏ni=1PDF or PMF of dist.L(θ)=∏i=1nPDF or PMF of dist.L(\theta) = \prod_{i=1}^n \text{PDF or PMF of dist.} 但是二项式的只是一点点不同。坦率地说,如何 nCx px(1−p)n−xnCx px(1−p)n−XnC_x~p^x(1-p)^{n-x} 成为 px一世(1 − p)1个−x一世pxi(1个-p)1个-X一世p^{x_i}(1-p)^{1-x_i} 在上述似然函数中?

1
生成相关的二项式随机变量
我想知道遵循线性变换方法是否可能生成相关的随机二项式变量? 下面,我尝试了一些简单的R语言,它产生了一些相关性。但是我想知道是否有原则性的方法可以做到这一点? X1 = rbinom(1e4, 6, .5) ; X2 = rbinom(1e4, 6, .5) ; X3 = rbinom(1e4, 6, .5) ; a = .5 Y1 = X1 + (a*X2) ; Y2 = X2 + (a*X3) ## Y1 and Y2 are supposed to be correlated cor(Y1, Y2)


2
来自两个独立的伯努利人口的抽样分布
让我们假设我们有两个独立的伯努利随机变量的样本,乙ë - [R( θ1个)乙Ë[R(θ1个)\mathrm{Ber}(\theta_1)和乙È - [R( θ2)乙Ë[R(θ2)\mathrm{Ber}(\theta_2)。 我们如何证明吗?(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2−−−−−−−−−−−−−−√→dN(0,1)(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2→dN(0,1)\frac{(\bar X_1-\bar X_2)-(\theta_1-\theta_2)}{\sqrt{\frac{\theta_1(1-\theta_1)}{n_1}+\frac{\theta_2(1-\theta_2)}{n_2}}}\xrightarrow{d} \mathcal N(0,1) 假设。n1≠n2n1≠n2n_1\neq n_2

3
通过采样直到10次失败来估计伯努利过程中的概率:是否有偏差?
假设我们有一个故障概率为的伯努利过程(该概率很小,例如),从中进行采样直到遇到故障。因此,我们将失败概率估计为,其中是样本数。q ≤ 0.01 10 q:= 10 / Ñ Ñqqqq≤ 0.01q≤0.01q \leq 0.01101010q^:= 10 / Nq^:=10/ñ\hat{q}:=10/NññN 问题:是否对有偏差?而且,如果是这样,有没有办法纠正它? qq^q^\hat{q}qqq 我担心坚持最后一个样本是一次失败会使估计值产生偏差。

2
相关的伯努利试验,多元伯努利分布?
我正在简化我正在工作的研究问题。想象一下,我有5个硬币,让我们称之为成功。这些是非常有偏见的硬币,成功概率为p = 0.1。现在,如果硬币是独立的,那么获得至少1个头或更多的概率非常简单,即。在我的情况下,我的伯努利试验(掷硬币)不是独立的。我获得的唯一信息是成功的概率(每个概率为p = .1)和二进制变量之间的理论Pearson相关性。1−(1−1/10)51−(1−1/10)51-(1-1/10)^5 有什么方法可以仅凭此信息来计算一次成功或更多次成功的概率?我试图避免基于仿真的方法,因为这些理论结果将用于指导仿真研究的准确性。我一直在研究多元伯努利分布,但我认为仅凭相关性和成功的边际概率不能完全说明它。我的一个朋友建议构造一个具有bernoulli边际的高斯copula(使用R包copula),然后pMvdc()在一个大样本上使用该函数来获得我想要的概率,但是我不确定如何处理它。

2
phi,Matthews和Pearson相关系数之间的关系
phi和Matthews相关系数是同一概念吗?它们如何与两个二元变量的皮尔逊相关系数相关或等效?我假设二进制值为0和1。 两个伯努利随机变量和y之间的皮尔逊相关性是:xxxyyy ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]−−−−−−−−−−√=E[xy]−E[x]E[y]Var[x]Var[y]−−−−−−−−−−√=n11n−n1∙n∙1n0∙n1∙n∙0n∙1−−−−−−−−−−√ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]=E[xy]−E[x]E[y]Var[x]Var[y]=n11n−n1∙n∙1n0∙n1∙n∙0n∙1 \rho = \frac{\mathbb{E} [(x - \mathbb{E}[x])(y - \mathbb{E}[y])]} {\sqrt{\text{Var}[x] \, \text{Var}[y]}} = \frac{\mathbb{E} [xy] - \mathbb{E}[x] \, \mathbb{E}[y]}{\sqrt{\text{Var}[x] \, \text{Var}[y]}} = \frac{n_{1 1} n - n_{1\bullet} n_{\bullet 1}}{\sqrt{n_{0\bullet}n_{1\bullet} n_{\bullet 0}n_{\bullet 1}}} 哪里 E[x]=n1∙nVar[x]=n0∙n1∙n2E[y]=n∙1nVar[y]=n∙0n∙1n2E[xy]=n11nE[x]=n1∙nVar[x]=n0∙n1∙n2E[y]=n∙1nVar[y]=n∙0n∙1n2E[xy]=n11n \mathbb{E}[x] = \frac{n_{1\bullet}}{n} \quad \text{Var}[x] = \frac{n_{0\bullet}n_{1\bullet}}{n^2} \quad \mathbb{E}[y] = \frac{n_{\bullet 1}}{n} \quad \text{Var}[y] …

2
经验分布替代
赏金: 完整的奖金将颁发给别人谁提供任何发表的论文,它使用或提及的估计参考以下。F~F~\tilde{F} 动机: 本部分对您可能并不重要,我怀疑它不会帮助您获得赏金,但是由于有人问了动机,这就是我正在努力的目标。 我正在研究统计图论问题。标准稠密图限制性目的是在这个意义上的对称函数,w ^ (Û ,v )= w ^ (v ,Ú )。取样在图上Ñ顶点可以被认为是取样Ñ在单位间隔均匀值(û 我为我= 1 ,... ,ÑW:[0,1]2→[0,1]W:[0,1]2→[0,1]W : [0,1]^2 \to [0,1]W(u,v)=W(v,u)W(u,v)=W(v,u)W(u,v) = W(v,u)nnnnnnUiUiU_ii=1,…,ni=1,…,ni = 1, \dots, n),那么边的概率为W (U i,U j)。我们得到的邻接矩阵被称为一个。(i,j)(i,j)(i,j)W(Ui,Uj)W(Ui,Uj)W(U_i, U_j)AAA 我们可以把作为密度˚F = w ^ / ∬ W¯¯假设∬ w ^ > 0。如果我们基于A来估计f,而对f没有任何约束,那么我们将无法获得一致的估计。我发现一个有趣的结果,当f来自一组可能的函数时,不断估计f。从这个估计和Σ 一,我们可以估算w ^。WWWf=W/∬Wf=W/∬Wf = W / \iint W∬W>0∬W>0\iint …

3
伯努利试验中估计“成功”可能性所需的样本量
假设一个游戏提供了一个事件,该事件在完成时要么给出奖励,要么什么都不给出。确定是否给出奖励的确切机制尚不清楚,但我假设使用了随机数生成器,并且如果结果大于某个硬编码值,则可以获得奖励。 如果我想对工程师进行什么逆向工程以决定奖励的获得频率(估计为15%至30%),我该如何计算所需的样本数量? 我从这里的“真实概率估计器”部分开始:Checking_whether_a_coin_is_fair,但不确定我是否正朝正确的道路前进。我得到了〜1000个样本的结果,在95%置信度下最大误差为3%。 最终,这是我要解决的问题: 事件#1的X%给予奖励1.0R 事件#2的奖励率为1.4R,有%的时间 我想足够准确地估算X和Y,以确定哪个事件更有效。大样本量是一个问题,因为我最多每20分钟只能获取1个样本。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.