Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

2
为一个说能影响骰子的通灵设计测试
假设我有一个朋友(我们称他为“乔治”),他说他可以用自己的思想来控制骰子的掷骰(即,使骰子更可能落在他正在考虑的特定数字上)。 我如何设计科学严谨的测试来确定他是否真的可以做到这一点?(当然,我真的不认为他可以,但是我希望他在测试开始之前就同意Amazing Randi风格的测试细节。)我想减少(很有可能)发布测试后的借口他会想出的。 这是我到目前为止的内容: 确定掷骰子的物理方法(骰子,振动杯,着陆面等) 定义一个“测试会话”,由X卷骰子组成。这个大小必须足够小,可以一次坐下,但是要足够大(可以确定)(经过分析),在95%-99%的置信度内骰子是公平的,还是偏向一方的 在所选骰子上运行Y次会话(不受George的影响),以此作为“对照”,以确保骰子自身显示“公平”结果 运行ž会议与乔治。在每次练习之前,请滚动一个单独的骰子以确定在整个会话期间George将“专注于”哪个数字。 编译并分析结果。 乔治为他的惨淡表现做了一些借口。 所以我对您的问题: 我的整体方法是否有缺陷或问题?乔治可能会反对吗? 我应该使用D6吗?还是D20?有关系吗?具有更多面的模具是否需要更多的轧辊才能产生类似的可信结果?还是相反?出于实际考虑,我宁愿少卷也不要多卷:) X,Y和Z的合理值是多少?它们并非完全无关。如果我选择的X值仅允许一次会话具有95%的置信度,那么即使没有George的影响,每20个会话中有1个可能“失败” 如何为单个会话定义“成功”或“失败”?(我确实找到了这个问题涉及卡方检验的细节,所以我认为这是我的评估方法,但是合理的置信度阈值是多少?) 如何为整体测试定义“成功”或“失败”?乔治可能会凭借一次偶然的机会“赢得”单个比赛,但是要通过整个测试,他必须通过多少Z个比赛? 如果有什么不同,我可能会在MS Excel电子表格中分析这些结果。

2
是否值得在引用的Wiki StatProb.com上发布?[关闭]
已关闭。这个问题是基于观点的。它当前不接受答案。 想改善这个问题吗?更新问题,以便通过编辑此帖子以事实和引用的形式回答。 7个月前关闭。 背景 我从对Andrew Gelman的Blog的评论中了解到StatProb.com。 根据该网站,StatProb为: StatProb:由统计与概率协会赞助的百科全书结合了传统Wiki(快速和最新发布,用户生成的开发,超链接和保存的历史记录)与传统发布(质量保证,审阅,作者信誉)的优势,以及结构化的信息显示)。所有贡献均已由领先的统计协会确定的编辑委员会批准;编辑委员会成员列在“关于”页面上。 我不是统计学家,但是我使用统计学,因此该站点似乎为我提供了机会,尽管我可能将其发布为附录或将其发布在网站上,但这些材料虽然可能对其他人有用,但可能不会发布。该选项之所以具有吸引力,是因为审查过程将增强我对我使用的方法的信心,并使其在公共领域具有一定的信誉。 尽管得到了主要统计和概率协会的支持,该站点仍未起飞。确实,一位博主问“ RIP StatProb?” 而且捐款的频率一直在下降。 题: 通过StatProb.com进行发布值得付出努力吗? 更新: 截至今天(2012-02-01),最近的贡献是2011-05-04 ; 最近编辑2011-06。因此,今天的问题看上去比最初提出问题时的吸引力要小。

1
什么是“最大相关系数”?
典型的图像处理统计数据是使用Haralick纹理特征(即14)。 我想知道其中的第14个特征:给定一个邻接图(我们可以简单地查看两个整数i的经验分布,j &lt; 256),其定义为:Q的第二个特征值的平方根,其中,Q为:PPP我,Ĵ &lt; 256i,j&lt;256i,j < 256问QQ问QQ 问我Ĵ= ∑ķP(i ,k )P(j ,k )[ ∑XP(x ,i )] [ ∑ÿP(ķ ,ÿ)]Qij=∑kP(i,k)P(j,k)[∑xP(x,i)][∑yP(k,y)]Q_{ij} = \sum_k \frac{ P(i,k) P(j,k)}{ [\sum_x P(x,i)] [\sum_y P(k, y)] } 即使经过大量的搜索,我也找不到该统计信息的任何参考。它有什么特性?它代表什么? (上面的值是在值j的像素旁边找到值i的像素的标准化次数)。P(i ,j )P(i,j)P(i,j)一世iiĴjj

3
离散分布近似
当您知道离散分布X的均值\ mu,方差\ sigma ^ 2,偏度\ gamma_1和超峰度\ gamma_2时,对于给定的两个整数m,n逼近的最佳方法是什么,并且从形状\ gamma_1和\ gamma_2的(非零)度量中清楚看出,法线近似不适合吗?米,Ñ μ σ 2 γ 1 γ 2 X γ 1 γ 2P[R [ Ñ ≤ X≤ 米]Pr[n≤X≤m]Pr[n \leq X \leq m]米,Ñm,nm,nμμ\muσ2σ2\sigma^2γ1个γ1\gamma_1γ2γ2\gamma_2XXXγ1个γ1\gamma_1γ2γ2\gamma_2 通常,我会使用带整数校正的正态近似值... P[R [ (Ñ - ½)≤ X≤ (m + ½)] = P[R [ (Ñ - ½)- μσ≤ ž≤ (米+ ½)- …

1
凭直觉,为什么交叉熵可以度量两个概率分布的距离?
对于两个离散分布和,交叉熵定义为pppqqq H(p ,q)= − ∑Xp (x )对数q( x )。H(p,q)=-∑Xp(X)日志⁡q(X)。H(p,q)=-\sum_x p(x)\log q(x). 我不知道为什么这将是两个概率分布之间距离的直观度量? 我看到是熵p,其中的措施“惊喜” p。H(p,q)是用q代替p的度量。我仍然不理解该定义背后的直观含义。H(p ,p )H(p,p)H(p,p)ppppppH(p ,q)H(p,q)H(p,q)pppqqq

1
衡量工作日内分布的均匀性
我有一个与此问题类似的问题: 如何测量分布的不均匀性? 我在一周中的每一天都有一组概率分布。我想测量每个分布与(1 / 7,1 / 7,...,1/7)的接近程度。 目前,我正在使用上述问题的答案;L2-范数,当分布在一天中的某一天质量为1时,值为1,对于(1 / 7,1 / 7,...,1/7)最小。我线性缩放它,使其在0到1之间,然后将其翻转,使0表示完全不均匀,而1表示完全均匀。 这很好用,但是我有一个问题。它将每个工作日均视为7维空间中的一个维度,因此不考虑天数的接近性;换句话说,即使(1 / 2,1 / 2,0,0,0,0,0)和(1 / 2,0,0,1 / 2,0,0,0)的得分相同尽管从某种意义上说,后者更“分散”和统一,理想情况下应该获得更高的分数。显然增加了复杂性,即天的顺序是循环的。 我该如何改变这种启发式方法来考虑天的临近?

2
卷积为何起作用?
所以我知道,如果我们要查找独立随机变量X+YX+YX + Y和的概率分布,可以通过说XXX和的概率分布来计算它YYY fX+Y(a)=∫∞x=−∞fX,Y(X=x,Y=a−x) dx=∫∞x=−∞fX(x)fY(a−x) dxfX+Y(a)=∫x=−∞∞fX,Y(X=x,Y=a−x) dx=∫x=−∞∞fX(x)fY(a−x) dxf_{X + Y}(a) = \int_{x = -\infty}^{\infty} f_{X, Y}(X = x, Y = a - x)~dx = \int_{x = -\infty}^{\infty} f_X(x) f_Y(a - x)~dx 从直觉上讲,这是有道理的,因为如果我们要找到两个随机变量求和为aaa的概率,则基本上就是所有导致这些变量求和为的事件的概率之和aaa。但是,我怎样才能正式证明这一说法呢?

3
测量2D正方形中点分布的均匀性
我有一个2D正方形,里面有一组点,例如1000点。我需要一种方法来查看正方形内的点的分布是否散布(或或多或少均匀分布),或者它们倾向于在正方形内的某个点聚集在一起。 我需要一种数学/统计(非编程)方法来确定这一点。我在Google上搜索,发现了诸如拟合优度,Kolmogorov等之类的东西,只是想知道是否还有其他方法可以实现这一目标。需要这个用于课堂论文。 输入:2D正方形和1000点。输出:是/否(是=均匀分布,否=在某些地方聚集在一起)。

1
人们为什么使用“证据权重”一词,它与“逐点相互信息”有何区别?
在这里,“证据权重”(WOE)是已发表的科学和政策制定文献中的常用术语,在风险评估的背景下最常见,其定义如下: w(e:h)=logp(e|h)p(e|h¯¯¯)w(e:h)=log⁡p(e|h)p(e|h¯)w(e : h) = \log\frac{p(e|h)}{p(e|\overline{h})} 其中是证据,是假设。eeehhh 现在,我想知道PMI(逐点相互信息)的主要区别是什么 pmi(e,h)=logp(e,h)p(e)∗p(h)pmi(e,h)=log⁡p(e,h)p(e)∗p(h)pmi(e,h)=\log\frac{p(e,h)}{p(e)*p(h)}

1
标准正态随机变量的PDF和CDF函数的凸性
请提供证明是凸。这里,和分别是标准的普通PDF和CDF。 ∀X&gt;0φΦQ(x)=x2+xϕ(x)Φ(x)Q(x)=x2+xϕ(x)Φ(x)Q\left(x\right)=x^{2}+x\frac{\phi\left(x\right)}{\Phi\left(x\right)}∀ X &gt; 0∀X&gt;0\forall x>0 ϕϕ\phiΦΦ\mathbf{\Phi} 尝试的步骤 1)计算方法 我已经尝试了演算方法,并为第二个导数提供了一个公式,但是无法证明它是正。如果您需要更多详细信息,请告诉我。∀ X &gt; 0∀X&gt;0\forall x > 0 最后, ∂Q(X)让 Q(x)=x2+ xϕ(x)Φ (x )Let Q(x)=x2+Xϕ(X)Φ(X)\begin{eqnarray*} \text{Let }Q\left(x\right)=x^{2}+x\frac{\phi\left(x\right)}{\Phi\left(x\right)} \end{eqnarray*} ∂ Q (X )∂Q(x)∂X=2 x + x [ -xϕ(x)Φ(x)− {ϕ(x)Φ(x)}2] +ϕ(x)Φ (x )∂Q(x)∂X=2X+X[-Xϕ(X)Φ(X)-{ϕ(X)Φ(X)}2]+ϕ(X)Φ(X)\begin{eqnarray*} \frac{\partial Q\left(x\right)}{\partial x} & = & 2x+x\left[-\frac{x\phi\left(x\right)}{\Phi\left(x\right)}-\left\{ \frac{\phi\left(x\right)}{\Phi\left(x\right)}\right\} ^{2}\right]+\frac{\phi\left(x\right)}{\Phi\left(x\right)} \end{eqnarray*} ∂ …

2
给定的概率是多少?
假设XXX和YYY是均值μ=(μ1,μ2)μ=(μ1,μ2)\mu=(\mu_1,\mu_2)且协方差 Σ=[σ11σ12σ12σ22]Σ=[σ11σ12σ12σ22]\Sigma = \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \\ \end{bmatrix}。\ Pr \ left(X &lt;Y | \ min \ left(X,Y \ right)\ right)的概率是Pr(X&lt;Y|min(X,Y))Pr(X&lt;Y|min(X,Y))\Pr\left(X<Y|\min\left(X,Y\right)\right)多少?

1
负概率:外行说明
我对这里的答案很感兴趣。我想更全面地解释负概率可能意味着什么及其应用,并可能附带示例。例如,根据这些扩展的概率度量,事件具有-10%的概率意味着什么?

2
随机图中三角形数量的分布和方差
考虑一个Erdos-Renyi随机图G=(V(n),E(p))G=(V(n),E(p))G=(V(n),E(p))。该组nnn顶点VVV由标V={1,2,…,n}V={1,2,…,n}V = \{1,2,\ldots,n\}。边缘的集合EEE通过随机过程构造。 让ppp是一个概率0&lt;p&lt;10&lt;p&lt;10<p<1,则每个二元集合{i,j}{i,j}\{i,j\}顶点(i≠ji≠ji \neq j)发生在边缘EEE以概率ppp,独立于其它对。 GGG中的三角形是不同顶点的无序三元组{i,j,k}{i,j,k}\{i,j,k\},因此{i,j}{i,j}\{i,j\},{j,k}{j,k}\{j,k\}和{k,i}{k,i}\{k,i\}是中的边GGG。 可能的三角形最大数量为。将随机变量定义为图观察到的三角形数。(n3)(n3)\binom{n}{3}XXXGGG 同时存在三个链接的概率为p3p3p^3。因此,X的期望值XXX由E(X)=(n3)p3E(X)=(n3)p3E(X) = \binom{n}{3} p^3。天真的,人们可能会猜测方差由E(X2)=(n3)p3(1−p3)E(X2)=(n3)p3(1−p3)E(X^2) =\binom{n}{3} p^3 (1-p^3),但事实并非如此。 下面的Mathematica代码模拟了该问题: n=50; p=0.6; t=100; myCounts=Table[Length[FindCycle[RandomGraph[BernoulliGraphDistribution[n,p]],3,All]],{tt,1,t}]; N[Mean[myCounts]] // 4216. &gt; similar to expected mean Binomial[n,3]p^3 // 4233.6 N[StandardDeviation[myCounts]] // 262.078 &gt; not similar to "expected" std Sqrt[Binomial[n,3](p^3)(1-p^3)] // 57.612 Histogram[myCounts] X的方差是XXX多少?

2
如果事件的概率之和等于其并集的概率,这是否意味着事件是不相交的?
不言自明,概率函数指派一个实数P (一)给每个事件一个,如果满足三个基本假设(柯尔莫哥洛夫的假设):PPPP(A)P(A)P(A)AAA P(A)≥0 for everyAP(A)≥0 for everyAP(A) \geq 0 \ \text{for every} A P(Ω)=1P(Ω)=1P(\Omega) = 1 If A1,A2,⋯are disjoint, thenP(⋃∞i=1Ai)=∑i=1∞P(Ai)If A1,A2,⋯are disjoint, thenP(⋃i=1∞Ai)=∑i=1∞P(Ai)\text{If} \ A_1, A_2, \cdots \text{are disjoint, then}\\ P\left(\bigcup_{i=1}^{\infty}A_i\right) = \sum\limits_{i=1}^{\infty}P(A_i) 我的问题是,在最后一个假设中,是否假设相反?如果我证明可以将一定数量的事件的概率相加以获得其并集的概率,我是否可以直接使用该公理声称事件是不相交的?

1
从成对的边际分布获得联合分布
假设我们有3个随机变量,并且我们知道成对的边际分布P (X 1,X 2),P (X 2,X 3),P (X 3,X 1),但是我们什么都不知道(例如条件独立)。我们可以得到联合分布P (X 1,X 2,X 3)X1个,X2,X3X1个,X2,X3X_1,X_2,X_3P(X1个,X2), P(X2,X3), P(X3,X1个)P(X1个,X2),P(X2,X3),P(X3,X1个)P(X_1,X_2), P(X_2,X_3), P(X_3,X_1)P(X1个,X2,X3)P(X1个,X2,X3)P(X_1,X_2,X_3)?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.