Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

1
逆Wishart分布矩阵的对角线的边际分布
假设。我对对角元素的边际分布感兴趣。关于的子矩阵的分布有一些简单的结果(至少有一些列在Wikipedia上)。由此我可以看出,对角线上任何单个元素的边际分布都是反伽玛。但是我一直无法推断出联合分布。DIAG (X )= (X 11,... ,X p p)XX∼InvWishart(ν,Σ0)X∼InvWishart⁡(ν,Σ0)X\sim \operatorname{InvWishart}(\nu, \Sigma_0)诊断(X)= (x11,… ,xp p)诊断⁡(X)=(X11,…,Xpp)\operatorname{diag}(X) = (x_{11}, \dots, x_{pp})XXX 我认为也许可以通过合成来得出,例如: p (X11| X我我,i > 1 )p (x22| X我我,i > 2 )… p (x(p − 1 )(p − 1 )| Xp p)p (xp p),p(X11|X一世一世,一世>1个)p(X22|X一世一世,一世>2)…p(X(p-1个)(p-1个)|Xpp)p(Xpp),p(x_{11} | x_{ii}, i\gt 1)p(x_{22}|x_{ii}, i>2)\dots p(x_{(p-1)(p-1)}|x_{pp})p(x_{pp}), 但是我从没有得到任何帮助,并且进一步怀疑我缺少简单的东西;似乎已经知道这个“应该”,但是我一直无法找到/显示它。

5
测量理论导论
我有兴趣了解有关非参数贝叶斯(及相关)技术的更多信息。我的背景是计算机科学,尽管我从未参加过度量理论或概率论的课程,但是我对概率和统计学的正规培训数量有限。谁能推荐这些概念的可读介绍来帮助我入门?

3
为什么将随机变量定义为函数?
我在理解随机变量作为函数的概念时遇到问题。我了解机制(我认为),但不了解动机... 说是概率三倍,其中,是该区间的Borel-代数,是常规的Lebesgue测度。令为从到的随机变量,使得,,...,,因此在值1到6上具有离散的均匀分布。 Ω = [ 0 ,1 ] 乙σ P X 乙{ 1 ,2 ,3 ,4 ,5 ,6 } X ([ 0 ,1 / 6 ))= 1 X ([ 1 / 6 ,2 / 6 ))= 2 X ([(Ω ,B ,P)(Ω,B,P)(\Omega, B, P) Ω = [ 0 ,1 ]Ω=[0,1]\Omega = …

2
极值理论-显示:从正常到冈贝尔
的最大值 simiid根据极值理论,标准正态收敛于标准Gumbel分布。X1,…,Xn.∼X1,…,Xn.∼X_1,\dots,X_n. \sim 我们如何证明这一点? 我们有 P(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(\max X_i \leq x) = P(X_1 \leq x, \dots, X_n \leq x) = P(X_1 \leq x) \cdots P(X_n \leq x) = F(x)^n 我们需要查找/选择常数的序列,以便:F \ left(a_n x + b_n \ right)^ n \ rightarrow ^ {n \ rightarrow \ infty} G(x )= e ^ {-\ exp(-x)}an>0,bn∈Ran>0,bn∈Ra_n>0,b_n\in\mathbb{R}F(anx+bn)n→n→∞G(x)=e−exp(−x)F(anx+bn)n→n→∞G(x)=e−exp⁡(−x)F\left(a_n …

2
具有多个条件的条件概率的定义
具体来说,假设我有两个事件A和B,以及一些分布参数,我想看看。P (甲|乙,θ )θθ \theta P(A|B,θ)P(A|B,θ)P(A | B,\theta) 因此,给定一些事件A和B,最简单的条件概率定义是。因此,如果要处理多个事件,如上面所述,我可以说 还是我看错了?有时候我在处理概率问题时会倾向于发疯,我不确定为什么。 P(A|B,θ)?= P((A|θ)∩(B|θ))P(A|B)=P(A∩B)P(B)P(A|B)=P(A∩B)P(B)P(A|B) = \frac{P(A \cap B)}{P(B)}P(A|B,θ)=?P((A|θ)∩(B|θ))P(B|θ)P(A|B,θ)=?P((A|θ)∩(B|θ))P(B|θ)P(A | B,\theta) \stackrel{?}{=} \frac{P((A | \theta)\cap(B | \theta))}{P(B|\theta)}

4
谁能澄清“随机变量和”的概念
在我的概率类别中,经常使用术语“随机变量的总和”。但是,我坚持到底是什么意思? 我们是在谈论来自随机变量的一堆实现的总和吗?如果是这样,那不就是一个数字吗?随机变量实现的总和如何导致我们产生分布或任何种类的cdf / pdf /功能?如果不是随机变量实现,那么到底要添加什么呢?


4
每天的概率仅仅是对付未知数的一种方式(这里不谈论量子物理学)吗?
似乎在日常概率中(不是量子物理学),概率实际上只是未知数的替代物。以掷硬币为例。我们说这是“随机的”,头改变了50%,尾巴改变了50%。但是,如果我确切地知道硬币的密度,大小和形状;空气密度 硬币翻转了多少力;该部队确切地放置在哪里;硬币到地板的距离;等,使用基本物理学,我无法以100%的精度预测它会落在头上还是尾巴上?如果是这样,在这种情况下概率不是我处理不完整信息的一种方式吗? 如果我随机播放一副纸牌(这是我对此的考虑),那不是同一回事吗?我将牌的顺序视为随机的,因为我不知道顺序是什么,但并不是我抽出的第一张牌是黑桃A真的有1/52的可能性—要么100%是黑桃王牌或100%的王牌不是。 如果掷骰子并重排牌组不是真正随机的,那么计算机随机数生成器也不是随机的,因为如果我知道算法(可能还有其他一些变量),我也会知道数量会是多少? 在此先感谢所有花时间回答的人,尤其是像我这样的非数学家提出的新手问题。我不想继续进行reddit,因为其中很多人都伪装成有知识的人,却没有。其他一些元注释: 首先,我知道已经回答了一个类似的问题Random vs Unknown。所以,请不要让我参考。我认为我要提出的问题要狭窄得多,并且要以更简单的数学为基础。 其次,我不是数学家,所以请坚持使用简单的示例和非技术性的语言(除非绝对必要,在这种情况下,请假装自己是在向艺术史专业的中等学识的大四学生解释自己)。 第三,我对基本概率有很好的理解。这主要是因为我玩很多扑克,但是我了解轮盘,骰子,彩票等其他赌博游戏的赔率是如何工作的。同样,这是非常基本的东西,因此请避免量子物理学,如果可以避免的话。 第四,听起来并不冷酷,但我希望人们讨论我的问题的答案,而不是告诉我他们对我的了解还多。我之所以这样说,是因为我看到人们试图通过故意使用不必要的高技术语言来“打败”某人,并将另一个人的词汇混淆,而不是辩论实际问题。例如,与其说“应该摄入一些乙酰水杨酸”,不如说“应该服用一些阿司匹林”。

5
掷骰子直到其落到除4以外的任何数字上。结果大于4的概率是多少?
玩家将获得公平的六面骰子。为了赢球,她必须掷出大于4的数字(即5或6)。如果她掷4,则必须再次掷。她获胜的几率是多少? 我认为赢得的概率可以递归表示为:P(W)P(w ^)P(W) P(W)= P(- [R = 5 ∪ [R = 6 )+ P(r=4)⋅P(W)P(W)=P(r=5∪r=6)+P(r=4)⋅P(W) P(W) = P(r = 5 \cup r = 6) + P(r = 4) \cdot P(W) 通过在Java中运行一百万次试验,我将为,如下所示:P(W)P(W)P(W)0.39990.39990.3999 import java.util.Random; public class Dice { public static void main(String[] args) { int runs = 1000000000; int wins = 0; …

3
为了最大程度地正确猜测抛硬币的结果,我是否应该始终选择最可能的结果?
这不是功课。我有兴趣了解我的逻辑是否适合此简单的统计问题。 假设我有一个2面硬币,翻转头部的概率为,翻转末端的概率为。假设所有翻转都有独立的概率。现在,假设我想最大程度地预测下一次翻转时硬币是正面还是反面的机会。如果,则我可以随机猜测正面或反面,而我正确的可能性为。P(H)P(H)P(H)P (H )= 0.5 0.51−P(H)1−P(H)1-P(H)P(H)=0.5P(H)=0.5P(H) = 0.50.50.50.5 现在,假设,如果我想最大化我正确猜测的机会,我是否应该总是猜测概率为尾巴?0.8P(H)=0.2P(H)=0.2P(H) = 0.20.80.80.8 如果我有一个3面模具,并且将1、2或3滚动的概率为,和,则进一步采取这一步骤,我是否应该总是猜2以最大程度地提高正确猜的机会?还有另一种方法可以让我更准确地猜测吗?P (2 )= 0.5 P (3 )= 0.4P(1 )= 0.1P(1)=0.1P(1)=0.1P(2 )= 0.5P(2)=0.5P(2)=0.5P(3 )= 0.4P(3)=0.4P(3)=0.4

9
我们如何知道滚动1和2的概率是1/18?
自从我第一次上概率课以来,我一直在想以下问题。 通常通过“有利事件”与总可能事件之比来引入计算概率。滚动两个6面骰子的情况下,可能的事件数量为,如下表所示。363636 1234561(1,1)(2,1)(3,1)(4,1)(5,1)(6,1)2(1,2)(2,2)(3,2)(4,2)(5,2)(6,2)3(1,3)(2,3)(3,3)(4,3)(5,3)(6,3)4(1,4)(2,4)(3,4)(4,4)(5,4)(6,4)5(1,5)(2,5)(3,5)(4,5)(5,5)(6,5)6(1,6)(2,6)(3,6)(4,6)(5,6)(6,6)1234561(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)2(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)3(3,1)(3,2)(3,3)(3,4)(3,5)(3,6)4(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)5(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)6(6,1)(6,2)(6,3)(6,4)(6,5)(6,6)\begin{array} {|c|c|c|c|c|c|c|} \hline &1 & 2 & 3 & 4 & 5 & 6 \\ \hline 1 & (1,1) & (1,2) & (1,3) & (1,4) & (1,5) & (1,6) \\ \hline 2 & (2,1) & (2,2) & (2,3) & (2,4) & (2,5) & (2,6) \\ \hline 3 & …
20 probability  dice 

3
机器学习预测班级概率
我正在寻找可输出示例属于两个类之一的概率的分类器。 我知道逻辑回归和朴素的贝叶斯,但是您能告诉我其他类似的工作方式吗?也就是说,分类器不是预测示例所属的类,而是预测示例适合特定类的概率吗? 您可以分享关于这些不同分类器(包括逻辑回归和朴素贝叶斯)的优缺点的任何想法的加分。例如,对于多类别分类是否有更好的选择?

3
陪审员基本统计
我被传唤出任陪审员。我意识到统计数字与某些陪审团审判的相关性。例如,“基准利率”的概念及其在概率计算中的应用有时(也许总是)是相关的。 在我所处的情况下,一个人可以学习哪些统计主题,哪些材料适合我的背景? 我拥有“硬科学”学位,因此统计知识有限,但是我的技能很生锈。我全职工作,没有很多时间来做陪审团。因此,将答案集中在基本概念,简单的问题解决技能及其在相关问题上的应用(当然,以及这些概念和方法的局限性)将是适当的。

4
边缘情况下精度和召回率的正确值是多少?
精度定义为: p = true positives / (true positives + false positives) 对不对,作为true positives和false positives做法0,精度接近1? 召回相同的问题: r = true positives / (true positives + false negatives) 我目前正在实施统计测试,需要计算这些值,有时分母为0,我想知道在这种情况下应返回哪个值。 PS:请原谅,不恰当的标签,我想用recall,precision和limit,但我不能创造新的标签呢。
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
优惠券收集时间的下限是多少?
在经典的Coupon Collector问题中,众所周知,完成一组随机挑选的优惠券所需的时间满足,和。TTTnnnE[T]∼nlnnE[T]∼nln⁡nE[T] \sim n \ln n V一个- [R (Ť)〜ñ2Var(T)∼n2Var(T) \sim n^2镨(Ť&gt; n lnn + c n )&lt; e− cPr(T&gt;nln⁡n+cn)&lt;e−c\Pr(T > n \ln n + cn) < e^{-c} 这个上限比切比雪夫不等式给出的上限更好,后者约为 1 / c21/c21/c^2。 我的问题是:是否有相应优于切比雪夫下限为ŤTT?(例如,类似镨(Ť&lt; n lnn − c n )&lt; e− cPr(T&lt;nln⁡n−cn)&lt;e−c\Pr(T < n \ln n - cn) < e^{-c})?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.