Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

10
“可能性”和“概率”之间有什么区别?
的维基百科页面声称可能性和概率是不同的概念。 在非技术术语中,“可能性”通常是“概率”的代名词,但在统计使用中,在角度上存在明显的区别:在给定一组参数值的情况下,某些观察到的结果的概率的数字被视为给定观测结果的参数值集的可能性。 有人可以更深入地描述这意味着什么吗?另外,一些关于“概率”和“可能性”如何不同的示例将是很好的。

12
为什么95%的置信区间(CI)并不意味着95%的机会包含平均值?
似乎在这里通过各种相关问题,我们达成共识,即所谓的“ 95%置信区间”中的“ 95%”部分是指这样的事实:如果我们要多次精确地重复采样和CI计算过程, ,因此计算得出的95%的配置项将包含总体平均值。这也似乎是共识,这一定义确实不允许人们从单个95%CI得出结论,即平均值有95%的概率落在CI内。但是,我不理解前者在暗示许多95%的配置项包含总体均值的情况下并不暗示后者,就我们的不确定性而言(关于我们实际计算的配置项是否包含总体)是不是)强迫我们使用想象中的案例的基准利率(95%)作为我们对实际案例包含CI的概率的估计? 我见过一些文章按照“实际计算的CI包含总体均值或不包含总体均值,因此其概率为1或0”的论点进行争论,但这似乎暗示了对概率依赖性的奇怪定义在未知状态下(例如,一个朋友扔公平的硬币,隐藏结果,我被禁止说有50%的可能性是正面的)。 我当然错了,但是我看不出逻辑哪里出错了...

6
概率分布值超过1可以吗?
在有关朴素贝叶斯分类器的Wikipedia页面上,存在以下行: p(height|male)=1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789(1的概率分布是可以的。钟形曲线下的面积等于1。) 值如何确定?我认为所有概率值都表示在范围内。此外,假设有可能具有这样的值,那么在页面上显示的示例中如何获得该值?>1>1>10≤p≤10≤p≤10 \leq p \leq 1

14
亚马逊面试问题-第二次面试的可能性
我在接受亚马逊采访时遇到了这个问题: 接受第一次面试的所有人中有50%接受第二次面试 95%的朋友接受了第二次面试,他们觉得第一次面试很好 没有进行第二次面试的朋友中有75%认为他们的第一次面试很好 如果您觉得自己的第一次面试很好,那么您接受第二次面试的可能性是多少? 有人可以解释如何解决吗?我无法将单词问题分解成数学(现在面试已经很长时间了)。我了解可能没有实际的数值解决方案,但是对如何解决此问题的解释会有所帮助。 编辑:好吧,我确实得到了第二次面试。如果有人好奇,我会给出一个解释,该解释是以下一系列响应的组合:信息不足,朋友不具有代表性,等等,只是通过一些可能性进行了交谈。最后,这个问题使我感到困惑,感谢所有答复。

3
为什么我们需要西格玛代数来定义概率空间?
我们进行了一个随机实验,以不同的结果形成样本空间 Ω,Ω,\Omega,我们感兴趣地观察了某些模式(称为事件 F.F.\mathscr{F}. 西格玛代数(或西格玛场)由可以分配概率度量PP\mathbb{P}的事件组成。满足某些属性,包括包含空集∅∅\varnothing和整个样本空间,以及描述与维恩图的并集和相交的代数。 概率被定义为之间的函数σσ\sigma代数和区间[0,1][0,1][0,1]。总的来说,三元组(Ω,F,P)(Ω,F,P)(\Omega, \mathscr{F}, \mathbb{P})形成了一个概率空间。 有人可以用简单的英语解释如果我们没有σσ\sigma代数的情况,为什么概率大厦会崩溃?它们只是被那个不可能的书法“ F”楔入中间。我相信它们是必要的;我看到一个事件与结果不同,但是如果没有σσ\sigma代数,会发生什么错误呢? 问题是:在哪种类型的概率问题中,包括σσ\sigma代数的概率空间的定义成为必要吗? 达特茅斯大学网站上的此在线文档提供了简单易懂的英语说明。这个想法是旋转指针在单位周长的圆周上逆时针旋转: 我们首先构造一个微调器,它由一个单位圆周的圆和一个指针组成,如图所示。我们在圆上选择一个点并将其标记为000,然后在圆上的每个其他点标记xXx,从000到该点的距离为逆时针方向。实验包括旋转指针并记录指针尖端处的点的标签。我们让随机变量XXX表示该结果的值。样品空间显然是间隔[0,1)[0,1个)[0,1)。我们想构建一个概率模型,其中每个结果均可能发生。daccess-ods.un.org daccess-ods.un.org如果我们像进行有限数量的可能结果那样进行实验,则必须将概率000分配给每个结果,因为否则,所有可能结果的概率之和将不会等于1。(实际上,对无数个实数求和是一件棘手的事情;特别是,为了使这种和具有任何意义,最多最多可以有许多个求和数可以不同于000)但是,如果所有分配的概率都是000,那么总和应该是 000,而不是11个1。 因此,如果我们为每个点分配任何概率,并且给定一个(无数个)无穷个点,那么它们的总和将>1>1个> 1。

21
在限制无限过程的每个步骤中,将10个球放入骨灰盒中,然后随机取出一个。还剩下几个球?
问题(稍作修改)如下,如果您从未遇到过此问题,则可以在Sheldon Ross的“ 概率论第一课 ” 的第 2章示例6a中进行检查: 假设我们拥有一个无限大的骨灰盒和一个标记为1号,2号,3号等的无数球。考虑执行以下实验:在1分钟至下午12点,将编号为1到10的球放入骨灰盒中,并随机取出一个球。(假设撤回没有时间。)在1/2分钟至下午12点,将编号为11到20的球放入骨灰盒,并随机取出另一个球。在1/4分钟到下午12点,将编号为21到30的球放入骨灰盒中,并随机取出另一个球……依此类推。感兴趣的问题是,下午12点骨灰盒里有几个球? 提出的这个问题基本上迫使每个人都弄错了-通常直觉是说在12 PM会有无数个球。Ross提供的答案是,一个one可能是空的在12 PM 在教授概率论时,这个问题就是其中的一个,很难对其进行直观的解释。 一方面,您可以尝试这样解释:“想想我在12 PM时任何球在骨灰盒上的可能性,在无限次随机抽签期间,最终将其删除。因为这对于所有球都成立,所以没有他们中的最后一个可以存在。” 但是,学生会正确地与您争论:“但是我每次要放10个球,然后移去1个球。最后不可能有零个球”。 我们能给他们解决这些矛盾直觉的最好解释是什么? 我也对这个论点持开放态度,这个问题是不恰当的,如果我们更好地表述它,“悖论”就消失了,或者对这个悖论是“纯粹是数学的”论点也持开放态度(但请尝试对此加以精确化)。

9
数值示例,以了解期望最大化
我试图很好地掌握EM算法,以便能够实现和使用它。我花了一整天的时间阅读该理论和一篇论文,其中使用EM使用来自雷达的位置信息来跟踪飞机。老实说,我认为我不完全理解基本思想。有人可以给我指出一个数值示例,该示例显示EM的几次迭代(3-4),以解决一个更简单的问题(例如估算高斯分布的参数或正弦序列的序列或拟合直线)。 即使有人可以将我指向一段代码(带有合成数据),我也可以尝试单步执行代码。


16
如果每千人中有900人说汽车是蓝色的,那么它是蓝色的概率是多少?
最初是由于我们对模型对自然文本进行分类所做的一些工作而引起的,但是我已经对其进行了简化……也许太多了。 您有一辆蓝色的汽车(通过客观的科学测量-它是蓝色的)。 您将其显示给1000个人。 900说它是蓝色的。100不。 您将此信息提供给看不见汽车的人。他们只知道900个人说它是蓝色,而100个人则不是。您对这些人(千人)一无所知。 基于此,您问人:“汽车发蓝的概率是多少?” 这引起了我所问者之间的巨大分歧!如果有的话,正确的答案是什么?
114 probability 

6
如果我有58%的机会赢得积分,那么我赢得乒乓球比赛21胜2的机会是多少?
我与一个同事打赌,在50场乒乓球比赛中(首先赢得21分,获2分),我将赢得全部50场比赛。到目前为止,我们已经打了15场比赛,平均而言,我赢了58%积分,再加上到目前为止,我已经赢得了所有比赛。所以我们想知道我是否有58%的机会赢得积分,而他是否有42%的机会赢得积分,那么我赢得比赛的几率是多少?是否有一个公式可以插入差异百分比机会? 我们到处搜索,甚至问我们公司的数据科学家,但找不到直接的答案。 编辑:哇,我对回应的彻底震惊。非常感谢大家!!!如果人们好奇,我会更新自己的下注方式:我现在已经赢了50场比赛中的18场,所以我需要再赢32场。我赢得了所有积分的58.7%,因此我的对手赢得了41.3%的积分。我对手的标准差是3.52,他的平均得分是14.83,中位数是15.50。以下是到目前为止每个游戏的得分的屏幕截图。如果人们有兴趣,我可以随时跟进更新。 编辑#2:很遗憾,我们只能再玩几局,结果如下。我将继续替换图片,因此没有一堆乐谱的屏幕截图。 最终更新:我最终在第二十八场比赛中输给了我的同事。他以21-13击败我。感谢您所有的帮助!

5
“封闭式解决方案”是什么意思?
我经常碰到“封闭式解决方案”一词。封闭式解决方案是什么意思?如何确定一个给定问题的封闭式解决方案?在网上搜索时,我发现了一些信息,但是在开发统计或概率模型/解决方案的过程中却找不到任何信息。 我对回归非常了解,因此,如果任何人都可以参考回归或模型拟合来解释这一概念,那么它将很容易使用。:)

9
一个现实生活中未来事件的可能性:当他们说“希拉里有75%的获胜机会”时,这意味着什么?
由于选举是一次性事件,因此不能重复进行实验。那么“希拉里(Hillary)有75%的获胜机会”这一说法在技术上到底意味着什么?我正在寻找一种统计上正确的定义,而不是一种直观或概念上的定义。 我是一位业余统计爱好者,他试图回答讨论中提出的这个问题。我很确定对此有一个很好的客观回应,但我本人无法提出。

3
示例:使用glmnet获得二进制结果的LASSO回归
我开始与使用的涉猎glmnet与LASSO回归那里我感兴趣的结果是二分。我在下面创建了一个小的模拟数据框: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

10
贝叶斯与频频主义者的辩论是否有任何数学基础?
它在Wikipedia上说: 数学[概率]在很大程度上与概率的任何解释无关。 问题:那么如果我们想在数学上是正确的,我们是否不应该拒绝对概率的任何解释?即,贝叶斯主义和频繁主义在数学上都是错误的吗? 我不喜欢哲学,但是我喜欢数学,并且我想只在Kolmogorov公理的框架内工作。如果这是我的目标,应该从它说在维基百科上,我应该拒绝遵循双方贝叶斯和frequentism?如果这些概念纯粹是哲学上的而不是数学上的,那么为什么它们首先出现在统计学中? 背景/上下文: 这篇博客文章并没有说同样的话,但是它确实认为,从实用主义的角度来看,将技术归类为“贝叶斯”或“频率论者”是适得其反的。 如果Wikipedia的引用是正确的,那么从哲学的角度来看,试图对统计方法进行分类似乎也适得其反-如果一种方法在数学上是正确的,则当基础数学的假设成立时使用该方法是有效的否则,如果在数学上不正确或假设不成立,则使用它无效。 另一方面,尽管我不太确定为什么,但很多人似乎都用概率论(例如,柯尔莫哥洛夫的公理)来识别“贝叶斯推论”。贾恩斯(Jaynes)关于贝叶斯推理的论着称为“概率”(Probability),以及詹姆斯·斯通(James Stone)的书“贝叶斯规则”(Bayes'Rule)。因此,如果我以表面价值来接受这些主张,那意味着我应该更喜欢贝叶斯主义。 但是,Casella和Berger的书似乎是常客,因为它讨论了最大似然估计量,却忽略了最大后验估计量,但似乎其中的所有内容在数学上都是正确的。 那么,难道不是只能从统计学上说,统计学上唯一正确的版本是对贝叶斯主义和频繁主义完全不知情的统计吗?如果两种分类的方法在数学上都是正确的,那么在某些情况下偏爱某些方法不是不正确的做法,因为这将使模糊,定义不清的哲学优先于精确且定义明确的数学吗? 简介:简而言之,我不了解贝叶斯与常客辩论的数学基础是什么,并且如果没有辩论的数学基础(这是维基百科所声称的),我也不明白为什么在容忍中全部在学术话语中。

6
概率收敛与几乎确定的收敛
我从没真正摸索过这两种收敛方法之间的区别。(或者,实际上,是任何一种不同类型的收敛,但是由于大数的弱定律和强定律,我特别提到了这两种。) 当然,我可以引用每一个的定义,并举例说明它们的不同之处,但是我仍然不太明白。 了解差异的好方法是什么?为什么差异很重要?是否有一个特别令人难忘的例子,区别在于它们?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.