Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

7
(巨大)扭曲的生日悖论:与伴侣共享完全相同的生日的可能性吗?
我的生日与男朋友的生日相同,也与同年相同,我们的出生间隔仅5个小时左右。 我知道与我同日出生的人相识的机会非常高,我认识一些与我分享生日的人,尽管就我所了解的关于生日悖论的一点了解而言,这并不需要同年考虑。我们之前已经讨论过有关概率的问题,但我仍然不满意。我的观点是,如果您考虑建立关系的可能性(+在X时间内成功实现这种关系)的机会很小。我发现需要考虑的因素非常多(一定程度上,性别和年龄,可及性,我们所在地区的分居几率等等) 甚至有可能计算出类似这样的概率吗?你会怎么做?


6
有没有中心极限定理不成立的例子?
维基百科说- 在概率论中,中心极限定理(CLT)确定,在大多数情况下,添加独立随机变量时,即使原始变量本身不存在,其适当归一化的总和仍趋于正态分布(非正式地为“钟形曲线”)。正态分布... 当它说“在大多数情况下”时,中央极限定理在哪些情况下不起作用?

8
我应该先教贝叶斯统计还是常客统计?
我正在帮助正在读中学的男孩们了解统计学,并且我正在考虑从一些简单的例子开始,而不必理会理论上的一些内容。 我的目标是给他们一种最直观但最有建设性的方法,以从头开始学习统计学,以激发他们对进一步追求统计学和定量学习的兴趣。 不过,在开始之前,我有一个特别的问题,它具有非常普遍的含义: 我们是否应该开始使用贝叶斯或常客制框架教授统计学? 到处进行研究,我发现一种常见的方法是从对常客统计学的简要介绍开始,然后再深入讨论贝叶斯统计(例如Stangl)。

2
单边切比雪夫不等式的样本版本是否存在?
我对以下单方面的Cantelli版本的Chebyshev不等式感兴趣: P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2。 \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. 基本上,如果您知道总体均值和方差,则可以计算观察到某个值的概率的上限。(至少这是我的理解。) 但是,我想使用样本均值和样本方差,而不是实际总体均值和方差。 我猜想,由于这会带来更多不确定性,因此上限会增加。 是否存在类似于上述的不等式,但是使用样本均值和方差? 编辑:Chebyshev不等式(不是单面)的“样本”类似物,已经制定出来。在维基百科页面有一些细节。但是,我不确定它将如何转化为我上面提到的单面案例。

8
这个人是女性的几率是多少?
窗帘后面有一个人-我不知道这个人是女性还是男性。 我知道这个人长发,而且所有长发中有90%是女性 我知道该人患有罕见的AX3血型,并且所有这种血型的人中有80%是女性。 这个人是女性的几率是多少? 注意:最初的配方在两个假设的基础上进行了扩展:1.血型和头发长度是独立的。2.总体人口中男性与女性的比例为50:50 (这里的具体情况不是那么重要-而是,我有一个紧急项目,要求我有正确的方法来回答这个问题。我的直觉是这是一个简单的概率问题,一个简单的确定性答案,而不是而不是根据不同的统计理论有多个值得商answers答案的事物。)



13
条件概率公式背后的直觉是什么?
给定发生的情况下发生条件概率的公式为: P \ left(\ text {A}〜\ middle |〜\ text {B} \ right)= \ frac { P \ left(\ text {A} \ cap \ text {B} \ right)} {P \ left(\ text {B} \ right)}。 乙AA\text{A}BB\text{B}P(A | B)=P(A∩B)P(B).P(A | B)=P(A∩B)P(B). P\left(\text{A}~\middle|~\text{B}\right)=\frac{P\left(\text{A} \cap \text{B}\right)}{P\left(\text{B}\right)}. 我的教科书以维恩图的形式解释了其背后的直觉。 给定BB\text{B}已经发生,\ text {A}发生的唯一方法AA\text{A}是使事件落在AA\text{A}和\ text {B}的交集处BB\text{B}。 在那种情况下,P(A|B)P(A|B)P\left(\text{A} \middle| …

2
完成FIFA Panini专辑需要几张贴纸?
我正在播放FIFA Panini在线贴纸专辑,该专辑是Internet上经典的Panini专辑的改编版,通常在足球世界杯,欧洲锦标赛以及可能的其他比赛中发行。 专辑有424个不同贴纸的占位符。游戏的目的是收集所有424个。贴纸每5个一包,可以通过在线找到的代码获得(或者,如果是经典印刷专辑,则从您当地的报摊购买)。 我做以下假设: 所有贴纸均以相同数量出版。 一包贴纸不包含重复项。 我如何才能找出需要购买多少包贴纸才能合理确定(假设是90%)我所有424个独特的贴纸?

3
将生日悖论扩展到2个人以上
在传统的“生日悖论”中,问题是“一群nnn人中的两个或两个以上的人共享生日的机会是多少”。我陷入一个问题,这是对此的扩展。 我不知道两个人分享生日的概率,而是需要扩展问题来知道xxx或更多人分享生日的概率是多少。在x=2x=2x=2您可以通过计算没有两个人分享生日并从减去生日的概率来做到这一点111,但是我认为我不能将此逻辑扩展到更大的xxx。 为了使这一点进一步复杂化,我还需要一个适用于nnn(百万)和xxx(千)的非常大数的解决方案。


3
R:尽管数据集中没有NaN,随机森林仍在“外部函数调用”错误中抛出NaN / Inf [关闭]
我正在使用插入符号在数据集上运行交叉验证的随机森林。Y变量是一个因素。我的数据集中没有NaN,Inf或NA。但是,当运行随机森林时,我得到 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs introduced by coercion 3: In data.matrix(x) : NAs introduced by …

2
Statistics.com是否发布了错误的答案?
Statistics.com发布了本周的问题: 居民保险欺诈率是10%(十分之一的请求是欺诈性的)。一位顾问提出了一种机器学习系统,以审查索赔并将其分类为欺诈或无欺诈。该系统在检测欺诈性索赔方面有90%的效率,但在正确分类非欺诈性索赔方面只有80%的效率(错误地将五分之一标记为“欺诈”)。如果系统将索赔分类为欺诈,那么它真的是欺诈的概率是多少? https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true 我和我的同伴都分别提出了相同的答案,但与发布的解决方案不符。 我们的解决方案: (.9 * .1)/((。9 * .1)+(。2 * .9))= 1/3 他们的解决方案: 这是条件概率中的问题。(这也是一个贝叶斯问题,但是在贝叶斯规则中应用该公式仅有助于掩盖正在发生的事情。)考虑100个索赔。10个是欺诈性的,系统会正确地将其中9个标记为“欺诈”。90个索赔将是正确的,但系统会将72(80%)错误地分类为“欺诈”。因此总共标记了81个索赔作为欺诈行为,但实际上只有9个(占11%)是欺诈行为。 谁是对的

3
挑逗:从统一的[0,1]分布得出的iid序列的预期长度是单调增加的吗?
这是定量分析师职位的面试问题,在此报告。假设我们从均匀的分布绘制并且绘制为iid,则单调递增分布的预期长度是多少?即,如果当前绘制小于或等于上一个绘制,我们将停止绘制。[0,1][0,1][0,1] 我得到了前几个: \ Pr (\ text {length} = 2)= \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_0 ^ {x_2} \ mathrm {d} x_3 \,\ mathrm {d} x_2 \,\ mathrm {d} x_1 = 1/3 \ Pr(\ text {length} = 3)= \ int_0 ^ 1 \ int_ {x_1} ^ …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.