Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

4
一堆飞机事故有多奇怪?
原始问题(14/7/25):新闻媒体的这句话是否有意义,或者是否有更好的统计方法来查看最近发生的飞机意外事件? 但是,巴内特(Barnett)也提请注意泊松分布的理论,这意味着两次碰撞之间的短暂间隔实际上比长时间碰撞更可能发生。 巴内特说:“假设每年平均发生一次致命事故,这意味着在任何一天发生车祸的可能性是365分之一。” “如果8月1日发生崩溃,则下次崩溃发生在8月2日一天之后的机会是1/365。但是下次崩溃发生在8月3日发生的机会是(364/365)x(1/365) ,因为只有在8月2日没有崩溃的情况下,下一次崩溃才会在8月3日发生。” 巴内特说:“这似乎是违反直觉的,但结论是无条件地根据概率定律得出的。” 资料来源:http : //www.bbc.com/news/magazine-28481060 说明性(14/7/27):(对我而言)反直觉的是,罕见事件往往会在很短的时间内发生。凭直觉,我认为罕见事件不会及时发生。有人能指出泊松分布假设下事件之间时间的理论或经验预期分布吗?(即,直方图,其中y轴是频率或概率,x轴是两次连续出现之间的时间,分为2天,数周,数月或数年等。)谢谢。 澄清(7/28/14):标题暗示比起广泛分布的事故,它更有可能发生事故簇。让我们对其进行操作。假设一个集群是3起飞机事故,短时间是3个月,长时间是3年。认为在3个月内发生3次事故的可能性比3年内发生事故的可能性更高,这似乎是不合逻辑的。即使我们将第一起事故定为自然事件,但认为未来3个月内与未来3年内还会再发生2起事故是不合逻辑的。如果这是真的,那么新闻媒体的标题就是误导和不正确的。我想念什么吗?

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
两个独立随机变量的乘积
我有大约1000个值的样本。这些数据是从两个独立的随机变量的乘积获得的ξ∗ψξ∗ψ\xi \ast \psi 。所述第一随机变量具有均匀分布ξ∼U(0,1)ξ∼U(0,1)\xi \sim U(0,1)。第二随机变量的分布未知。如何估算第二个(ψψ \psi )随机变量的分布?

2
通过掷硬币来组合分类器
我正在学习机器学习课程,并且讲义幻灯片包含的信息与我推荐的书不符。 问题如下:存在三个分类器: 分类器A在较低的阈值范围内提供更好的性能, 分类器B在较高的阈值范围内提供更好的性能, 分类器C我们通过翻转p硬币并从两个分类器中进行选择来获得什么。 从ROC曲线上看,分类器C的性能如何? 演讲幻灯片指出,只需翻转硬币,我们就可以得到分类器A和B的ROC曲线的神奇“ 凸包 ”。 我不明白这一点。仅仅通过掷硬币,我们如何获得信息? 演讲幻灯片 这本书怎么说 推荐的书(《数据挖掘...》,作者:伊恩·H·威腾(Ian H. Witten),艾比·弗兰克(Eibe Frank)和马克·A。另一方面,)指出: 要看到这一点,请为方法A选择一个特定的概率临界值,分别给出真实的和错误的正比率tA和fA,为方法B选择另一个临界值,给出tB和fB。如果您以概率p和q随机使用这两种方案,其中p + q = 1,那么您将获得p的真假率。tA + q tB和p。fA + q fB。这表示位于连接点(tA,fA)和(tB,fB)的直线上的点,并且通过改变p和q可以找出这两个点之间的整条线。 以我的理解,这本书所说的是要真正获得信息并到达凸包,我们需要做的事情比简单地抛掷p硬币还要先进。 AFAIK,正确的方法(如书中所建议的)如下: 我们应该找到分类器A的最佳阈值Oa 我们应该找到分类器B的最佳阈值Ob 将C定义如下: 如果t <Oa,则将分类器A与t一起使用 如果t> Ob,则将分类器B与t一起使用 如果Oa <t <Ob,则用概率作为我们在Oa和Ob之间的线性组合,在带Oa的分类器A和带Ob的B之间进行选择。 它是否正确?如果是,则与幻灯片建议的内容有一些主要差异。 这不是简单的掷硬币,而是一种更高级的算法,该算法需要根据我们所处的区域手动定义点和拾取。 它永远不会使用阈值介于Oa和Ob之间的分类器A和B。 你能给我解释一下这个问题,什么是正确的理解方式,如果我的理解是不正确的? 如果我们像幻灯片所示那样简单地翻转p硬币,将会发生什么?我认为我们会得到一个介于A和B之间的ROC曲线,但是在给定的点上永远不会比更好的ROC曲线“更好”。 据我所知,我真的不理解幻灯片的正确性。左侧的概率计算对我来说没有意义。 更新: 找到了发明凸包方法的原始作者写的文章:http : //www.bmva.org/bmvc/1998/pdf/p082.pdf


3
如何估计一个总体中的随机成员比另一个总体中的随机成员“更好”的概率?
假设我从两个不同的人群中取样。如果我测量每个成员完成一项任务需要多长时间,则可以轻松估算每个总体的均值和方差。 如果我现在假设与每个人口中的一个人进行随机配对,我是否可以估计第一个比第二个更快的概率? 我确实有一个具体的例子:这些测量值是我从A骑自行车到B的时间,这些人群代表我可以采取的不同路线;我正在尝试找出下一个循环的拾取路线A的速度比拾取路线B更快的概率。当我实际执行该循环时,我为我的样品组设置了另一个数据点:)。 我知道这是尝试解决此问题的一种极其简单的方法,尤其是因为在任何一天,风比其他任何时间都更可能影响我的时间,所以请告诉我您是否认为我在问错误的问题...


4
期望值与最可能值(模式)
分布的期望值是平均值,即加权平均值 f(x)f(x)f(x)E[x]=∫+∞−∞xf(x)dxE[x]=∫−∞+∞xf(x)dxE[x]=\int_{-\infty}^{+\infty} x \, \, f(x) dx 最可能的值是众数,即最可能的值。 但是,我们期望以某种方式看到很多次吗?从这里报价:E[x]E[x]E[x] 如果结果的概率不相等,则必须用加权平均值代替简单的平均值,这要考虑到某些结果比其他结果更有可能的事实。然而,直觉保持不变:x的期望值是人们期望平均发生的值。xixix_ixxx 我不明白“平均发生”是什么意思,这是否意味着,从长远来看,我希望花很多时间才能看到E[x]E[x]E[x]比x的其他值更多xxx?但这不是模式的定义吗? 那么如何解释该陈述?E [x]的概率含义是E[x]E[x]E[x]什么? 我还想举个例子,让我感到困惑。通过研究分布,我了解到模式 为,而,其中是数据的自由度。χ2χ2\chi^2χ2mode=ν−2χmode2=ν−2\chi^2_{mode}=\nu-2E[χ2]=νE[χ2]=νE[\chi^2]=\nuνν\nu 我在大学听说,在使用最小二乘法拟合一组数据后进行测试时,我应该期望得到因为“这通常会发生”。χ 2听,说:νχ2χ2\chi^2χ2≈νχ2≈ν\chi^2 \approx \nu 我是否误解了所有这些,或者期望值是否很有可能?(即使最可能的值当然是模式)

2
马尔可夫链与马尔可夫链蒙特卡洛之间有什么联系
我正在尝试使用SAS了解马尔可夫链。我了解到,马尔可夫过程是未来状态仅取决于当前状态而不取决于过去状态的过程,并且存在一个转移矩阵来捕获从一种状态到另一种状态的转移概率。 但是后来我碰到了这个术语:Markov Chain Monte Carlo。我想知道的是,马尔可夫链蒙特卡洛是否与我上面描述的马尔可夫过程有关?



4
确定性世界中的机会运作
在史蒂文·平克(Steven Pinker)的书《我们的天性更好的天使》中,他指出 概率是一个透视问题。在足够近的范围内观察,个别事件具有确定的原因。甚至可以从起始条件和物理定律预测出掷硬币的情况,熟练的魔术师每次都可以利用这些定律投头。但是,当我们进行放大以对大量此类事件进行广角观察时,我们会看到大量原因的总和,这些原因有时相互抵消,有时沿同一方向排列。物理学家和哲学家亨利·庞加莱(Henri Poincare)解释说,当大量的微不足道的原因加在一起产生可怕的影响,或者当一个小的原因未能引起我们注意时,我们便会在确定性世界中看到机会的运作,而​​我们无法错过。如果是有组织的暴力,可能有人会发动战争;他等待机会的时刻,可能会或可能不会到来;他的敌人决定参与或撤退;子弹飞 炸弹爆炸;人们死了。每个事件都可以由神经科学,物理学和生理学定律确定。但是,总的来说,进入此矩阵的许多原因有时可以改组为极端组合。(第209页) 我对加粗的句子特别感兴趣,但其余内容供我参考。我的问题是:是否有统计学方法描述Poincare描述的两个过程?这是我的猜测: 1)“大量微不足道的影响加起来令人震惊。” 我听到的“大量原因”和“累加”就像中心极限定理。但是,在CLT(的经典定义)中,原因需要是随机变量,而不是确定性影响。这里的标准方法是将这些确定性效应近似为某种随机变量吗? 2)“忽略我们的一个小原因决定了我们不能错过的一个大影响。” 在我看来,您可以将其视为某种隐藏的马尔可夫模型。但是,HMM中的(不可观察到的)状态转换概率就是那个概率,根据定义,它还是不确定的。


2
贝叶斯定理中的归一化常数
Pr(data)Pr(data)\Pr(\textrm{data}) Pr(parameters∣data)=Pr(data∣parameters)Pr(parameters)Pr(data)Pr(parameters∣data)=Pr(data∣parameters)Pr(parameters)Pr(data)\Pr(\text{parameters} \mid \text{data}) = \frac{\Pr(\textrm{data} \mid \textrm{parameters}) \Pr(\text{parameters})}{\Pr(\text{data})} 被称为归一化常数。到底是什么 目的是什么?为什么看起来像Pr(data)Pr(data)\Pr(data)?为什么不取决于参数?

5
比贝叶斯主义有更多的可能性吗?
作为一个物理专业的学生,​​我大概经历了六次“为什么我是贝叶斯”的演讲。总是一样的-主持人自鸣得意地解释了贝叶斯解释如何优于大众所称的常客主义解释。他们提到了贝叶斯规则,边缘化,先验和后验。 真实的故事是什么? 是否有适用于常客统计数据的合法适用范围?(肯定要多次采样或滚动模具吗?) 除了“贝叶斯”和“频率论者”之外,还有没有其他有用的概率论?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.