Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

3
pdf和pmf以及cdf是否包含相同的信息?
pdf和pmf以及cdf是否包含相同的信息? 对我来说,pdf将整个概率提供给某个点(基本上是该概率下的面积)。 pmf给出某一点的概率。 cdf给出特定点下的概率。 因此对我来说pdf和cdf具有相同的信息,但是pmf却没有,因为它给出了分布上某一点的概率x。

3
逻辑回归和数据集结构
我希望我能以正确的方式问这个问题。我可以访问逐个播放的数据,因此,最好的方法和正确构建数据的问题更多。 我要做的是根据给定的分数和时间来计算赢得NHL比赛的概率。我认为我可以使用逻辑回归,但不确定数据集的外观。在我感兴趣的每场比赛中,每场比赛我都会有多个观察结果吗?我会每场比赛进行一次观察并在每个时间段内使用单独的模型吗?逻辑回归甚至是正确的方法吗? 您能提供的任何帮助将不胜感激! 最好的祝福。

3
您能说统计和概率就像归纳法和演绎法吗?
我已经阅读了该线程,在我看来可以这样说: 统计=归纳? 概率=扣除? 但是我想知道我所缺少的比较是否还有更多细节。例如,统计量等于归纳法,还是仅仅是其特殊情况?似乎概率是演绎的一个子案例(因为它是数学思维的一个子案例)。 我知道这是一个挑剔的问题,但是从某种意义上讲,这就是为什么我要问这个问题-因为我想确保如何准确比较这些术语。

5
两个独立的均匀随机变量之间的比率分布
Supppse XXX和YYY在标准均匀分布在[0,1][0,1][0, 1],它们是独立的,是什么的PDF Z=Y/XZ=Y/XZ = Y / X? 一些概率论教科书的答案是 fZ(z)=⎧⎩⎨1/2,1/(2z2),0,if 0≤z≤1if z>1otherwise.fZ(z)={1/2,if 0≤z≤11/(2z2),if z>10,otherwise. f_Z(z) = \begin{cases} 1/2, & \text{if } 0 \le z \le 1 \\ 1/(2z^2), & \text{if } z > 1 \\ 0, & \text{otherwise}. \end{cases} 我想知道,通过对称性,不应该fZ(1/2)=fZ(2)fZ(1/2)=fZ(2)f_Z(1/2) = f_Z(2)?根据上述PDF,情况并非如此。


1
我应该在精神上如何应对Borel的悖论?
对于在心理上如何处理Borel悖论和其他与条件概率有关的“悖论”,我感到不安。对于那些不熟悉它的人,请参阅此链接。到目前为止,我的精神反应主要是忽略它,因为似乎没有人谈论它,但是我觉得我应该纠正这一点。 我们知道这个悖论是存在的,但实际上在实践中(作为贝叶斯分析的一个极端例子),对于条件为事件,我们是完全可以的。如果是我的数据,我们条件对所有的时间,即使这是衡量一个事件时是连续的。而且,我们当然不花力气构造一系列事件,收敛到我们观察到的解决矛盾的事件,至少没有明确地。X X = x 0 X000XXXX=xX=xX = x000XXX 我认为这是可以的,因为在实验之前我们已经固定了随机变量(原则上),因此我们以为条件。也就是说,是自然的代数,因为信息将通过来使用-如果信息以其他方式传给我们,我们将以不同的 -代数。Borel的悖论之所以出现是因为(我猜)要适应的代数尚不清楚,但是贝叶斯方法已指定。因为我们指定的是先验信息σ (X )σ (X )σ X = X X σ σ σ (X )X = XXXXσ(X)σ(X)\sigma(X)σ(X)σ(X)\sigma(X)σσ\sigmaX=xX=xX = xXXXσσ\sigmaσσ\sigmaσ(X)σ(X)\sigma(X)X=xX=xX = x是通过测量XXX得出的。一旦指定了代数,一切都会好起来;我们使用Radon-Nikodym构造我们的条件期望,并且所有事物都是唯一的直至空集。σσ\sigma 这本质上是正确的,还是我离开了?如果我的路要走,什么是对行为,因为我们做的理由?[考虑到该站点的问与答性质,将其视为我的问题。]当我采用测度理论概率时,由于某种我不了解的原因,我们甚至从未触及过有条件的期望。结果,我担心我的想法很混乱。

1
力矩产生功能与特征功能之间的联系
我试图理解力矩产生函数和特征函数之间的联系。矩生成函数定义为: MX(t)=E(exp(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n!MX(t)=E(exp⁡(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n! M_X(t) = E(\exp(tX)) = 1 + \frac{t E(X)}{1} + \frac{t^2 E(X^2)}{2!} + \dots + \frac{t^n E(X^n)}{n!} 使用,我可以找到随机变量分布的所有时刻X。exp(tX)=∑∞0(t)n⋅Xnn!exp⁡(tX)=∑0∞(t)n⋅Xnn!\exp(tX) = \sum_0^{\infty} \frac{(t)^n \cdot X^n}{n!} 特征函数定义为: φX(t)=E(exp(itX))=1+itE(X)1−t2E(X2)2!+…+(it)nE(Xn)n!φX(t)=E(exp⁡(itX))=1+itE(X)1−t2E(X2)2!+…+(it)nE(Xn)n! \varphi_X(t) = E(\exp(itX)) = 1 + \frac{it E(X)}{1} - \frac{t^2 E(X^2)}{2!} + \ldots + \frac{(it)^n E(X^n)}{n!} 我不完全了解为我带来的虚数信息。我看到,因此特征函数中不只有,但是为什么我们需要在特征函数中减去矩?数学思想是什么?iiii2=−1i2=−1i^2 = -1+++

1
随机变量及其分布的符号约定
我对正确的含义符号以及与随机变量及其分布有关的某些符号的含义感到困惑。在下面,我将列出我认为是正确的事情以及我不理解的事情,我会喜欢输入/更正。为了方便参考,我在每个问题/问题上都标了一个数字。如果在这样的单个问题中列出项目不合适,请告诉我。我以为可以,因为它们都很矮。 随机变量由一个大写字母,如记谱XXX。 对随机变量进行的运算是什么意思?(例如,您如何用词解释X 2X2X^2?)。 来自随机变量的特定绘图用小写字母(例如x)或带下标(例如x 1)的小写字母或带数字(例如X 1)的大写数字表示。xxx1x_1X1X_1 从随机变量X提取的n的k t h阶统计量的随机变量记为X k n。kthkthnnXXXknX_{kn} 是否有一种简便的方式写“ X是由F(x)分配的随机变量(或“ cdf F(x)”或“ B(a,b)”或任何表征分布的方式)”? 我可以写出E F (x )来表示根据F (xEF(x)\mathbb{E}F(x))吗?F(x)F(x) 如果我在变量X的累积分布函数进行操作,例如,˚F Ñ È 瓦特(X )= ˚F Ö 升d(X )2,以获得最大的2从绘制的CDF X,我可以谱写,在计X不知何故?Fnew(x)=Fold(x)2F_{new}(x) = F_{old}(x)^2XXXX 是简洁写出F 2(x )或F (x )2的(F (x ))2的适当方法(F(x))2(F(x))^2F2(x)F^2(x)F(x)2F(x)^2? 离散变量和连续变量之间在符号上有区别吗?

4
累积危害函数的直觉(生存分析)
我试图对精算科学的每个主要功能(特别是对于Cox比例危害模型)有所了解。这是我到目前为止的内容: f(x)f(x)f(x):从开始的时间开始,到您死亡的概率分布。 F(x)F(x)F(x):仅累积分布。在时间TTT,将有百分之几的人口死亡? S(x)S(x)S(x):1−F(x)1−F(x)1-F(x)。在时间TTT,人口中还活着的百分比是多少? h(x)h(x)h(x):危险函数。在给定的时间TTT,仍然活着的人中,这可以用来估计在下一个时间间隔内将有多少人死亡,或者如果时间间隔-> 0,则是“瞬时”死亡概率。 H(x)H(x)H(x):累积危害。不知道。 组合危险值(尤其是连续危险值)的背后是什么想法?如果我们使用一个离散的例子来说明四个季节的死亡率,那么危害函数如下: 从春季开始,每个人都还活着,有20%会死亡 现在在夏天,剩下的人中有50%会死 现在在秋天,剩下的人中有75%将死 最后的季节是冬天。在剩下的人中,有100%将死 那么累积危害是20%,70%,145%,245%?这是什么意思,为什么有用?

2
哪种分布形式产生“毕达哥拉斯的期望”?
令和是由相同的未指定分布形式生成的独立连续随机变量,但允许使用不同的参数值。我感兴趣的是找到一种参数分布形式,对于所有允许的参数值,其以下采样概率均适用:ý 〜DIST (θ Ý)X〜距离(θX)X〜距离(θX)X \sim \text{Dist}(\theta_X)ÿ〜距离(θÿ)ÿ〜距离(θÿ)Y \sim \text{Dist}(\theta_Y) P(X> Y| θX,θÿ)= θ2Xθ2X+ θ2ÿ。P(X>ÿ|θX,θÿ)=θX2θX2+θÿ2。\mathbb{P}(X > Y| \theta_X, \theta_Y) = \frac{\theta_X^2}{\theta_X^2 + \theta_Y^2}. 我的问题:谁能告诉我这适合的连续分布形式?是否有导致这种情况的(非平凡的)一般条件? 我的初步想法:如果将两个参数乘以任何非零常数,则概率保持不变,因此是某种比例参数是有意义的。θθ\theta

6
我怎么能发现正态分布?
什么是正态分布的第一个推导,您能否重现该推导并在其历史背景下进行解释? 我的意思是,如果人类忘记了正态分布,那么我最有可能重新发现它的方式是什么,最可能的推导是什么?我猜想最初的推导一定是作为尝试寻找快速方法来计算基本离散概率分布(例如二项式)的副产品而来的。那是对的吗?

1
离散均匀分布中未替换的样本之间的最大间隙
这个问题与我实验室对机器人覆盖率的研究有关: 随机绘制Ñnn从组数字{ 1 ,2 ,... ,米}{1,2,…,m}\{1,2,\ldots,m\}无需更换,并以升序排序的数字。 。1 ≤ Ñ ≤ 米1≤n≤m1\le n\le m 从此排序的数字,生成连续数字和边界之间的差:。这给出了间隙。{ 一(1 ),一个(2 ),... ,一个(Ñ ) } {a(1),a(2),…,a(n)}\{a_{(1)},a_{(2)},…,a_{(n)}\}克= { 一(1 ),一个(2 ) - 一(1 ),... ,一个(Ñ ) - 一(ñ - 1 ),m + 1 - a (n ) } g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g = \{a_{(1)},a_{(2)}−a_{(1)},\ldots,a_{(n)}−a_{(n-1)},m+1-a_{(n)}\}n +1个n+1n+1 最大差距的分布是什么? P (max (g …

2
中心极限定理的动力学系统观点?
(最初发布于MSE。) 我已经看到许多关于经典中心极限定理的启发式讨论,都把正态分布(或任何稳定分布)说成是概率密度空间中的“吸引子”。例如,在Wikipedia的治疗方法顶部考虑以下句子: 在更一般的用法中,中心极限定理是概率论中一组弱收敛定理中的任何一个。他们都表达了这样一个事实,即许多独立且均匀分布的(iid)随机变量的总和,或者具有特定依赖类型的随机变量将倾向于根据一小部分吸引子分布进行分布。当iid变量的方差是有限的时,吸引子分布为正态分布。 这种动态系统语言很有启发性。费勒在第二卷中对CLT的处理中也提到了“吸引力”(我想知道这是否是该语言的来源),而本笔记中的尤瓦尔·弗利姆斯(Yuval Flimus)甚至谈到了“吸引力盆地”。(我不认为他的意思是“ 事先可以推断出吸引盆的确切形式”,而是“ 事先可以推断出吸引子的确切形式”;但是,语言在那里。)我的问题是:这些可以吗?动态类比可以精确吗?我不知道它们在哪本书中-尽管许多书确实强调了正态分布对于卷积下的稳定性(以及傅立叶变换下的稳定性)是特殊的。这基本上告诉我们,法线很重要,因为它是一个固定点。CLT进一步发展,告诉我们这不仅是一个固定点,而且是吸引子。 为了使此几何图形精确,我假设将相空间作为一个合适的无限维函数空间(概率密度的空间),并将演化算子与初始条件重复卷积。但是我不知道使这张照片起作用的技术性或是否值得追求。 我猜想,因为我找不到确实可以明确采用这种方法的治疗方法,所以我认为这是可以做的或者很有趣,这肯定存在一些错误。如果是这样,我想听听为什么。 编辑:在整个Math Stack Exchange和MathOverflow中,读者可能会对三个类似的问题感兴趣: 高斯分布作为某些分布空间(MO)中的固定点 通过最大熵(MO)的中心极限定理 是否有通过某些不动点定理证明中心极限定理?(MSE)

7
再谈两个信封问题
我在想这个问题。 http://en.wikipedia.org/wiki/Two_envelopes_problem 我相信该解决方案,并且我认为我理解它,但是如果采用以下方法,我将感到完全困惑。 问题1: 我将为您提供以下游戏。您付给我10 美元,我会掷一枚公平的硬币。头部给我5 美元,尾巴给我20 美元。 期望是12.5 美元,因此您将始终可以玩游戏。 问题2: 我会给你一个10 美元的信封,信封已经打开,你可以检查一下。那么我告诉你一个信封,关闭,这个时候,告诉你:这个信封或者具有$ 5或以相同的概率$ 20吧。您要交换吗? 我觉得这与问题1完全一样,您放弃了$ 10换了$ 5或$ 20,所以再次您总是会切换。 问题三: 我做与上述相同,但是请关闭信封。因此,您不知道有10美元,但有多少X。我告诉您另一个信封有两倍或一半。现在,如果您遵循相同的逻辑,则要切换。这就是信封悖论。 我打开信封后发生了什么变化? 编辑: 有些人认为问题3并不是信封问题,我将尝试通过分析每个人对游戏的看法,在下面提供我认为为什么的问题。而且,它为游戏提供了更好的设置。 为问题3提供一些澄清: 从组织游戏的人的角度来看: 我拿着两个信封。我合上了一张10 美元的货币,将其交给玩家。然后我告诉他,我还有一个信封,是我刚给你的信封的两倍或一半。您要切换吗?然后,我继续掷出一枚公平的硬币,往正面扔了5 美元,向尾摆放了 20 美元,然后递给他信封。然后我问他。您刚给我的信封是您所持信封的两倍或一半。您要切换吗? 从玩家的角度来看: 我得到一个信封,并告诉我还有另一个信封,信封的数量是其概率的两倍或一半。我要切换吗?我认为我有XXX,因此12(12X+2X)>X12(12X+2X)>X\frac{1}{2}(\frac{1}{2}X + 2X) > X所以我想切换。我得到了信封,突然之间我面临着完全相同的情况。我想再次切换,因为另一个信封的数量是原来的两倍或一半。

4
是否有法律规定如果您进行足够的试验,就会发生罕见的事情?
我正在尝试制作有关已加载的骰子的视频,在视频中的某一点上,我们掷出约200个骰子,将所有的六个骰子再次掷出,然后将所有的六个骰子掷出并第三次掷出。我们有一个骰子连续3次出现6次,这显然并不稀奇,因为应该有1/216的机会发生,我们有大约200个骰子。那么我该如何解释这并不稀奇呢?似乎不太像大数定律。我想说的是“如果您进行足够的测试,甚至不可能发生的事情”,但是我的伴侣说人们可能会对“绑定到”术语持怀疑态度。 有没有表达这种概念的标准方法?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.