Questions tagged «probability»

概率提供了特定事件可能发生的定量描述。

2
Iid Gamma变量的总和
令为具有概率密度函数的独立且均匀分布的随机变量的序列; 显示X1,X2,…X1,X2,…X_1,X_2,\ldotsf(x)={12x2e−x0if x>0;otherwise.f(x)={12x2e−xif x>0;0otherwise. f(x) = \left\{ \begin{array}{ll} \frac{1}{2}x^2 e^{-x} & \mbox{if $x>0$};\\ 0 & \mbox{otherwise}.\end{array} \right. limn→∞P[X1+X2+…+Xn≥3(n−n−−√)]≥12limn→∞P[X1+X2+…+Xn≥3(n−n)]≥12\lim_{n\to \infty} P[X_1+X_2+\ldots+X_n\ge 3(n-\sqrt{n})] \ge \frac{1}{2} 我尝试过的 乍一看,我认为应该使用切比雪夫不等式,因为问题是要求显示下限X1+X2+…+XnX1+X2+…+XnX_1+X_2+\ldots +X_n。但是,我想到了极限符号,该符号清楚地表明该问题可能与中央极限定理(CLT)有关 令Sn=X1+X2+…+XnSn=X1+X2+…+XnS_n=X_1+X_2+\ldots +X_n E(Sn)=∑i=0nE(Xi)=3n (since E(Xi)=3)V(Sn)=∑i=0nV(Xi)=3n (since V(Xi)=3 and Xi are i.i.d)E(Sn)=∑i=0nE(Xi)=3n (since E(Xi)=3)V(Sn)=∑i=0nV(Xi)=3n (since V(Xi)=3 and Xi are i.i.d)E(S_n)=\sum_{i=0}^{n} E(X_i)=3n \ (\text{since } E(X_i)=3) …

3
模具100卷没有面孔出现超过20次
我正在努力解决这个问题。 模具被轧制100次。没有面孔出现超过20次的概率是多少?我的第一个想法是使用二项分布P(x)= 1-6 cmf(100,1/6,20),但这显然是错误的,因为我们对某些情况进行了多次计算。我的第二个想法是枚举所有可能的滚动x1 + x2 + x3 + x4 + x5 + x6 = 100,使得xi <= 20并将多项式求和,但这似乎计算量很大。近似解决方案也将对我有用。

5
为什么我们拒绝0.05级而不是0.5级的原假设(就像我们在分类中所做的那样)
假设检验类似于分类问题。可以这么说,对于观察(主题),我们有2个可能的标签-有罪与无罪。令“非罪”为原假设。如果我们从分类的观点来看问题,我们将训练一个分类器,该分类器在给定数据的情况下预测受试者属于这两个分类中的每一个的概率。然后,我们将选择概率最高的类别。在那种情况下,0.5的概率将是自然阈值。如果我们将不同的成本分配给误报与误报错误,我们可能会更改阈值。但是很少有我们会极端地将阈值设置为0.05,即仅在概率为0.95或更高的情况下才将主体分配为“有罪”类别。但是如果我了解得很好,当我们将相同的问题视为假设检验的问题时,这就是我们作为标准实践所做的事情。在后一种情况下,仅当“非罪犯”的概率小于5%时,我们才不会分配标签“非罪犯”(等同于分配标签“有罪”)。如果我们真正想避免对无辜者定罪,也许这可能是有道理的。但是,为什么在所有领域和所有情况下都应遵循此规则? 确定采用哪种假设等同于在给定数据的情况下定义真相的估计量。在最大似然估计中,我们接受给定数据的可能性更高的假设-尽管绝对可能性更大,但不一定。参见下图: 如果预测变量的值大于3(例如4),则使用最大似然方法在此示例中我们会偏爱替代假设,尽管从零假设得出该值的可能性将大于0.05。 虽然我开始撰写该帖子的示例可能会引起感慨,但我们可以想到其他情况,例如技术改进。当数据告诉我们新解决方案是一种改进的可能性大于非新解决方案的可能性时,为什么要对状态现状给予这样的优势?



3
学习应用概率的好书?
我正在寻找一本书,该书对概率论进行了深入而严格的介绍,但重点是在数学系以外最有用的材料。我听说过“概率论:探索和应用”非常不错,但是我想提出其他建议。 例如,阿奇姆·克兰克(Achim Klenke)的书对我来说太过分了……它是为证明定理而组织的,而据我所知,它并不是应用程序。同样,我也不喜欢杜雷特的书,也不喜欢比林斯利或费勒...再一次,太过关注数学研究了。

3
另一个中心极限定理问题
令为具有的独立伯努利随机变量序列 设置 表明在分布上收敛于标准正态变量因为趋于无穷大。P { X ķ = 1 } = 1 - P { X ķ = 0 } = 1{Xn:n≥1}{Xn:n≥1}\{X_n:n\ge1\}Sn= n ∑ k=1(Xk−1P{Xk=1}=1−P{Xk=0}=1k.P{Xk=1}=1−P{Xk=0}=1k.P\{X_k=1\}=1-P\{X_k=0\}=\frac{1}{k}.小号ÑSn=∑k=1n(Xk−1k), B2n=∑k=1nk−1k2Sn=∑k=1n(Xk−1k), Bn2=∑k=1nk−1k2S_n=\sum^{n}_{k=1}\left(X_k-\frac{1}{k}\right), \ B_n^2=\sum^{n}_{k=1}\frac{k-1}{k^2} žÑSnBnSnBn\frac{S_n}{B_n}ZZZnnn 我的尝试是使用Lyapunov CLT,因此我们需要显示存在一个,使得 δ>0δ>0\delta>0limn→∞1B2+δn∑k=1nE[|Xk−1k|2+δ]=0.limn→∞1Bn2+δ∑k=1nE[|Xk−1k|2+δ]=0.\lim_{n\rightarrow \infty}\frac{1}{B_n^{2+\delta}}\sum_{k=1}^{n}E[|X_k-\frac{1}{k}|^{2+\delta}]=0. 因此设置δ=1δ=1\delta=1∑k=1nE∣∣Xk−k−1∣∣3=∑k=1n(1k−3k2+4k3−2k4)∑k=1nE|Xk−k−1|3=∑k=1n(1k−3k2+4k3−2k4) \sum_{k=1}^{n}E\left|X_k-k^{-1}\right|^{3}=\sum_{k=1}^{n} \left(\frac{1}{k}-\frac{3}{k^2}+\frac{4}{k^3}-\frac{2}{k^4}\right) 和 B3n=(∑k=1n1k−1k2)(∑k=1n1k−1k2)−−−−−−−−−−−−⎷Bn3=(∑k=1n1k−1k2)(∑k=1n1k−1k2) B_n^3=\left( \sum_{k=1}^n \frac{1}{k}-\frac{1}{k^2} \right) \sqrt{\left( \sum_{k=1}^n \frac{1}{k}-\frac{1}{k^2} \right)} 通过在计算机上评估大n,它显示∑nk=1E|Xk−k−1|3→∞∑k=1nE|Xk−k−1|3→∞\sum_{k=1}^{n}E|X_k-k^{-1}|^{3} \to \infty和B3n→∞Bn3→∞B_n^3 \to …


3
可视化二元二项分布
问题:二元二项分布在3维空间中是什么样的? 下面是我想针对各种参数值可视化的特定功能;即,和。p 1 p 2nnnp1p1p_{1}p2p2p_{2} f(x1,x2)=n!x1!x2!px11px22,x1+x2=n,p1+p2=1.f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.f(x_{1},x_{2}) = \frac{n!}{x_{1}!x_{2}!}p_{1}^{x_{1}}p_{2}^{x_{2}}, \qquad x_{1}+x_{2}=n, \quad p_{1}+p_{2}=1. 注意,有两个约束;和。另外,是一个正整数,例如。p 1 + p 2 = 1 n 5x1+x2=nx1+x2=nx_{1}+x_{2}=np1+p2=1p1+p2=1p_{1}+p_{2}=1nnn555 在使用LaTeX(TikZ / PGFPLOTS)进行了两次绘图功能的尝试。这样做,我得到以下图形的以下值:,和以及,和分别为。我尚未成功实现对域值的约束;,所以我有些困惑。p 1 = 0.1 p 2 = 0.9 n = 5 p 1 = 0.4 p 2 = 0.6 x 1 + x 2 = nn=5n=5n=5p1=0.1p1=0.1p_{1}=0.1p2=0.9p2=0.9p_{2}=0.9n=5n=5n=5p1=0.4p1=0.4p_{1}=0.4p2=0.6p2=0.6p_{2}=0.6x1+x2=nx1+x2=nx_{1}+x_{2}=n 用任何语言生成的可视化效果都很好(R,MATLAB等),但是我正在使用TikZ …


4
如何使用概率论选择退出公共汽车队列还是留在那里?
我已经思考了一段时间了,由于我不太精通概率论,所以我认为这可能是一个问这个问题的好地方。在长途公共交通中,这是我想到的。 假设您在汽车站,并且知道将来(白天)肯定会有一辆(或多辆)公共汽车,但您不知道确切的时间。您想象公交车将在五分钟内到达的可能性。因此,您等待五分钟。但是公共汽车没有到。现在该概率是否小于或大于您想象的原始概率? 问题是,如果您使用过去来预测未来,也许您对公交车的到来不会很乐观。但是也许您还可以认为,这实际上使事件更有可能发生:由于公交车尚未到达,因此当天的可用时间更少,因此发生的可能性更高。 想一想一天的最后五分钟。您整天都去过那里,没有公共汽车来过。因此,仅从过去来看,您无法预测公交车将在接下来的五分钟内到达。但是,由于您确定公交车会在一天结束之前到达,并且一天只有五分钟,因此您可以100%确保公交车会在五分钟内到达。 因此,问题是,如果我要计算概率并退出队列,应该使用哪种方法?这是因为有时我退出,然后突然公交车到了,但是有时我又等待又等待,而公交车没有来。还是整个问题都是胡说八道,那简直是随机的?

1
GLM中有多少个分布?
我在教科书中确定了多个位置,其中用5种分布(即Gamma,Gaussian,Binomial,Inverse Gaussian和Poisson)描述了GLM。R中的族函数也对此进行了举例说明。 有时,我会遇到对GLM的引用,其中包括其他发行版(示例)。有人可以解释为什么这5个特殊或始终在GLM中出现,但有时其他情况如此吗? 根据我到目前为止的了解,指数族中的GLM分布都适合以下形式: 其中是色散参数,而是规范参数。φθf(y;θ,ϕ)=exp{yθ−b(θ)ϕ+c(y,ϕ)}f(y;θ,ϕ)=exp⁡{yθ−b(θ)ϕ+c(y,ϕ)}f(y;\theta,\phi)=\exp\left\{\frac{y\theta-b(\theta)}{\phi}+c(y,\phi)\right\}ϕϕ\phiθθ\theta 不能对任何发行版进行转换以使其适合GLM吗?

2
Python中的QQ图
我使用以下代码生成了一个qq图。我知道qq图用于检查数据是否正常分布。我的问题是x和y轴标签在qq图中指示什么,r平方值指示什么? N = 1200 p = 0.53 q = 1000 obs = np.random.binomial(N, p, size = q)/N import scipy.stats as stats z = (obs-np.mean(obs))/np.std(obs) stats.probplot(z, dist="norm", plot=plt) plt.title("Normal Q-Q plot") plt.show() 我知道已经有关于qq图的讨论,但是尽管进行了讨论,但我无法理解的概念。

3
I型和II型错误的概率是否负相关?
在我作为助教的基础统计课上,这位教授说,随着I型错误的概率增加,II型错误的概率降低,反之亦然。因此,这向我表明。αα\alphaββ\betaρα ,β&lt; 0ρα,β&lt;0\rho_{\alpha, \beta} < 0 但是对于一般的假设检验,如何证明这一点呢?总体而言,该说法是否正确? 我可以尝试一个特定的情况(例如和),但是显然,这不足以解决这个问题。H0:μ = μ0H0:μ=μ0H_0: \mu = \mu_0H1个:μ &lt; μ0H1个:μ&lt;μ0H_1: \mu < \mu_0

1
使用多元正态和协变量的贝叶斯建模
假设您有一个解释变量,其中表示给定坐标。您还具有一个响应变量。现在,我们可以将两个变量组合为:X=(X(s1),…,X(sn))X=(X(s1),…,X(sn)){\bf{X}} = \left(X(s_{1}),\ldots,X(s_{n})\right)sssY=(Y(s1),…,Y(sn))Y=(Y(s1),…,Y(sn)){\bf{Y}} = \left(Y(s_{1}),\ldots,Y(s_{n})\right) W(s)=(X(s)Y(s))∼N(μ(s),T)W(s)=(X(s)Y(s))∼N(μ(s),T){\bf{W}}({\bf{s}}) = \left( \begin{array}{ccc}X(s) \\ Y(s) \end{array} \right) \sim N(\boldsymbol{\mu}(s), T) 在这种情况下,我们只需选择μ(s)=(μ1μ2)Tμ(s)=(μ1μ2)T\boldsymbol{\mu}(s) = \left( \mu_{1} \; \; \mu_{2}\right)^{T},TTT是一个协方差矩阵,描述了XXX和Y之间的关系YYY。这只能说明价值XXX和YYY在sss。由于我们从XXX和Y的其他位置获取了更多点YYY,因此可以通过以下方式描述{\ bf {W}}(s)的更多值W(s)W(s){\bf{W}}(s): (XY)=N((μ11μ21),T⊗H(ϕ))(XY)=N((μ11μ21),T⊗H(ϕ))\left( \begin{array}{ccc} {\bf{X}} \\ {\bf{Y}} \end{array}\right) = N\left(\left(\begin{array}{ccc}\mu_{1}\boldsymbol{1}\\ \mu_{2}\boldsymbol{1}\end{array}\right), T\otimes H(\phi)\right) 您会注意到,我们重新排列了XX\bf{X}和\ bf {Y}的组件,YY\bf{Y}以将所有X(si)X(si)X(s_i)放在一列中,然后将所有Y(s_i)串联Y(si)Y(si)Y(s_i)在一起。每个分量H(ϕ)ijH(ϕ)ijH(\phi)_{ij}是一个相关函数ρ(si,sj)ρ(si,sj)\rho(s_i, s_j),TTT等于上述值。之所以具有协方差T⊗H(ϕ)T⊗H(ϕ)T\otimes H(\phi)是因为我们假设可以将协方差矩阵分离为C(s,s′)=ρ(s,s′)TC(s,s′)=ρ(s,s′)TC(s, s')=\rho(s, s') T。 问题1:当我计算条件Y∣XY∣X{\bf{Y}}\mid{\bf{X}},实际上我正在 根据\ bf {X}生成一组\ bf {Y}值,对吗?我已经有\ …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.