Questions tagged «distributions»

分布是概率或频率的数学描述。



1
除柯西以外,是否还有其他样本的算术平均值遵循相同分布的分布?
如果遵循柯西分布然后Ŷ = ˉ X = 1XXX也遵循与X完全相同的分布;看到这个线程。ÿ= X¯= 1ñ∑ñ我= 1X一世ÿ=X¯=1个ñ∑一世=1个ñX一世Y = \bar{X} = \frac{1}{n} \sum_{i=1}^n X_iXXX 这个属性有名字吗? 还有其他分布是真的吗? 编辑 提出此问题的另一种方式: 令为概率密度为f (x )的随机变量。XXXF(x )F(X)f(x) 令,其中X我表示的第i个观察X。ÿ= 1ñ∑ñ我= 1X一世ÿ=1个ñ∑一世=1个ñX一世Y=\frac 1 n\sum_{i=1} ^n X_iX一世X一世X_iXXX 本身可以视为随机变量,而无需以 X的任何特定值为条件。ÿÿYXXX 如果遵循柯西分布,则Y的概率密度函数为f (x )XXXÿÿYF(x )F(X)f(x) 是否存在其他类型的(非平凡*)概率密度函数,从而导致Y具有f (x )概率密度函数?F(x )F(X)f(x)ÿÿYF(x )F(X)f(x) *我能想到的唯一简单的例子是狄拉克三角洲。即不是随机变量。

2
如果和是各自均值为零的独立法线变量,则也是法线变量
我试图证明这一说法: 如果和是独立随机变量,X∼N(0,σ21)X∼N(0,σ12)X\sim\mathcal{N}(0,\sigma_1^2)Y∼N(0,σ22)Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) 那么也是一个普通随机变量。XYX2+Y2√XYX2+Y2\frac{XY}{\sqrt{X^2+Y^2}} 对于特殊情况(例如),我们得到的著名结果是每当和是独立的变量时。实际上,更普遍地知道是独立的变量。σ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigmaXYX2+Y2√∼N(0,σ24)XYX2+Y2∼N(0,σ24)\frac{XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}\left(0,\frac{\sigma^2}{4}\right)XXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,σ24)N(0,σ24)\mathcal{N}\left(0,\frac{\sigma^2}{4}\right) 最后的证明是使用的变换其中而。实际上,这里和。我试图模仿这个证明来解决手头的问题,但看起来似乎很混乱。(X,Y)→(R,Θ)→(U,V)(X,Y)→(R,Θ)→(U,V)(X,Y)\to(R,\Theta)\to(U,V)x=rcosθ,y=rsinθx=rcos⁡θ,y=rsin⁡θx=r\cos\theta,y=r\sin\thetau=r2sin(2θ),v=r2cos(2θ)u=r2sin⁡(2θ),v=r2cos⁡(2θ)u=\frac{r}{2}\sin(2\theta),v=\frac{r}{2}\cos(2\theta)U=XYX2+Y2√U=XYX2+Y2U=\frac{XY}{\sqrt{X^2+Y^2}}V=X2−Y22X2+Y2√V=X2−Y22X2+Y2V=\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}} 如果我没有做任何错误,那么对于我最终得到的联合密度为(u,v)∈R2(u,v)∈R2(u,v)\in\mathbb{R}^2(U,V)(U,V)(U,V) fU,V(u,v)=2σ1σ2πexp[−u2+v2−−−−−−√(u2+v2−−−−−−√+vσ21+u2+v2−−−−−−√−vσ22)]fU,V(u,v)=2σ1σ2πexp⁡[−u2+v2(u2+v2+vσ12+u2+v2−vσ22)]f_{U,V}(u,v)=\frac{2}{\sigma_1\sigma_2\pi}\exp\left[-\sqrt{u^2+v^2}\left(\frac{\sqrt{u^2+v^2}+v}{\sigma_1^2}+\frac{\sqrt{u^2+v^2}-v}{\sigma_2^2}\right)\right] 我有上面的乘数,因为变换不是一对一的。222 因此,密度将由,该值不易评估。UUU∫RfU,V(u,v)dv∫RfU,V(u,v)dv\displaystyle \int_{\mathbb{R}}f_{U,V}(u,v)\,\mathrm{d}v 现在,我很想知道是否有证据证明我只能与工作,而不必考虑某个来表明是正常的。对我来说,找到的CDF 看起来并不那么有希望。对于的情况,我也想这样做。UUUVVVUUUUUUσ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigma 也就是说,如果和是独立的变量,那么我想证明而无需更改变量。如果我能以某种方式争论,那么我就完成了。所以这里有两个问题,一般情况,然后是特殊情况。XXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)Z=2XYX2+Y2√∼N(0,σ2)Z=2XYX2+Y2∼N(0,σ2)Z=\frac{2XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}(0,\sigma^2)Z=dXZ=dXZ\stackrel{d}{=}X Math.SE上的相关文章: X2−Y2/X2+Y2−−−−−−−√∼N(0,1)X2−Y2/X2+Y2∼N(0,1)X^2-Y^2/ \sqrt{X^2+Y^2}\sim N(0,1)当独立时X,Y∼N(0,1)X,Y∼N(0,1)X,Y\sim N(0,1)。 假设是iid,则表明是iidX,YX,YX,YN(0,1)N(0,1)N(0,1)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,14)N(0,14)N(0,\frac{1}{4})。 编辑。 事实上,这个问题是由于我在Feller的《概率论及其应用入门》(第二卷)练习中发现的L. Shepp以及可能的提示: 当然,并且手边有的密度。U=XYX2+Y2√=11X2+1Y2√U=XYX2+Y2=11X2+1Y2U=\frac{XY}{\sqrt{X^2+Y^2}}=\frac{1}{\sqrt{\frac{1}{X^2}+\frac{1}{Y^2}}}1X21X2\frac{1}{X^2} 让我们看看我现在能做什么。除此之外,还欢迎对以上积分提供一些帮助。

5
如何生成均值为的序列?
我知道如何生成均值为的序列。例如,在Matlab中,如果我想生成长度为的序列,则为:0 ± 1 10000±1±1\pm 1000±1±1\pm 1100001000010000 2*(rand(1, 10000, 1)<=.5)-1 然而,如何产生一个与平均序列,即,具有稍微优选?0.05 1±1±1\pm 10.050.050.0511个1

2
几何均值是哪个连续分布的均值的无偏估计量?
是否存在任何可以用封闭形式表示的连续分布,其均值使得样本的几何均值是该均值的无偏估计量? 更新:我只是意识到我的样本必须是正数(否则几何平均值可能不存在),因此连续不是正确的词。对于随机变量的负值零为正值连续的分布怎么样。类似于截断的分布。

4
独立对数正态随机变量的总和是否显示对数正态?
我试图理解为什么当您增加观察次数时,两个(或多个)对数正态随机变量的总和接近对数正态分布。我在网上看过,但没有发现任何结果。 显然,如果和是独立的对数正态变量,则根据指数和高斯随机变量的性质,也是对数正态的。但是,没有理由表明也是对数正态的。XXXX × Y X + YÿÿYX× YX×ÿX \times YX+ YX+ÿX+Y 然而 如果生成两个独立的对数正态随机变量和,并令,并重复多次此过程,则的分布将显示为对数正态。随着观察次数的增加,它甚至看起来更接近对数正态分布。Y Z = X + Y ZXXXÿÿYž= X+ Yž=X+ÿZ=X+YžžZ 例如:生成一百万对后,Z的自然对数的分布在下面的直方图中给出。这显然很像正态分布,表明确实是对数正态。žžZ 有没有人对本文有任何见解或参考,可能有助于理解?

3
可视化二元二项分布
问题:二元二项分布在3维空间中是什么样的? 下面是我想针对各种参数值可视化的特定功能;即,和。p 1 p 2nnnp1p1p_{1}p2p2p_{2} f(x1,x2)=n!x1!x2!px11px22,x1+x2=n,p1+p2=1.f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.f(x_{1},x_{2}) = \frac{n!}{x_{1}!x_{2}!}p_{1}^{x_{1}}p_{2}^{x_{2}}, \qquad x_{1}+x_{2}=n, \quad p_{1}+p_{2}=1. 注意,有两个约束;和。另外,是一个正整数,例如。p 1 + p 2 = 1 n 5x1+x2=nx1+x2=nx_{1}+x_{2}=np1+p2=1p1+p2=1p_{1}+p_{2}=1nnn555 在使用LaTeX(TikZ / PGFPLOTS)进行了两次绘图功能的尝试。这样做,我得到以下图形的以下值:,和以及,和分别为。我尚未成功实现对域值的约束;,所以我有些困惑。p 1 = 0.1 p 2 = 0.9 n = 5 p 1 = 0.4 p 2 = 0.6 x 1 + x 2 = nn=5n=5n=5p1=0.1p1=0.1p_{1}=0.1p2=0.9p2=0.9p_{2}=0.9n=5n=5n=5p1=0.4p1=0.4p_{1}=0.4p2=0.6p2=0.6p_{2}=0.6x1+x2=nx1+x2=nx_{1}+x_{2}=n 用任何语言生成的可视化效果都很好(R,MATLAB等),但是我正在使用TikZ …

3
在贝叶斯推断中先验了解贝塔共轭频率
以下摘录自《博尔斯塔德的贝叶斯统计概论》。 对于所有在那里的专家来说,这可能是微不足道的,但是我不明白作者是如何得出结论的,我们不必进行任何积分就可以计算出某个值的后验概率。我理解第二个表达式,它是比例关系以及所有条件的来源(似然x Prior)。而且,我知道,我们不必担心分母,因为只有分子是直接成比例的。但是,继续讲第三个方程式,我们是否就忘记了贝叶斯规则的分母?去哪了?而且由Gamma函数计算的值不是常数吗?常数不会在贝叶斯定理中抵消吗?ππ\pi


1
GLM中有多少个分布?
我在教科书中确定了多个位置,其中用5种分布(即Gamma,Gaussian,Binomial,Inverse Gaussian和Poisson)描述了GLM。R中的族函数也对此进行了举例说明。 有时,我会遇到对GLM的引用,其中包括其他发行版(示例)。有人可以解释为什么这5个特殊或始终在GLM中出现,但有时其他情况如此吗? 根据我到目前为止的了解,指数族中的GLM分布都适合以下形式: 其中是色散参数,而是规范参数。φθf(y;θ,ϕ)=exp{yθ−b(θ)ϕ+c(y,ϕ)}f(y;θ,ϕ)=exp⁡{yθ−b(θ)ϕ+c(y,ϕ)}f(y;\theta,\phi)=\exp\left\{\frac{y\theta-b(\theta)}{\phi}+c(y,\phi)\right\}ϕϕ\phiθθ\theta 不能对任何发行版进行转换以使其适合GLM吗?

1
如何在不过度拟合数据的情况下选择最佳拟合?使用N个正态函数等对双峰分布进行建模
我有一个明显的双峰值分布,我试图适应这一分布。可以使用2个正常函数(双峰)或3个正常函数很好地拟合数据。此外,将数据拟合为3还有一个合理的物理原因。 引入的参数越多,拟合就越完美,因为有了足够的常数,一个人就可以“ 拟合大象 ”。 这是分布,与3条正态(高斯)曲线的总和拟合: 这些是每次拟合的数据。我不确定应该在这里应用哪种测试来确定合适的位置。数据由91点组成。 1正常功能: RSS:1.06231 X ^ 2:3.1674 F.测试:0.3092 2个正常功能: RSS:0.010939 X ^ 2:0.053896 F.测试:0.97101 3种正常功能: RSS:0.00536 X ^ 2:0.02794 F.测试:0.99249 什么是可以用来确定这3个拟合中的哪一个最合适的正确统计检验?显然,1个法线函数拟合不足。那么如何区分2和3? 另外,我主要使用Excel和一些Python来完成此操作;我还不熟悉R或其他统计语言。


1
不相关性对哪些分布表示独立?
统计由来已久的提醒是“uncorrelatedness并不能意味着独立”。通常,这种提醒是在心理上舒缓的(并且在科学上正确的)陈述中进行补充的:“尽管如此,这两个变量共同正态分布,但不相关的确意味着独立”。 我可以将快乐异常的数量从一增加到两个:当两个变量是伯努利分布时,那么不相关又意味着独立。如果和是两个Bermoulli rv,则,其中我们有,类似地对于,它们的协方差为XXXYYYX∼B(qx),Y∼B(qy)X∼B(qx),Y∼B(qy)X \sim B(q_x),\; Y \sim B(q_y)P(X=1)=E(X)=qxP(X=1)=E(X)=qxP(X=1) = E(X) = q_xYYY Cov(X,Y)=E(XY)−E(X)E(Y)=∑SXYp(x,y)xy−qxqyCov⁡(X,Y)=E(XY)−E(X)E(Y)=∑SXYp(x,y)xy−qxqy\operatorname{Cov}(X,Y)= E(XY) - E(X)E(Y) = \sum_{S_{XY}}p(x,y)xy - q_xq_y =P(X=1,Y=1)−qxqy=P(X=1∣Y=1)P(Y=1)−qxqy=P(X=1,Y=1)−qxqy=P(X=1∣Y=1)P(Y=1)−qxqy = P(X=1,Y=1) - q_xq_y = P(X=1\mid Y=1)P(Y=1)-q_xq_y =(P(X=1∣Y=1)−qx)qy=(P(X=1∣Y=1)−qx)qy= \Big(P(X=1\mid Y=1)-q_x\Big)q_y 对于不相关性,我们要求协方差为零,因此 Cov(X,Y)=0⇒P(X=1∣Y=1)=P(X=1)Cov⁡(X,Y)=0⇒P(X=1∣Y=1)=P(X=1)\operatorname{Cov}(X,Y) = 0 \Rightarrow P(X=1\mid Y=1) = P(X=1) ⇒P(X=1,Y=1)=P(X=1)P(Y=1)⇒P(X=1,Y=1)=P(X=1)P(Y=1)\Rightarrow P(X=1,Y=1) = P(X=1)P(Y=1) 这也是变量独立所需要的条件。 所以我的问题是:您是否知道其他任何分布(连续或离散)的不相关性意味着独立性? 含义:假设两个随机变量具有边际属于相同的分布(或许与所涉及的分布参数不同的值)的分布,但让我们用同样支持如说。两个指数,两个三角形等。方程所有解是否都由于所涉及的分布函数的形式/性质而隐含着独立性?正态边际(也假定它们具有二元正态分布)和伯努利边际都是这种情况-还有其他情况吗?X,YX,YX,YCov(X,Y)=0Cov⁡(X,Y)=0\operatorname{Cov}(X,Y) = 0 这样做的动机是,与检查独立性是否成立相比,通常更容易检查协方差是否为零。因此,如果在给定理论分布的情况下,通过检查协方差,您还在检查独立性(例如伯努利或正态情况),那么这将是一件有用的事情。 …

5
如果不是泊松,那么这是什么分布?
我有一个数据集,其中包含个人在7天内执行的操作数。具体操作与该问题无关。下面是该数据集的一些描述性统计: RangeMeanVarianceNumber of observations0−77218.22791696Range0−772Mean18.2Variance2791Number of observations696 \begin{array}{|c|c|} \hline \text{Range} & 0 - 772 \\ \hline \text{Mean} & 18.2 \\ \hline \text{Variance} & 2791 \\ \hline \text{Number of observations} & 696 \\ \hline \end{array} 这是数据的直方图: 从数据的来源来看,我认为它适合泊松分布。但是,均值≠方差,并且直方图在左侧的权重很高。另外,我goodfit在R中运行测试并得到: > gf <- goodfit(actions,type="poisson", method = "MinChisq") <br> > summary(gf) <br> Goodness-of-fit test for poisson …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.