Questions tagged «mathematical-statistics»

统计的数学理论,涉及形式定义和一般结果。

2
我怎么知道选择哪种参数估计方法?
那里有很多用于参数估计的方法。MLE,UMVUE,MoM,决策理论等似乎都具有合理的理由说明为什么它们可用于参数估计。是任何一种方法都比其他方法更好,还是仅取决于我们如何定义“最佳拟合”估计量(类似于最小化正交误差如何与普通最小二乘法产生不同的估计值)?

3
如何使用CDF和PDF统计信息进行分析
这可能是一个笼统的问题,但我希望可以在这里找到帮助。我正在大学里从事RA工作,并且我的主题与Internet流量分析有关。我对分析界还很陌生,但是我想在研究界这是我必须做的很多事情。 我浏览了几篇论文,在很多论文中,我发现他们使用概率密度(PDF),CDF,CCDF等来解释他们获得的结果。例如,用户会话持续时间的PDF,每天传输的字节的CDF等。我参加了概率统计课,所以我了解它们是什么,但我仍然对选择这种表示形式的情况感到困惑。 因此,如果有人在进行此类图表和分析(在其他任何一般主题或其他主题中),您能简单地告诉我在什么情况下使用其中一种表示形式


5
来自同一分布族的两个随机变量是否可能具有相同的期望和方差,但具有更高的矩?
我在考虑位置规模家庭的含义。我的理解是,对于位置标尺族的每个成员,其参数分别位置标尺和b标尺,则Z =(Xa)/ b的分布不取决于任何参数,并且属于该族的每个X都是相同的。XXXaaabbbZ=(X−a)/bZ=(X−a)/bZ =(X-a)/bXXX 所以我的问题是,您能否提供一个示例,其中将来自同一分布族的两个随机数标准化,但不会导致具有相同分布的随机变量? 假设XXX和YYY来自同一个分布族(例如,我所说的族指正态或Gamma等等)。限定: Z1=X−μσZ1=X−μσZ_1 = \dfrac{X-\mu}{\sigma} Z2=Y−μσZ2=Y−μσZ_2 = \dfrac{Y-\mu}{\sigma} 我们知道Z1Z1Z_1和Z2Z2Z_2都具有相同的期望和方差,μZ=0,σ2Z=1μZ=0,σZ2=1\mu_Z =0, \sigma^2_Z =1。 但是他们可以有更高的时刻吗? 我试图回答这个问题的尝试是,如果XXX和Y的分布YYY取决于两个以上的参数。我正在考虑具有3个参数的广义t−studentt−studentt-student。 但是,如果参数数量为≤2≤2\le2并且XXX和YYY来自相同的分布族,并且具有相同的期望和方差,那么是否意味着Z1Z1Z_1和Z2Z2Z_2具有相同的分布(较高的矩)?

1
渐近无偏与一致性之间有什么区别?
彼此暗示吗?如果不是,是否意味着另一个?为什么/为什么不呢? 这个问题是针对我在此处发布的答案的评论而提出的。 尽管google搜索相关术语并没有产生看起来特别有用的东西,但我确实注意到了数学stackexchange 的答案。但是,我认为这个问题也适用于该网站。 阅读评论后进行编辑 相对于math.stackexchange答案,我正在做更深入的研究,涵盖了@whuber注释线程中处理的一些问题。另外,正如我所看到的,math.stackexchange问​​题表明一致性并不意味着渐近地无偏见,但是对于原因却没有太多解释。那里的OP还理所当然地认为渐近无偏并不意味着一致性,因此到目前为止,唯一的回答者并没有解决为什么这样做。


1
三角形分布的MLE?
是否可以将常规的MLE程序应用于三角形分布?-我正在尝试,但是在数学上似乎一步一步被定义分布的方式所阻塞。我试图利用一个事实,即我知道c上下的样本数量(不知道c):如果n是样本总数,则这两个数字是cn和(1-c)n。但是,这似乎无助于推导。此刻的时刻给出了c的估计量,没有太大的问题。这里的MLE阻塞的确切性质是什么(如果确实存在)? 更多细节: 让我们考虑在,并在规定的分配由: [ 0 ,1 ] [ 0 ,1 ]Ccc[ 0 ,1 ][0,1][0,1][ 0 ,1 ][0,1][0,1] F(x ; c )= 2 xCf(x;c)=2xcf(x;c) = \frac{2x}{c}如果x <c如果c <= x,则 F(x ; c )= 2 (1 − x )(1 − c )f(x;c)=2(1−x)(1−c)f(x;c) = \frac{2(1-x)}{(1-c)} 让我们从这个分布中取 iid样本,以给定该样本的c的对数似然性为例:{ x i }ñnn{ x一世}{xi}\{x_{i}\} 升^(c | …

1
黑森矩阵和协方差矩阵之间的关系
在研究最大似然估计时,要进行最大似然估计的推论,我们需要知道方差。要找出方差,我需要知道Cramer的Rao下界,它看起来像是在曲率上具有二阶导数的Hessian矩阵。我有点混在一起来定义协方差矩阵和粗麻布矩阵之间的关系。希望听到有关该问题的一些解释。一个简单的例子将不胜感激。


2
“百分位数”的定义
我现在正在阅读PMT Education撰写的有关生物统计学的注释,请注意第2.7节中的以下句子: 以质量计第50个百分点出生的婴儿比50%的婴儿重。 以质量计在第25个百分点出生的婴儿比75%的婴儿重。 以质量计在第75个百分点出生的婴儿比25%的婴儿重。 但据我所知,按质量计算在第25个百分点出生的婴儿应该比25%的婴儿重。在此领域中,“百分位数”是否有特殊定义,或者我误以为是非母语使用者的句子?

5
置信区间有用吗?
在常客统计中,置信区间为95%是一个区间生成过程,如果重复无数次,则95%的时间将包含真实参数。为什么这有用? 置信区间常常被误解。它们不是我们可以95%确定参数所在的间隔(除非您使用的是类似的贝叶斯可信度间隔)。置信区间对我来说就像个诱饵和开关。 我可以想到的一个用例是提供不能拒绝参数为该值的原假设的值范围。p值不能提供此信息,但是更好吗?不会这么误导? 简而言之:为什么我们需要置信区间?如果正确解释,它们如何有用?

2
如果和是各自均值为零的独立法线变量,则也是法线变量
我试图证明这一说法: 如果和是独立随机变量,X∼N(0,σ21)X∼N(0,σ12)X\sim\mathcal{N}(0,\sigma_1^2)Y∼N(0,σ22)Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) 那么也是一个普通随机变量。XYX2+Y2√XYX2+Y2\frac{XY}{\sqrt{X^2+Y^2}} 对于特殊情况(例如),我们得到的著名结果是每当和是独立的变量时。实际上,更普遍地知道是独立的变量。σ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigmaXYX2+Y2√∼N(0,σ24)XYX2+Y2∼N(0,σ24)\frac{XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}\left(0,\frac{\sigma^2}{4}\right)XXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,σ24)N(0,σ24)\mathcal{N}\left(0,\frac{\sigma^2}{4}\right) 最后的证明是使用的变换其中而。实际上,这里和。我试图模仿这个证明来解决手头的问题,但看起来似乎很混乱。(X,Y)→(R,Θ)→(U,V)(X,Y)→(R,Θ)→(U,V)(X,Y)\to(R,\Theta)\to(U,V)x=rcosθ,y=rsinθx=rcos⁡θ,y=rsin⁡θx=r\cos\theta,y=r\sin\thetau=r2sin(2θ),v=r2cos(2θ)u=r2sin⁡(2θ),v=r2cos⁡(2θ)u=\frac{r}{2}\sin(2\theta),v=\frac{r}{2}\cos(2\theta)U=XYX2+Y2√U=XYX2+Y2U=\frac{XY}{\sqrt{X^2+Y^2}}V=X2−Y22X2+Y2√V=X2−Y22X2+Y2V=\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}} 如果我没有做任何错误,那么对于我最终得到的联合密度为(u,v)∈R2(u,v)∈R2(u,v)\in\mathbb{R}^2(U,V)(U,V)(U,V) fU,V(u,v)=2σ1σ2πexp[−u2+v2−−−−−−√(u2+v2−−−−−−√+vσ21+u2+v2−−−−−−√−vσ22)]fU,V(u,v)=2σ1σ2πexp⁡[−u2+v2(u2+v2+vσ12+u2+v2−vσ22)]f_{U,V}(u,v)=\frac{2}{\sigma_1\sigma_2\pi}\exp\left[-\sqrt{u^2+v^2}\left(\frac{\sqrt{u^2+v^2}+v}{\sigma_1^2}+\frac{\sqrt{u^2+v^2}-v}{\sigma_2^2}\right)\right] 我有上面的乘数,因为变换不是一对一的。222 因此,密度将由,该值不易评估。UUU∫RfU,V(u,v)dv∫RfU,V(u,v)dv\displaystyle \int_{\mathbb{R}}f_{U,V}(u,v)\,\mathrm{d}v 现在,我很想知道是否有证据证明我只能与工作,而不必考虑某个来表明是正常的。对我来说,找到的CDF 看起来并不那么有希望。对于的情况,我也想这样做。UUUVVVUUUUUUσ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigma 也就是说,如果和是独立的变量,那么我想证明而无需更改变量。如果我能以某种方式争论,那么我就完成了。所以这里有两个问题,一般情况,然后是特殊情况。XXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)Z=2XYX2+Y2√∼N(0,σ2)Z=2XYX2+Y2∼N(0,σ2)Z=\frac{2XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}(0,\sigma^2)Z=dXZ=dXZ\stackrel{d}{=}X Math.SE上的相关文章: X2−Y2/X2+Y2−−−−−−−√∼N(0,1)X2−Y2/X2+Y2∼N(0,1)X^2-Y^2/ \sqrt{X^2+Y^2}\sim N(0,1)当独立时X,Y∼N(0,1)X,Y∼N(0,1)X,Y\sim N(0,1)。 假设是iid,则表明是iidX,YX,YX,YN(0,1)N(0,1)N(0,1)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,14)N(0,14)N(0,\frac{1}{4})。 编辑。 事实上,这个问题是由于我在Feller的《概率论及其应用入门》(第二卷)练习中发现的L. Shepp以及可能的提示: 当然,并且手边有的密度。U=XYX2+Y2√=11X2+1Y2√U=XYX2+Y2=11X2+1Y2U=\frac{XY}{\sqrt{X^2+Y^2}}=\frac{1}{\sqrt{\frac{1}{X^2}+\frac{1}{Y^2}}}1X21X2\frac{1}{X^2} 让我们看看我现在能做什么。除此之外,还欢迎对以上积分提供一些帮助。

3
模具100卷没有面孔出现超过20次
我正在努力解决这个问题。 模具被轧制100次。没有面孔出现超过20次的概率是多少?我的第一个想法是使用二项分布P(x)= 1-6 cmf(100,1/6,20),但这显然是错误的,因为我们对某些情况进行了多次计算。我的第二个想法是枚举所有可能的滚动x1 + x2 + x3 + x4 + x5 + x6 = 100,使得xi <= 20并将多项式求和,但这似乎计算量很大。近似解决方案也将对我有用。

1
解释概率测度之间的Radon-Nikodym导数?
我在某些点上已经看到了相对于另一种概率度量使用Radon-Nikodym导数,最明显的是在Kullback-Leibler散度中,其中它是模型对某些任意参数的概率度量的导数。关于真实参数:θ 0θθ\thetaθ0θ0\theta_0 dPθdPθ0dPθdPθ0\frac {dP_\theta}{dP_{\theta_0}} 这些都是在参数值条件下对数据点空间的概率度量。Pθ(D)=P(D|θ)Pθ(D)=P(D|θ)P_\theta(D)=P(D|\theta) 在Kullback-Leibler散度中或更普遍地在两个概率测度之间,这种Radon-Nikodym导数的解释是什么?

2
为什么T统计量需要数据遵循正态分布
我当时在看这个笔记本,但对此陈述感到困惑: 当我们谈论正态性时,我们的意思是数据应该看起来像正态分布。这很重要,因为几个统计检验都依赖于此(例如t统计)。 我不明白为什么T统计量需要数据遵循正态分布。 确实,维基百科说了同样的话: 学生的t分布(或简称为t分布)是连续概率分布族的任何成员,该族在估计正态分布总体的均值时出现 但是,我不明白为什么这个假设是必要的。 它的公式没有向我表明数据必须服从正态分布: 我看了一下它的定义,但我不明白为什么需要这种条件。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.