Questions tagged «mathematical-statistics»

统计的数学理论,涉及形式定义和一般结果。

2
最大化艾德高斯派的最有力结果是什么?在实践中最常用?
由于X1,…,Xn,…∼N(0,1)X1,…,Xn,…∼N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) IID,考虑随机变量 Zn:=max1≤i≤nXi.Zn:=max1≤i≤nXi. Z_n := \max_{1 \le i \le n} X_i\,. 问题:这些随机变量最“重要”的结果是什么? 为了澄清“重要性”,哪个结果具有其他大多数这样的结果是合乎逻辑的结果?在实践中最常使用哪个结果? 更具体地说,似乎是(理论上的)统计学家之间的民俗知识,即至少渐近地“基本上与”。(请参阅此相关问题。)ZnZnZ_n2logn−−−−−√2log⁡n\sqrt{2 \log n} 但是,这种类型的结果有很多,而且似乎大多数情况不是等效的,也不是相互暗示的。例如∗∗^*, Zn2logn−−−−−√→a.s.1,(1)(1)Zn2log⁡n→a.s.1, \frac{Z_n}{\sqrt{2 \log n}} \overset{a.s.}{\to} 1 \,, \tag{1} 如果没有别的,也暗示了概率和分布的相应结果。 但是,它甚至似乎并不暗示也有相关的结果(请参见另一个问题),例如 limn→∞EZn2logn−−−−−√=1,(2)(2)limn→∞EZn2log⁡n=1, \lim_{n \to \infty} \frac{\mathbb{E}Z_n}{\sqrt{2 \log n}} =1 \,, \tag{2} (这是第49页的练习2.17 ),或另一个民俗结果:††\dagger EZn=2logn−−−−−√+Θ(1).(3)(3)EZn=2log⁡n+Θ(1). \mathbb{E}Z_n = \sqrt{2 \log n} …

2
贝叶斯充分性与频繁性充分性有何关系?
在Wikipedia中,给出了从频繁主义者角度来看足够统计量的最简单定义。但是,我最近遇到了一本贝叶斯书,定义为。链接中指出两者是等效的,但我不知道如何。同样,在同一页面的“其他类型的充足性”部分中,声明了两个定义在无限维空间中是不相等的...P(θ|x,t)=P(θ|t)P(θ|x,t)=P(θ|t)P(\theta|x,t)=P(\theta|t) 另外,预测性充足性与经典充分性有何关系?

2
显示
如果,则找到。X∼C(0,1)X∼C(0,1)X\sim\mathcal C(0,1)Y=2X1−X2Y=2X1−X2Y=\frac{2X}{1-X^2} 我们有FY(y)=Pr(Y≤y)FY(y)=Pr(Y≤y)F_Y(y)=\mathrm{Pr}(Y\le y) =Pr(2X1−X2≤y)=Pr(2X1−X2≤y)\qquad\qquad\qquad=\mathrm{Pr}\left(\frac{2X}{1-X^2}\le y\right) =⎧⎩⎨⎪⎪⎪⎪⎪⎪Pr(X∈(−∞,−1−1+y2√y])+Pr(X∈(−1,−1+1+y2√y]),ify&gt;0Pr(X∈(−1,−1+1+y2√y])+Pr(X∈(1,−1−1+y2√y]),ify&lt;0={Pr(X∈(−∞,−1−1+y2y])+Pr(X∈(−1,−1+1+y2y]),ify&gt;0Pr(X∈(−1,−1+1+y2y])+Pr(X∈(1,−1−1+y2y]),ify&lt;0\qquad\qquad=\begin{cases} \mathrm{Pr}\left(X\in\left(-\infty,\frac{-1-\sqrt{1+y^2}}{y}\right]\right)+\mathrm{Pr}\left(X\in\left(-1,\frac{-1+\sqrt{1+y^2}}{y}\right]\right),\text{if}\quad y>0\\ \mathrm{Pr}\left(X\in\left(-1,\frac{-1+\sqrt{1+y^2}}{y}\right]\right)+\mathrm{Pr}\left(X\in\left(1,\frac{-1-\sqrt{1+y^2}}{y}\right]\right),\text{if}\quad y<0 \end{cases} 我不知道上述区分大小写是否正确。 另一方面,以下似乎是一个更简单的方法: 我们可以使用身份来写Y=tan(2tan−1X)Y=tan⁡(2tan−1⁡X)Y=\tan(2\tan^{-1}X)2tanz1−tan2z=tan2z2tan⁡z1−tan2⁡z=tan⁡2z\frac{2\tan z}{1-\tan^2z}=\tan 2z 现在,X∼C(0,1)⟹tan−1X∼R(−π2,π2)X∼C(0,1)⟹tan−1⁡X∼R(−π2,π2)X\sim\mathcal C(0,1)\implies\tan^{-1}X\sim\mathcal R\left(-\frac{\pi}{2},\frac{\pi}{2}\right) ⟹2tan−1X∼R(−π,π)⟹2tan−1⁡X∼R(−π,π)\qquad\qquad\qquad\quad\implies 2\tan^{-1}X\sim\mathcal R(-\pi,\pi) ⟹tan(2tan−1X)∼C(0,1)⟹tan⁡(2tan−1⁡X)∼C(0,1)\qquad\qquad\qquad\quad\implies\tan\left(2\tan^{-1}X\right)\sim\mathcal C(0,1),最后一个是2对1转换。 但是如果要求我从定义中得出的分布,我想第一种方法就是如何进行。计算有点混乱,但是我得出正确的结论吗?也欢迎任何其他解决方案。YYY Johnson-Kotz-Balakrishnan的连续单变量分布(Vol.1)突出了柯西分布的这一特性。事实证明,这只是一般结果的特例。

1
我们可以从得出结论,是独立的吗?
好吧,我们无法看到 有趣的反例,例如https://en.wikipedia.org/wiki/Subindependence。但是真正的问题是:是否有某种方法可以加强这种状况,从而使独立性得以遵循?例如,有一些组的功能使得如果对于所有然后独立如下?而且,这样的函数集必须有多大?E g i(X )g j(Y )= E g i(X )E g j(Y )i ,jG1个,… ,gñg1,…,gng_1, \dotsc, g_nËG一世(X)克Ĵ(是)= EG一世(X)EGĴ(是)E⁡gi(X)gj(Y)=E⁡gi(X)E⁡gj(Y)\E g_i(X) g_j(Y) =\E g_i(X) \E g_j(Y)我,Ĵi,ji,j 而且,还有一些很好的参考资料可以解决这个问题吗?


1
完整的概率分布集合的拓扑
我一直在努力使我对概率分布的直观理解与几乎所有概率分布拓扑都具有的怪异属性相协调。 例如,考虑一个混合随机变量:选择一个以0为中心,方差为1且概率为的高斯,将加到结果中。此类随机变量的序列将收敛(微弱且总变化)为以0为中心且方差为1的高斯,但的均值始终为,方差收敛为。我真的不喜欢说这个序列因此而收敛。1XnXnX_n nXn1+∞1n1n\frac{1}{n}nnnXnXnX_n111+∞+∞+\infty 我花了相当长的时间来记住所有关于拓扑遗忘的内容,但最终我弄清楚了这些示例令我感到不满意的是:序列的限制不是常规分布。在上面的示例中,限制为怪异的“均值1和无穷方差的高斯”。用拓扑学的术语来说,在弱者(以及电视以及我看过的所有其他拓扑学)下,概率分布集并不完整。 然后,我面临以下问题: 是否存在拓扑结构使得概率分布集合完整? 如果否,那么这种缺失是否反映了概率分布集合的有趣特性?还是只是无聊? 注意:我已对“概率分布”提出了自己的问题。这些不能关闭,因为它们可以收敛到Diracs和类似没有pdf的东西。但是在薄弱的拓扑结构下仍然没有采取措施,所以我的问题仍然存在 交叉发布到mathoverflow /mathpro/226339/topologies-for-which-the-ensemble-of-probability-measures-is-complete?noredirect=1#comment558738_226339

1
线性变换的相关不变性:
这实际上是古吉拉特语《基本计量经济学》第4版(Q3.11)中的问题之一,并说相关系数相对于原点和比例的变化是不变的,即,其中,,,是任意常数。corr(aX+b,cY+d)=corr(X,Y)corr(aX+b,cY+d)=corr(X,Y)\text{corr}(aX+b, cY+d) = \text{corr}(X,Y)aaabbbcccddd 但是我的主要问题是:让和成对观察,并假设和正相关,即。我知道基于直觉会为负数。然而,如果我们取,它遵循,其不没有道理。XXXYYYXXXYYYcorr(X,Y)&gt;0corr(X,Y)&gt;0\text{corr}(X,Y)>0corr(−X,Y)corr(−X,Y)\text{corr}(-X,Y)a=−1,b=0,c=1,d=0a=−1,b=0,c=1,d=0a=-1, b=0, c=1, d=0corr(−X,Y)=corr(X,Y)&gt;0corr(−X,Y)=corr(X,Y)&gt;0\text{corr}(-X,Y) = \text{corr}(X,Y) >0 如果有人可以指出差距,我将不胜感激。谢谢。

3
一组不相关但线性相关的变量
是否可以有一组不相关但线性相关的变量?KKK 即 和∑ K i = 1 a i x i = 0cor(xi,xj)=0cor(xi,xj)=0cor(x_i, x_j)=0∑Ki=1aixi=0∑i=1Kaixi=0 \sum_{i=1}^K a_ix_i=0 如果可以,您可以写一个例子吗? 编辑:从答案中得出结论,这是不可能的。 至少有可能,其中是从变量样本,是与不相关的变量。ρ Ñ v X 我P(|ρ^xi,xj−ρ^xi,v|&lt;ϵ)P(|ρ^xi,xj−ρ^xi,v|&lt;ϵ)\mathbb{P}(|\hat \rho_{x_i, x_j}-\hat \rho_{x_i, v}|<\epsilon)ρ^ρ^\hat\rhonnnvvvxixix_i 我在想类似ķ&gt;&gt;0xK=1K∑K−1i=1xixK=1K∑i=1K−1xix_K=\dfrac{1}{K} \sum_{i=1}^{K-1} x_i K&gt;&gt;0K&gt;&gt;0K>>0


1
如何生成正行列式的均匀随机正交矩阵?
ppp111−1−1-1det=−1det=−1\det=-1 我们可以通过将正交矩阵的的正负号更改为负号来更改它的任何一列(或更一般地,其任意奇数个列)。detdet\det 我的问题是:鉴于我们会反复生成这样的随机矩阵,如果每次我们选择只恢复特定列的符号(例如,始终为第一个或始终为最后一个),是否会在它们的统一随机性上引入一些偏差?还是我们必须随机选择列以使矩阵表示随机均匀分布的集合?

1
如果存在两个未知数,负二项式是否不能像指数族那样表达?
假设色散参数是一个已知的常数,我有一个作业分配以表示负二项式分布为指数分布族。这相当简单,但是我想知道为什么他们要求我们将参数固定。我发现我无法想出一种方法来以正确的形式将两个参数未知。 在网上寻找时,我发现这是不可能的。但是,我找不到任何证明是真的。我自己也似乎无法提出。有人证明吗? 按照下面的要求,我提出了一些要求: “具有固定失败次数(也称为停止时间参数)r的负二项式分布族是指数族。但是,当允许上述任何固定参数发生变化时,所得族都不是指数族。 ” http://en.wikipedia.org/wiki/Exponential_family “二参数负二项式分布不是指数族的成员。但是,如果我们将色散参数视为已知的固定常数,则它是一个成员。” http://www.unc.edu/courses/2006spring/ecol/145/001/docs/lectures/lecture21.htm

1
观测到的费舍尔信息
从Y. Pawitan的“在所有可能性中:使用可能性进行统计建模和推断”中,重新参数化的可能性被定义为 使得如果g是一对一,则L ^ *(\ psi)= L(g ^ {-1} (\ psi))(第45页)。我试图显示练习2.20,其中指出如果\ theta是标量(并且我假设g也应该是标量函数),则 I ^ *(g(\ hat {\ theta}))= I( \ hat {\ theta})\ left | \ frac {\ partial g(\ hat {\ theta})} {\ partial \ hat {\ theta}} \ right | ^ {-2}, 其中 I(\ theta) =-\ frac {\ …

1
加法与乘法分解
我的问题是一个非常简单的问题,但那些问题确实让我很感激:)我真的不知道如何使用加法或乘法分解方法评估特定时间序列是否要分解。我知道有一些视觉提示可以告诉他们彼此分开,但我不明白。 以这个时间序列为例: 您如何形容? 在此先感谢您的帮助。

1
将概率收敛模拟为常数
渐近结果不能通过计算机仿真来证明,因为它们是涉及无穷大概念的陈述。但是我们应该能够感觉到事情确实按照理论告诉我们的方式前进了。 考虑理论结果 limn→∞P(|Xn|&gt;ϵ)=0,ϵ&gt;0林ñ→∞P(|Xñ|&gt;ϵ)=0,ϵ&gt;0\lim_{n\rightarrow\infty}P(|X_n|>\epsilon) = 0, \qquad \epsilon >0 其中是随机变量的函数,它们是相同且独立分布的。这表示的概率收敛到零。我想这里的原型示例是是样本均值减去样本的iidrv的共同期望值的情况,XnXñX_nnñnXnXñX_nXnXñX_n Xn=1n∑i=1nYi−E[Y1]Xñ=1个ñ∑一世=1个ñÿ一世-Ë[ÿ1个]X_n = \frac 1n\sum_{i=1}^nY_i - E[Y_1] 问题: 我们如何通过使用来自有限样本的计算机模拟结果来令人信服地证明上述关系“在现实世界中得以实现”? 请注意,我特别选择了收敛为常数。 我在下面提供我的方法作为答案,并希望有更好的方法。 更新:我脑后的东西困扰着我-我发现了什么。我挖出一个较旧的问题,在对一个答案的评论中进行了最有趣的讨论。在这里,@ Cardinal提供了一个估计量的示例,该估计量是一致的,但其方差保持非零且渐近地为有限。因此,我的问题变得更加棘手:当模拟统计量渐近地保持非零和有限方差时,如何通过模拟证明统计量收敛于常数呢?


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.