Questions tagged «mathematical-statistics»

统计的数学理论,涉及形式定义和一般结果。

5
为什么随机游走的方差会增加?
定义为Y t = Y t − 1 + e t的随机游走,其中e t是白噪声。表示当前位置是前一个位置的总和加上一个不可预测的项。Yt=Yt−1+etÿŤ=ÿŤ-1个+ËŤY_{t} = Y_{t-1} + e_tetete_t 可以证明的是,平均函数μt=0μt=0\mu_t = 0 ,因为E(Yt)=E(e1+e2+...+et)=E(e1)+E(e2)+...+E(et)=0+0+...+0E(Yt)=E(e1+e2+...+et)=E(e1)+E(e2)+...+E(et)=0+0+...+0E(Y_{t}) = E(e_1+ e_2+ ... +e_t) = E(e_1) + E(e_2) +... +E(e_t) = 0 + 0 + ... + 0 但是,为什么方差随时间线性增加? 因为新位置与上一个位置非常相关,这是否与“纯”随机无关? 编辑: 现在,通过可视化大量随机游走,我有了更好的理解,在这里我们可以轻松地观察到总体方差确实会随着时间的推移而增加, 平均值在零附近。 毕竟这可能是微不足道的,因为在时间序列的早期(比较时间= 10,有100),随机步行者还没有时间去探索。

8
寻找一本完整的概率统计书
我从来没有机会从数学系访问统计课程。我正在寻找一本完整的自给自足的概率论和统计书。完整的意思是它包含所有证明,而不仅仅是陈述结果。自给自足是指不需要阅读另一本书就能理解这本书。当然,它可能需要大学水平(数学系学生)的微积分和线性代数。 我看过多本书,但我不喜欢其中的任何一本书。 DeGroot和Schervish(2011)概率与统计(第4版)皮尔森 这还不够完整。它只是说明了很多东西而没有推导。除此之外,我喜欢它。 瓦瑟曼(Wasserman)(2004年),《所有统计资料:统计推断简明课程》。 一点都不喜欢。几乎没有解释。 David Williams的“ Weighing the Odds”比DeGroot更为正式,似乎是完整且自给自足的。但是,我发现样式很奇怪。他还发明了似乎只有他才能使用的新术语。DeGroot中解释的所有内容也在那里得到了更好的解释。 如果您知道一本很棒的德语书,那也和我是德语一样好。

1
黛博拉·梅奥(Deborah Mayo)是否反驳了伯恩鲍姆(Birnbaum)关于似然原理的证明?
这在某种程度上与我之前在这里的问题有关:一个示例,其中“可能性”原理真的很重要吗? 显然,黛博拉·梅奥(Deborah Mayo)在《统计科学》上发表了一篇论文,驳斥了伯恩鲍姆关于似然原理的证明。谁能解释伯恩鲍姆(Birnbaum)的主要论点和梅奥(Mayo)的反论点?她(逻辑上)对吗?


3
维中两个随机单位向量的标量积的分布
如果和是中的两个独立的随机单位矢量(均匀分布在单位球面上),它们的标量积(点积)的分布是什么吗?xx\mathbf{x}yy\mathbf{y}RDRD\mathbb{R}^Dx⋅yx⋅y\mathbf x \cdot \mathbf y 我猜想随着的分布迅速增长(?)成为均值为零的正态值,并且在较高维度方差减小但是对于\ sigma ^ 2(D)?DDDlimD→∞σ2(D)→0,limD→∞σ2(D)→0,\lim_{D\to\infty}\sigma^2(D) \to 0,σ2(D)σ2(D)\sigma^2(D) 更新资料 我进行了一些快速模拟。首先,为D = 1000生成10000对随机单位向量,D=1000D=1000D=1000很容易看到它们的点积分布完全是高斯分布(实际上对于D=100D=100D=100,它已经是高斯分布了),请参见左侧的子图。其次,对于从1到10000的每个DDD(以递增的步长),我生成了1000对并计算了方差。对数-对数图显示在右侧,很明显公式很容易被1 / D近似1/D1/D1/D。请注意,对于D=1D=1D=1和D=2D=2D=2此公式甚至可以给出准确的结果(但我不确定以后会发生什么)。


2
零假设下线性回归中的分布是什么?为什么当时其模式不为零?
在原假设下,线性单变量多元回归中的确定系数或R平方的分布是什么?R2R2R^2H0:β=0H0:β=0H_0:\beta=0 它如何取决于预测变量数量和样本数量?此分布方式是否有封闭形式的表达式?kkkn&gt;kn&gt;kn>k 特别是,我有一种感觉,对于简单回归(具有一个预测变量),此分布的众数为零,但对于多重回归,其众数为非零正值。如果确实是这样,是否对这种“相变”有直观的解释?xxx 更新资料 如下@Alecos所示,当和时,分布确实在零处达到峰值,而当时,分布则不在零处。我觉得应该对这种相变有一个几何的看法。考虑OLS的几何视图:是的向量,在此处定义一个维子空间。OLS等于将投影到该子空间上,并且是和其投影之间的角度的平方余弦。k=2k=2k=2k=3k=3k=3k&gt;3k&gt;3k>3yy\mathbf yRnRn\mathbb R^nXX\mathbf Xkkkyy\mathbf yR2R2R^2ÿyy\mathbf yy^y^\hat{\mathbf y} 现在,从@Alecos的答案可以得出结论,如果所有向量都是随机的,则对于和,该角度的概率分布将在处达到峰值,但在对于。为什么?!90∘90∘90^\circk=2k=2k=2k=3k=3k=3&lt;90∘&lt;90∘<90^\circk&gt;3k&gt;3k>3 更新2:我接受@Alecos的回答,但仍然感觉我在这里缺少一些重要的见解。如果有人对这种现象提出任何其他(无论是几何还是非几何)观点,使它变得“显而易见”,我将很乐意提供悬赏。


1
是否有一个结果,当且仅当统计数据是平滑的时,提供引导程序才有效?
在整个过程中,我们假设统计量是某些数据的函数是从分布函数得出的;我们样本的经验分布函数是。因此,是被视为随机变量的统计量,而是该统计量的引导版本。我们使用作为KS距离θ (⋅ )θ(⋅)\theta(\cdot) ˚F ˚F θ (˚F )θ (X1个,… XñX1,…XñX_1, \ldots X_nFFFF^F^\hat{F}θ (˚F)θ(F)\theta(F)d∞θ (˚F^)θ(F^)\theta(\hat{F})d∞d∞d_\infty 如果统计信息是简单的线性统计信息,则对于引导程序的有效性有“ if and only if”结果。例如Mammen的定理1“引导程序何时起作用?” 如果用于某些任意函数则引导程序的作用是如果且仅当存在和使得 我们可以在其中将定义为样本的某些函数,并且ħñd∞[大号(θ( ˚F) -吨 Ñ),大号(θ(˚F)-吨Ñ)]→p0σÑ吨Ñd∞[L(θ(F)−tn)θ (˚F)= 1ñ∑ñi − 1Hñ( X一世)θ(F)=1个ñ∑一世-1个ñHñ(X一世)\theta(F) = \frac{1}{n} \sum_{i-1}^n h_n(X_i)HñHñh_nd∞[ L(θ (F^)− t^ñ),大号(θ (F)− tñ)] →p0d∞[大号(θ(F^)-Ť^ñ),大号(θ(F)-Ťñ)]→p0d_\infty\big[\mathscr{L}(\theta(\hat{F})-\hat{t}_n), \mathscr{L}(\theta(F)-t_n)\big] \underset{p}{\rightarrow} 0σñσñ\sigma_nŤñŤñt_n ^ 吨Ñ吨Ñ = È(吨 Ñ)d∞[ L(θ (F)− tñ),Ñ(0 …

1
维中的
给定数据点,每个数据点具有特征,标记为,其他标记为。每个特征随机取的值(均匀分布)。存在可以分裂两个类别的超平面的概率是多少?d Ñ / 2 0 Ñ / 2 1 [ 0 ,1 ]nnndddn/2n/2n/2000n/2n/2n/2111[0,1][0,1][0,1] 让我们首先考虑最简单的情况,即。d=1d=1d = 1

4
数理统计和统计之间有什么区别?
数理统计与统计有什么区别? 我读过这个: 统计是对数据的收集,组织,分析和解释的研究。它涉及所有方面,包括根据调查和实验设计进行数据收集计划。 与此: 数理统计是从数学的角度对统计进行的研究,它使用概率论以及其他数学分支,例如线性代数和分析。 那么它们之间的区别是什么?我可以理解收集的过程可能不是数学的,但是我想组织,分析和解释是我遗漏的东西吗?




4
自然对数的期望值
我知道具有 常数,因此给定,很容易解决。我也知道,当它是非线性函数时,例如在这种情况下,您不能应用它,为了解决这个问题,我必须做一个近似与泰勒的。所以我的问题是如何解决?我也可以和泰勒近似吗?a ,b E (X )E (1 / X )≠ 1 / E (X )E (ln (1 + X ))Ë(一个X+ b )= a E(X)+ bE(aX+b)=aE(X)+bE(aX+b) = aE(X)+b一,ba,ba,b Ë(X)E(X)E(X)Ë(1 / X)≠ 1 / E(X)E(1/X)≠1/E(X)E(1/X) \neq 1/E(X)Ë(ln(1 + X))E(ln⁡(1+X))E(\ln(1+X))

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.