Questions tagged «mathematical-statistics»

统计的数学理论,涉及形式定义和一般结果。


9
在一个经常由外行进行分析的时代,我们是否夸大了模型假设和评估的重要性?
底线是,我对统计知识了解的越多,对本领域发表的论文的信任就越低;我只是认为研究人员的统计数据不够好。 我是一个外行,可以这么说。我接受了生物学方面的培训,但没有接受过统计学或数学方面的正规教育。我喜欢R,并且经常努力阅读(并理解...)进行研究时所用方法的一些理论基础。如果今天进行分析的大多数人实际上没有经过正式培训,这也不会令我感到惊讶。我发表了大约20篇原始论文,其中一些已被知名期刊所接受,而统计学家经常参与到审阅过程中。我的分析通常包括生存分析,线性回归,逻辑回归,混合模型。审阅者从未询问过模型假设,拟合或评估。 因此,我从未真正对模型假设,拟合和评估感到困扰。我从一个假设开始,执行回归,然后给出结果。在某些情况下,我努力评估了这些情况,但最终我总是以“ 好吧,它并不能满足所有假设,但是我相信结果(“主题知识”),并且它们是合理的,所以很好 ”和在咨询统计学家时,他们似乎总是同意。 现在,我已经与其他自己进行分析的统计学家和非统计学家(化学家,医师和生物学家)进行了交谈。似乎人们对所有这些假设和正式评估并没有太在意。但是在简历上,有很多人在询问残差,模型拟合,评估残差的方法,特征值,向量,等等。让我这样说,当lme4警告大型特征值时,我真的怀疑它的许多用户是否在意解决这个问题。 值得付出额外的努力吗?是否所有发表的结果中的大多数都不遵守这些假设,甚至可能没有对它们进行评估?这可能是一个日益严重的问题,因为数据库每天都在增长,并且有一种观念认为,数据越大,假设和评估就越不重要。 我可能是完全错误的,但这就是我对此的看法。 更新: 引自StasK的引用(如下):http : //www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509


19
数理统计视频
先前曾有一个问题寻求有关数学统计学教科书的建议 有人知道关于数学统计的任何在线视频讲座吗?我找到的最接近的是: 机器学习 计量经济学 更新:下面提到的许多建议都是良好的统计数据-101型视频。但是,我特别想知道是否有任何视频可以提供统计数据的严格数学表示。即,可能与课程相关的视频使用了在mathoverflow讨论中提到的教科书

14
高斯(正态)分布最令人惊讶的特征是什么?
可以通过明确给出其密度来定义上的标准化高斯分布: RR\mathbb{R}12π−−√e−x2/212πe−x2/2 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} 或其特征功能。 就像在这个问题中提到的那样,它也是样本均值和方差是独立的唯一分布。 您知道高斯测量的其他令人惊讶的替代特征是什么?我会接受最令人惊讶的答案


6
分布之间的Kolmogorov距离的动机
有许多方法可以测量两个概率分布的相似程度。在不同的圈子中流行的方法有: Kolmogorov距离:分布函数之间的超距离; 坎托罗维奇-鲁宾斯坦距离:两个具有Lipschitz常数的函数的期望值之间的最大差,也就是分布函数之间的L 1距离;1个1个1大号1个大号1个L^1 bounded-Lipschitz距离:与KR距离一样,但函数也必须具有最大绝对值。1个1个1 这些有不同的优点和缺点。实际上,只有3.意义上的收敛才真正对应于分布的收敛。一般而言,在1.或2.的意义上的收敛性要强一些。(特别是如果的概率为1,则Xn的分布收敛为0,但不在Kolmogorov距离内收敛。但是,如果极限分布是连续的,则不会发生这种病理情况。)Xñ= 1ñXñ=1个ñX_n=\frac{1}{n}1个1个1XñXñX_n000 从基本概率或测度理论的角度来看,1.很自然,因为它比较了某个集合中的概率。另一方面,更复杂的概率视角倾向于更多地关注期望而不是概率。同样,从功能分析的角度来看,基于二元性和某些功能空间的距离(如2.或3.)非常吸引人,因为有大量的数学工具可用于处理此类事物。 但是,我的印象(如果我错了,请纠正我!)是在统计中,Kolmogorov距离是衡量分布相似度的通常首选方法。我可以猜出一个原因:如果其中一个分布是在有限支持下离散的,特别是如果它是一些实际数据的分布,那么到模型分布的Kolmogorov距离就很容易计算。(实际上,KR距离的计算较难,BL距离实际上是不可能的。) 因此,我的问题(最后)是,出于统计目的,是否还有其他原因(无论是实践原因还是理论原因)都倾向于使用Kolmogorov距离(或其他距离)?


4
以泰勒级数的期望值(尤其是余数)
我的问题涉及试图证明一种广泛使用的方法的合理性,即采用泰勒级数的期望值。假设我们有一个随机变量XXX与正平均μμ\mu和方差σ2σ2\sigma^2。另外,我们有一个函数,例如log(x)log⁡(x)\log(x)。 这样做的泰勒展开logXlog⁡X\log X围绕平均值,我们得到 logX=logμ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξ3X,log⁡X=log⁡μ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξX3, \log X = \log\mu + \frac{X - \mu}{\mu} - \frac12 \frac{(X-\mu)^2}{\mu^2} + \frac13 \frac{(X - \mu)^3}{\xi_X^3}, 其中,按照惯例,ξXξX\xi_X是ST|ξX−μ|&lt;|X−μ||ξX−μ|&lt;|X−μ||\xi_X - \mu| < |X - \mu|。 如果我们的预期,我们将得到一个近似方程,人们通常所说的东西自我明显(见≈≈\approx第一个方程式符号这里): ElogX≈logμ−12σ2μ2Elog⁡X≈log⁡μ−12σ2μ2 \mathbb{E}\log X \approx \log \mu - \frac12 \frac{\sigma^2}{\mu^2} 问:我感兴趣的是如何证明余项的预期值实际上是可以忽略不计,即 E[(X−μ)3ξ3X]=o(σ2)E[(X−μ)3ξX3]=o(σ2) \mathbb{E}\left[\frac{(X - \mu)^3}{\xi_X^3}\right] = o(\sigma^2) (或,换句话说,E[o(X−μ)2]=o(E[(X−μ)2])E[o(X−μ)2]=o(E[(X−μ)2])\mathbb{E}\bigl[o(X-\mu)^2\bigr] = o\bigl(\mathbb{E}\bigl[(X-\mu)^2\bigr]\bigr))。 我试图做的:假定σ2→0σ2→0\sigma^2 \to 0(这反过来,装置X→μX→μX …

9
相关并不意味着因果关系;但是什么时候变量是时间呢?
我知道这个问题已经问过十亿次了,因此,在网上看后,我完全相信2个变量之间的相关性并不表示因果关系。在我今天的一次统计讲座中,我们做了一次物理学家的客座演讲,内容涉及统计学方法在物理学中的重要性。他说了一个惊人的声明: 相关性并不意味着因果关系,除非变量是时间。因此,如果某个自变量与时间之间存在很强的相关性,那么这也暗示了因果关系。 我以前从未听过这句话。物理学家/相对主义者对“因果”的看法与统计人员不同吗?

3
我怎样才能计算
假设和Φ (⋅ )是密度函数和标准正态分布的分布函数。ϕ (⋅ )ϕ(⋅)\phi(\cdot)Φ (⋅ )Φ(⋅)\Phi(\cdot) 如何计算积分: ∫∞- ∞Φ (w − ab) ϕ(w)d w∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

3
考虑的总和
我一直在想这个问题。我觉得它突然发生有点奇怪。基本上,为什么我们只需要三个均匀的ZnZnZ_n就能平滑呢?为何平滑化如此迅速地进行? Z2Z2Z_2: Z3Z3Z_3: (图像从John D. Cook的博客中无耻地被盗:http : //www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/) 为什么不用四套制服?还是五个?要么...?

3
均值,中位数和众数之间的经验关系
对于中等偏斜的单峰分布,我们在均值,中位数和众数之间具有以下经验关系: 这种关系如何派生出来的?(平均数-模式)〜3(平均-中位数)(Mean - Mode)∼3(Mean - Median) \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} 在形成这个结论之前,卡尔·皮尔森(Karl Pearson)是否绘制了成千上万个这样的关系,还是在这种关系背后有逻辑上的推理?


4
扎实的数学知识是掌握ML的必备条件吗?
我开始想提升自己的技能,而我一直对机器学习着迷。但是,六年前,我决定继续攻读计算机科学,而没有追求这一目标,而不是追求这一目标。 我从事软件和应用程序的开发已有大约8至10年的时间,因此我拥有良好的处理能力,但似乎无法理解机器学习/概率/统计的数学方面。 我开始看学习材料,在第一页上可能包含使我困惑并立即在学习中设置障碍的内容。 扎实的数学知识是掌握ML的必备条件吗?在继续学习ML之前,我应该尝试填补数学的空白吗?在没有任何计算机科学背景的情况下,自我学习真的可以只对开发人员有效吗? 相关问题: 在《统计学习要素》之前预定阅读吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.