Questions tagged «mathematical-statistics»

统计的数学理论,涉及形式定义和一般结果。

1
如果
我遇到了一个关于ARCH模型的属性的证明,该证明说,如果,则是固定的iff,其中ARCH模型是:{ X t } ∑ p i = 1 b i &lt; 1E(X2t)&lt;∞E(Xt2)&lt;∞\mathbb{E}(X_t^2) < \infty{Xt}{Xt}\{X_t\}∑pi=1bi&lt;1∑i=1pbi&lt;1\sum_{i=1}^pb_i < 1 Xt=σtϵtXt=σtϵtX_t = \sigma_t\epsilon_t σ2t=b0+b1X2t−1+...bpX2t−pσt2=b0+b1Xt−12+...bpXt−p2\sigma_t^2 = b_0 + b_1X_{t-1}^2 + ... b_pX_{t-p}^2 证明的主要思想是证明可以写为AR(p)进程,并且如果为真,则特征多项式的所有根都位于单位外部圈,因此是固定的。然后说是固定的。这是怎么回事? ∑ p i = 1 b i &lt; 1 { X 2 t } { X t }X2tXt2X_t^2∑pi=1bi&lt;1∑i=1pbi&lt;1\sum_{i=1}^pb_i < 1{X2t}{Xt2}\{X_t^2\}{Xt}{Xt}\{X_t\}

1
数据矩阵为对角线时套索问题的闭式解
\newcommand{\diag}{\operatorname{diag}}我们遇到了问题:\ min_ {w \ in \ mathbb {R} ^ {d}} \ left(\ frac {1} {n} \ sum_ {i = 1} ^ {n} \ left(\ langle w,x_ {i} \ rangle-y_ {i} \ right)^ {2} +2 \ lambda || w || _1 \ right),minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),\min_{w\in\mathbb{R}^{d}}\left( \frac{1}{n}\sum_{i=1}^{n} \left( \langle w,x_{i}\rangle-y_{i} \right)^{2} +2\lambda||w||_1\right), 并假设:∑i=1nxixTi=diag(σ21,...,σ2d).∑i=1nxixiT=diag⁡(σ12,...,σd2).\sum_{i=1}^nx_ix_i^T=\diag(\sigma_1^2,...,\sigma_d^2). 在这种情况下是否有封闭形式的解决方案? …

5
数理统计的哪些领域可高度采用?
我即将完成统计学方面的荣誉,我真的想获得博士学位,因为我发现数学统计学非常有趣。我最想攻读博士学位的研究领域是随机过程和时间序列。 但是,我也想在获得博士学位后在私营部门从事职业。我想知道私人机构中最常使用哪些数学统计领域,以及哪些类型的工作? 显然,我不会因为可以就业而去做博士学位,但是我认为这绝对是我需要考虑的事情,因此需要一些建议。

2
混沌理论在数据挖掘中已知的,现有的实际应用是什么?
在过去几年中随便阅读一些有关混沌理论的大众市场作品时,我开始想知道它的各个方面如何应用于数据挖掘和相关领域,例如神经网络,模式识别,不确定性管理等。到目前为止,我在已发表的研究中遇到了如此少的此类应用实例,我想知道是否a)它们实际上已在已知的,已发表的实验和项目中付诸实践,b)如果没有,为什么在这些相互关联的过程中却很少使用它们领域? 迄今为止,我所看到的大多数关于混沌理论的讨论都围绕着完全有用的科学应用展开,但与数据挖掘和模式识别等相关领域关系不大。物理学上的三体问题就是一个典型的例子。我想放弃对此类普通科学应用程序的讨论,而仅将问题局限于那些与数据挖掘和相关领域显然相关的应用程序,这些应用程序在文献中似乎很少。下面的潜在应用程序列表可以用作搜索已发表研究的起点,但是我只对那些实际上已经投入实践的应用程序感兴趣(如果有的话)。我正在寻找的是混沌理论对数据挖掘的已知实现,与潜在应用的清单相反,后者的范围要广得多。这是我在阅读时想到的有关数据挖掘应用程序的现成想法的一小部分;也许它们都不是实用的,也许有些在我们讲话时已经投入实际使用,但是按照我还不熟悉的术语去讲: 像几十年前Mandelbrot在模拟电话线中出现错误突发的情况下,Mandelbrot实际采用的方式一样,它可以识别模式识别中的相似结构。 在挖掘结果中遇到费根堡姆常数(也许以类似于弦理论家的方式震惊,他们发现麦克斯韦方程组在研究过程中突然出现在意外的地方)。 确定神经网络权重和各种挖掘测试的最佳位深度。我想知道这一点是因为数值尺度逐渐消失,对初始条件的敏感性开始发挥作用,部分原因是与混沌相关的函数的不可预测性。 以其他不一定与迷人的分形好奇心相关的方式使用分数维的概念,例如Menger Sponges,Koch Curves或Sierpinski Carpets。通过将该概念视为分数,可以以某种有益的方式将其应用于挖掘模型的维度吗? 推导幂函数定律,例如在分形中起作用的定律。 由于分形中遇到的函数是非线性的,所以我想知道非线性回归是否有实际应用。 混沌理论与熵之间存在切线(有时被夸大)关系,因此我想知道是否存在某种方法可以根据混沌理论中使用的函数来计算香农的熵(或对其及其亲属的限制),反之亦然。 识别数据中的周期倍增行为。 通过以一种有用的方式智能地选择最有可能“自我组织”的神经网络,从而确定神经网络的最佳结构。 混沌和分形等也与计算复杂度成切线关系,因此我想知道是否可以使用复杂度来识别混沌结构,反之亦然。 我首先听说了有关混沌理论的李雅普诺夫指数,从那时起,在特定神经网络的配方和熵的讨论中已经注意到了几次。 我可能没有在这里列出其他数十种关系。所有这些都浮现在我的头上。我对这些推测的具体答案并没有特别的兴趣,只是将它们作为可能在野外存在的应用程序类型的示例而扔掉了。我希望看到包含当前研究示例和此类想法的现有实现的答复,只要这些应用程序特别适用于数据挖掘。 即使在我更熟悉的领域(例如信息论,模糊集和神经网络),可能还有其他一些我不知道的现有实现,而我在其他领域的能力更弱,例如回归,因此输入更多不客气。我在这里的实际目的是确定是否对学习混沌理论的特定方面进行更多的投资,如果找不到明显的实用性,我将把它放在后面。 我搜索了CrossValidated,但没有看到任何直接解决混沌理论在数据挖掘中的功利性应用的主题。我能找到的最接近的主题是混沌理论,无方程建模和非参数统计。与特定的子集。

3
线性回归:是否有任何非正态分布给出OLS和MLE的身份?
这个问题的灵感来自长期的评论讨论: 线性回归如何使用正态分布? 在通常的线性回归模型中,为了简单此处写入只有一个预测器: ÿ一世= β0+ β1个X一世+ ϵ一世Yi=β0+β1xi+ϵi Y_i = \beta_0 + \beta_1 x_i + \epsilon_i 其中X一世xix_i是已知的常数,ϵ一世ϵi\epsilon_i是零均值独立误差项。如果我们除了承担的误差正态分布,则通常的最小二乘估计和最大似然估计β0,β1个β0,β1\beta_0, \beta_1是相同的。 因此,我的问题很简单:误差项是否存在其他分布,以使mle与普通最小二乘方估计量相同?一种含义很容易显示,另一种则不然。


2
离散均匀随机变量(?),在封闭区间内取所有有理值
我刚刚发生了(智力)恐慌发作。 一个连续的随机变量,它在一个封闭的间隔中遵循统一:这是一种非常熟悉的统计概念。 ü(a ,b )U(a,b)U(a,b) 在扩展的实数(一半或整个)上具有支持的连续均匀rv:不是rv固有的,而是基本贝叶斯概念,用于不适当的先验,有用和适用。 一个离散的统一值,其值是有限的:让我们扔一个测地线圆顶,没什么大不了的。 但是,一个函数具有一个以整数为界的封闭区间中包含的所有有理数(如果需要,以开头)的函数呢?我们想在概率框架中使用它,要求每个可能值与所有其他值都具有相等的概率吗?[ 0 ,1 ][0,1][0,1] 可能值的数量是无穷大的(表征许多离散分布),但是如果我们希望概率相等,那么如何表达单个值的概率呢? 我们能否说出证明这种实体是(不是)随机变量? 如果不是,这是否是“不当先验”的又一个化身(也许已经众所周知)? 这个实体在某种意义上是否可能定义为连续统一rv的“等效”(无论多么特别)?还是我只是犯了一个基本罪? 似乎该域是一个封闭的间隔这一事实并不能让我放手。有界的东西通常是可管理的。 为了指示内部漩涡,问题很多。我不是要得到每个问题的答案。 在任何时候,如果我想出任何见解,我都会进行更新。 更新:目前的问题在这里刚刚获得了一个建构主义的续集。



7
从统计理论和应用中了解
我最近获得了医学和生物学建模硕士学位,并以工程数学为背景。尽管我的教育计划包括大量的数学统计学课程(请参见下面的列表),而且我都取得了很高的成绩,但我经常最终完全迷失了对统计学的理论和应用的迷恋。我不得不说,与“纯粹的”数学相比,统计学对我而言确实没有什么意义。尤其是大多数统计学家(包括我以前的讲师)使用的符号和语言令人费解,并且到目前为止,我所见过的几乎所有资源(包括维基百科)都没有简单的例子可以轻松地与给定的理论联系起来并与之联系在一起。 .. 这是背景;我也意识到,如果没有牢牢掌握统计数据,尤其是在生物信息学领域,我就无法从事研究人员/工程师的工作,这真是令人痛苦的现实。 我希望可以从经验丰富的统计学家/数学家那里获得一些提示。如何克服上面提到的这个问题?你知道任何好的资源吗?例如书籍,电子书,公开课程(例如,通过iTunes或OpenCourseware)。 编辑:正如我提到的那样,我对统计的一般标题下的大多数文献都持偏颇(消极)的态度,并且由于我无法在每个统计分支购买大量(昂贵的)教科书,因此我需要就一本书而言,它与Tipler&Mosca 的物理学相似,但与统计学无关。 对于那些不了解Tipler的人;它是一本大型教科书,涵盖了人们在高等教育中可能遇到的绝大多数主题,并从基础入门到更详细地介绍了它们。基本上是一本完美的参考书,在我读大学的第一年就买了,仍然偶尔使用。 我参加过的统计课程: 大型的入门课程 平稳的随机过程 马尔可夫过程 蒙特卡洛方法 生存分析

1
循环统计中更高时刻的直觉
在循环统计中,圆上具有值的随机变量的期望值定义为 (请参阅Wikipedia)。这是一个非常自然的定义,方差 因此,我们不需要第二分钟即可定义方差!ZZZSSSm1(Z)=∫SzPZ(θ)dθm1(Z)=∫SzPZ(θ)dθ m_1(Z)=\int_S z P^Z(\theta)\textrm{d}\theta Var(Z)=1−|m1(Z)|.Var(Z)=1−|m1(Z)|. \mathrm{Var}(Z)=1-|m_1(Z)|. 尽管如此,我们定义了较高的矩 我承认,乍一看也很自然,并且与线性统计中的定义非常相似。但是我仍然感到有些不舒服,并且有以下几点mn(Z)=∫SznPZ(θ)dθ.mn(Z)=∫SznPZ(θ)dθ. m_n(Z)=\int_S z^n P^Z(\theta)\textrm{d}\theta. 问题: 1. 用上面定义的更高的矩(直觉)来衡量什么?分布的哪些特性可以用它们的矩来表征? 2.在较高矩的计算中,我们使用复数乘法,尽管我们将随机变量的值仅视为平面中的矢量或角度。我知道复数乘法在这种情况下本质上是角度的加法,但是仍然: 为什么复数乘法对循环数据有意义?

1
对Halmos-Savage定理的直觉理解
所述Halmos-野蛮定理说,对一个主导统计模型(Ω ,A,P)(Ω,A,P)(\Omega, \mathscr A, \mathscr P)的统计T:(Ω,A,P)→(Ω′,A′)T:(Ω,A,P)→(Ω′,A′)T: (\Omega, \mathscr A, \mathscr P)\to(\Omega', \mathscr A')是足够的,如果(且仅当)的所有{P∈P}{P∈P}\{P \in \mathscr{P} \} 有一个TTT氡Nikodym导衍生物的-measurable版本dPdP∗dPdP∗\frac{dP}{dP*},其中dP∗dP∗dP*是特权的措施,使得P∗=∑∞i=1PiciP∗=∑i=1∞PiciP*=\sum_{i=1}^\infty P_i c_i 为ci&gt;0,∑∞i=1ci=1ci&gt;0,∑i=1∞ci=1c_i >0, \sum _{i=1}^\infty c_i =1个Pi∈PPi∈PP_i \in \mathscr P。 我试图直观地理解为什么该定理成立,但我没有成功,所以我的问题是是否存在一种直观的方法来理解该定理。

11
标准偏差完全错误吗?如何计算高度,计数等(正数)的std?
假设我正在计算高度(以厘米为单位),并且数字必须大于零。 这是示例列表: 0.77132064 0.02075195 0.63364823 0.74880388 0.49850701 0.22479665 0.19806286 0.76053071 0.16911084 0.08833981 Mean: 0.41138725956196015 Std: 0.2860541519582141 在此示例中,根据正态分布,值的99.7%必须在平均值的标准偏差的±3倍之间。但是,即使两次标准偏差也变为负值: -2 x std calculation = 0.41138725956196015 - 0.2860541519582141 x 2 = -0,160721044354468 但是,我的数字必须为正。因此它们必须大于0。我可以忽略负数,但是我怀疑这是使用标准差计算概率的正确方法。 有人可以帮助我了解我是否以正确的方式使用它吗?还是我需要选择其他方法? 老实说,数学就是数学。是否为正态分布都没有关系。如果它适用于无符号数字,那么它也应适用于正数!我错了吗? 编辑1:添加直方图 更清楚地说,我添加了我的真实数据的直方图 EDIT2:一些值 Mean: 0.007041500928135767 Percentile 50: 0.0052000000000000934 Percentile 90: 0.015500000000000047 Std: 0.0063790857035425025 Var: 4.06873389299246e-05

2
没有UMP时如何定义拒绝区域?
考虑线性回归模型 y=Xβ+uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u}, u∼N(0,σ2I)u∼N(0,σ2I)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}), E(u∣X)=0E(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0}。 设与。ħ 1:σ 2 0 ≠ σ 2H0:σ20=σ2H0:σ02=σ2H_0: \sigma_0^2=\sigma^2H1:σ20≠σ2H1:σ02≠σ2H_1: \sigma_0^2\neq\sigma^2 我们可以推导出,其中。并且是灭者矩阵的典型表示法,其中是因变量在上回归了。ð我中号(X)=Ñ×ķ中号X中号XŶ= ÿ ÿ ÿXyTMXyσ2∼χ2(n−k)yTMXyσ2∼χ2(n−k)\frac{\mathbf{y}^T\mathbf{M_X}\mathbf{y}}{\sigma^2}\sim \chi^2(n-k)dim(X)=n×kdim(X)=n×kdim(\mathbf{X})=n\times kMXMX\mathbf{M_X}MXy=y^MXy=y^\mathbf{M_X}\mathbf{y}=\hat{\mathbf{y}}y^y^ \hat{\mathbf{y}}yy\mathbf{y}XX\mathbf{X} 我正在阅读的书指出: 之前,我曾问过应该使用什么标准来定义拒绝区域(RR),请参阅此问题的答案,主要的是选择使测试尽可能强大的RR。 在这种情况下,备选方案是双边复合假设,通常不需要UMP检验。而且,根据书中给出的答案,作者没有显示他们是否研究了RR的功能。尽管如此,他们还是选择了两尾RR。为什么会这样,因为该假设没有“单方面”确定RR? 编辑:此图像作为练习4.14的解决方案,在本书的解决方案手册中。

1
了解卡方检验和卡方分布
我试图理解卡方检验背后的逻辑。 卡方测试是。χ2然后比较卡方分布,找出一个p.value以拒绝或不零假设。H0:观测值来自我们用来创建期望值的分布。例如,我们可以测试获得概率是否如我们预期的那样由p给出。所以我们翻转100次,发现ñ^ h和1-ñ^ h。我们希望我们的发现比较预期是什么(100⋅p)。我们也可以使用二项式分布,但这不是问题的重点……问题是:χ2=∑(obs−exp)2expχ2=∑(obs−exp)2exp\chi ^2 = \sum \frac{(obs-exp)^2}{exp}χ2χ2\chi ^2H0H0H_0headpppnHnHn_H Heads1−nH1−nH1-n_H tails100⋅p100⋅p100 \cdot p 您能否解释一下为什么在零假设下遵循卡方分布吗?∑(obs−exp)2exp∑(obs−exp)2exp\sum \frac{(obs-exp)^2}{exp} 关于卡方分布,我所知道的是,度的卡方分布是k平方标准正态分布的总和。kkkkkk

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.