Questions tagged «mathematical-statistics»

统计的数学理论,涉及形式定义和一般结果。

5
当中心极限定理和大数定律不一致时
从本质上讲,这是我在math.se上发现的一个问题的复制,但没有得到我所希望的答案。 令为一系列独立的,均布的随机变量,其中和。{Xi}i∈N{Xi}i∈N\{ X_i \}_{i \in \mathbb{N}}E[Xi]=1E[Xi]=1\mathbb{E}[X_i] = 1V[Xi]=1V[Xi]=1\mathbb{V}[X_i] = 1 考虑对 limn→∞P(1n−−√∑i=1nXi≤n−−√)limn→∞P(1n∑i=1nXi≤n) \lim_{n \to \infty} \mathbb{P}\left(\frac{1}{\sqrt{n}} \sum_{i=1}^n X_i \leq \sqrt{n}\right) 由于不平等事件的两面都趋于无穷大,因此必须对此表达式进行操作。 A)尝试减法 在考虑限制语句之前,请从两侧减去n−−√n\sqrt{n}: limn→∞P(1n−−√∑i=1nXi−n−−√≤n−−√−n−−√)=limn→∞P(1n−−√∑i=1n(Xi−1)≤0)=Φ(0)=12limn→∞P(1n∑i=1nXi−n≤n−n)=limn→∞P(1n∑i=1n(Xi−1)≤0)=Φ(0)=12\lim_{n \to \infty} \mathbb{P}\left(\frac{1}{\sqrt{n}} \sum_{i=1}^n X_i -\sqrt{n} \leq \sqrt{n}-\sqrt{n} \right) = \lim_{n \to \infty} \mathbb{P}\left(\frac{1}{\sqrt{n}} \sum_{i=1}^n (X_i - 1) \leq 0\right) \\ = \Phi(0) = \frac{1}{2} CLT的最后一个等式,其中Φ()Φ()\Phi()是标准正态分布函数。 …

4
到底是什么时刻?它们是如何衍生的?
通常,我们通过“使总体矩等于其样本对等体”来介绍矩估计器的方法,直到我们估算出总体的所有参数为止。这样,在正态分布的情况下,我们只需要第一刻和第二刻,因为它们可以完全描述这种分布。 Ë(X)= μ⟹∑ñ我= 1X一世/ n= X¯Ë(X)=μ⟹∑一世=1个ñX一世/ñ=X¯E(X) = \mu \implies \sum_{i=1}^n X_i/n = \bar{X} Ë(X2)= μ2+ σ2⟹∑ñ我= 1X2一世/ nË(X2)=μ2+σ2⟹∑一世=1个ñX一世2/ñE(X^2) = \mu^2 + \sigma^2 \implies \sum_{i=1}^n X_i^2/n 从理论上讲,我们最多可以将额外时刻计算为:ññn Ë(X[R)⟹∑ñ我= 1X[R一世/ nË(X[R)⟹∑一世=1个ñX一世[R/ñE(X^r) \implies \sum_{i=1}^nX_i^r /n 我该如何为真正的时刻建立直觉?我知道它们作为一个概念存在于物理学和数学中,但是我发现它们都不直接适用,特别是因为我不知道如何将抽象概念从质量概念扩展到数据点。该术语似乎在统计学中以特定方式使用,这与其他学科中的用法不同。 我的数据的什么特征决定了总共有多少()个力矩?[R[Rr


2
构造一个离散的rv,以支持所有原理
这是这个问题的建构主义后遗症。 如果我们不能有一个离散的统一随机变量来支持区间中的所有有理数,那么下一个最好的事情就是: [0,1][0,1][0,1] 构造一个具有此支持的随机变量,,并遵循一定的分布。我的工匠要求此随机变量是根据现有分布构建的,而不是通过抽象定义我们想要获得的内容来创建的。Q ∈ Q ∩ [ 0 ,1 ]QQQQ∈Q∩[0,1]Q∈Q∩[0,1]Q\in \mathbb{Q}\cap[0,1] 因此,我提出了以下建议: 令为遵循参数的Geometric Distribution-Variant II的离散随机变量,即0 &lt; p &lt; 1XXX0&lt;p&lt;10&lt;p&lt;10<p<1 X∈{0,1,2,...},P(X=k)=(1−p)kp,FX(X)=1−(1−p)k+1X∈{0,1,2,...},P(X=k)=(1−p)kp,FX(X)=1−(1−p)k+1 X \in \{0,1,2,...\},\;\;\;\; P(X=k) = (1-p)^kp,\;\;\; F_X(X) = 1-(1-p)^{k+1} 还令为遵循相同参数的几何分布-变量I的离散随机变量,即pYYYppp Y∈{1,2,...},P(Y=k)=(1−p)k−1p,FY(Y)=1−(1−p)kY∈{1,2,...},P(Y=k)=(1−p)k−1p,FY(Y)=1−(1−p)k Y \in \{1,2,...\},\;\;\;\; P(Y=k) = (1-p)^{k-1}p,\;\;\; F_Y(Y) = 1-(1-p)^k XXX和是独立的。现在定义随机变量YYY Q=XYQ=XYQ = \frac {X}{Y} 并考虑条件分布 P(Q≤q∣{X≤Y})P(Q≤q∣{X≤Y})P(Q\leq q \mid …

4
有条件期望证明作为最佳预测因子的问题
我的证明有问题 E(Y|X)∈argming(X)E[(Y−g(X))2]E(Y|X)∈arg⁡ming(X)E[(Y−g(X))2]E(Y|X) \in \arg \min_{g(X)} E\Big[\big(Y - g(X)\big)^2\Big] 这很可能表明人们对期望和有条件的期望有更深的误解。 我知道的证明如下(此证明的另一个版本可以在这里找到) ===argming(X)E[(Y−g(x))2]argming(X)E[(Y−E(Y|X)+E(Y|X)−g(X))2]argming(x)E[(Y−E(Y|X))2+2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]argming(x)E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]arg⁡ming(X)E[(Y−g(x))2]=arg⁡ming(X)E[(Y−E(Y|X)+E(Y|X)−g(X))2]=arg⁡ming(x)E[(Y−E(Y|X))2+2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]=arg⁡ming(x)E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]\begin{align*} &\arg \min_{g(X)} E\Big[\big(Y - g(x)\big)^2\Big]\\ = &\arg \min_{g(X)} E \Big[ \big(Y - E(Y|X) + E(Y|X) - g(X)\big)^2\Big]\\ =&\arg \min_{g(x)} E \Big[ \big(Y - E(Y|X)\big)^2 + 2 \big(Y - E(Y|X)\big) \big(E(Y|X) - g(X)\big) + \big(E(Y|X) - g(X)\big)^2\Big]\\ =&\arg \min_{g(x)} E …

3
证明矩生成函数唯一确定概率分布
Wackerly等人的文字指出该定理“让和分别表示随机变量X和Y的矩产生函数。如果两个矩产生函数都存在并且对于所有t值,则X和Y具有相同的概率分布。” 没有证据表明其超出了本文的范围。Scheaffer Young 在没有证明的情况下也具有相同的定理。我没有Casella,但是Google图书搜索似乎没有在其中找到定理。mx(t)mx(t)m_x(t)my(t)my(t)m_y(t)mx(t)=my(t)mx(t)=my(t)m_x(t) = m_y(t) Gut的文本似乎具有证明的轮廓,但是没有提及“众所周知的结果”,还需要知道另一个未提供证明的结果。 有谁知道谁最初证明了这一点,并且该证明是否可以在任何地方在线获得?否则,将如何填写这一证明的细节? 如果我不被问到这不是一个家庭作业问题,但我可以想象这可能是某人的家庭作业。我根据Wackerly的文字选了一个课程序列,一段时间以来,我一直在想知道这个证明。所以我认为是时候问了。

4
魔术金钱树问题
我想到淋浴时会遇到这个问题,这是受投资策略启发的。 假设有一棵神奇的金钱树。每天,您都可以向货币树提供一定数量的货币,它将使货币树增加三倍,或者以50/50的概率销毁它。您会立即注意到,这样做平均可以使您赚钱,并且渴望利用金钱树。但是,如果您一次提供所有资金,那么您将损失50%的资金。不能接受!您是一个非常规避风险的人,因此您决定提出一项策略。您想最大程度地减少失去所有东西的几率,但同时也想赚到尽可能多的钱!您提出以下建议:每天,您将20%的当前资本提供给金钱树。假设您可以提供的最低价格是1美分,那么如果您以10美元开始,则需要31连胜损失所有资金。更重要的是,您赚取的现金越多,失去一切所需的连败时间就越长,太棒了!您迅速开始赚取大量现金。但是,随后一个想法浮现在脑海:您每天只能出价30%,赚更多的钱!但是,等等,为什么不提供35%?50%?有一天,当您眼中有大笔美元符号时,您将拥有数以百万计的资金流向金钱树,并提供您现金的100%,金钱树很快就会消耗掉。第二天,您在麦当劳工作。金钱树立即燃烧。第二天,您在麦当劳工作。金钱树立即燃烧。第二天,您在麦当劳工作。 是否可以提供不浪费全部现金的最佳百分比? (子)问题: 如果您要提供一个最佳百分比,这是静态的(即每天20%)还是随着您的资本增加而增加? 通过每天提供20%的资金,损失所有金钱的几率会随着时间的流逝而减少还是增加?随着时间的流逝,失去所有钱的几率会增加一定百分比的钱吗?

3
非正态样本的样本方差的渐近分布
这是造成问题的更一般的处理 这个问题。在得出样本方差的渐近分布之后,我们可以应用Delta方法得出标准差的相应分布。 设一个大小为的iid 非正态随机变量,均值和方差。将样本均值和样本方差设置为 { X i } ,nnn{Xi},i=1,...,n{Xi},i=1,...,n\{X_i\},\;\; i=1,...,nμμ\muσ2σ2\sigma^2x¯=1n∑i=1nXi,s2=1n−1∑i=1n(Xi−x¯)2x¯=1n∑i=1nXi,s2=1n−1∑i=1n(Xi−x¯)2\bar x = \frac 1n \sum_{i=1}^nX_i,\;\;\; s^2 = \frac 1{n-1} \sum_{i=1}^n(X_i-\bar x)^2 我们知道 E(s2)=σ2,Var(s2)=1n(μ4−n−3n−1σ4)E(s2)=σ2,Var⁡(s2)=1n(μ4−n−3n−1σ4)E(s^2) = \sigma^2, \;\;\; \operatorname {Var}(s^2) = \frac{1}{n} \left(\mu_4 - \frac{n-3}{n-1}\sigma^4\right) 其中μ4=E(Xi−μ)4μ4=E(Xi−μ)4\mu_4 = E(X_i -\mu)^4,我们将注意力集中在需要存在且有限的矩,确实存在且为有限矩的分布上。 它持有吗 n−−√(s2−σ2)→dN(0,μ4−σ4)?n(s2−σ2)→dN(0,μ4−σ4)?\sqrt n(s^2 - \sigma^2) \rightarrow_d N\left(0,\mu_4 - \sigma^4\right)\;\; ?



5
统计学家为什么要定义随机矩阵?
我十年前学习数学,所以我有数学和统计学背景,但是这个问题使我丧命。 这个问题对我来说仍然有点哲学。为什么统计学家开发各种技术以处理随机矩阵?我的意思是,随机向量不能解决问题吗?如果不是,那么随机矩阵的不同列的平均值是多少?Anderson(2003,Wiley)认为随机向量是只有一列的随机矩阵的特例。 我看不到具有随机矩阵的意义(而且我敢肯定那是因为我很无知)。但是,忍受我。想象一下,我有一个包含20个随机变量的模型。如果要计算联合概率函数,为什么要将它们描绘成矩阵而不是向量? 我想念什么? ps:很抱歉,您对这个问题的标签打的不好,但是没有随机矩阵的标签,我还不能创建一个! 编辑:将矩阵更改为标题中的矩阵



3
具有非零渐近方差的渐近一致性-它代表什么?
这个问题以前已经提出过,但是我想问一个具体的问题,试图得出一个可以澄清(和分类)它的答案: 在“穷人的无症状”中, (a)概率收敛为常数的一系列随机变量 与之相反 (b)一系列随机变量,其概率收敛于一个随机变量(因此分布于该变量)。 但是在“智者的渐近”中,我们也可以 (c)一系列随机变量,它们的概率收敛到一个常数,同时在极限处保持非零方差。 我的问题是(从下面我自己的探索性答案中窃取): 我们如何才能理解渐近一致但也具有非零的有限方差的估计量?这种差异反映了什么?它的行为与“通常的”一致估计量有何不同? 与(c)中描述的现象相关的线程(另请参见注释): 一致估计和无偏估计之间有什么区别? /stats/120553/convergence-of-an-estimator-with-infinite-variance 为什么渐近一致估计量在无穷大处没有零方差? 几乎可以确定收敛和极限方差为零

4
什么是独立背后的直觉和,?
我希望有人提出一个论点,解释为什么随机变量 和( 具有标准正态分布的在统计上是独立的。MGF技术很容易证明这一事实,但是我发现这非常违反直觉。Y1=X2−X1Y1=X2−X1Y_1=X_2-X_1Y2=X1+X2Y2=X1+X2Y_2=X_1+X_2XiXiX_i 因此,如果有任何直觉,我将不胜感激。 先感谢您。 编辑:下标不表示订单统计,而是来自标准正态分布的IID观察值。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.