Questions tagged «central-limit-theorem»

对于有关中心极限定理的问题,它指出:“在某些条件下,足够多的独立随机变量迭代的均值将近似正态分布,每个均具有定义明确的均值和定义明确的方差。” (维基百科)

1
相关随机变量加权和的“中心极限定理”
我正在读一篇声称 X^ķ= 1ñ--√∑j = 0ñ− 1XĴË- 我2 πk j / N,X^ķ=1个ñ∑Ĵ=0ñ-1个XĴË-一世2πķĴ/ñ,\hat{X}_k=\frac{1}{\sqrt{N}}\sum_{j=0}^{N-1}X_je^{-i2\pi kj/N}, (即离散傅立叶变换(DFT)表示CLT趋向于(复杂)高斯随机变量。但是,我知道通常情况并非如此。在阅读了这个(谬误的)论点之后,我在网上搜索并找到了Peligrad&Wu的2010年论文,他们证明对于某些平稳过程,人们可以找到“ CLT定理”。 我的问题是:您是否还有其他参考文献试图解决找到给定索引序列的DFT的极限分布(无论是通过模拟还是从理论上)的问题?给定在时间序列分析或非平稳序列的派生/应用中的某些协方差结构,我对收敛速度(即DFT收敛的速度)特别感兴趣。XĴXĴX_j

2
马尔可夫链的中心极限定理
\newcommand{\E}{\mathbb{E}}\newcommand{\P}{\mathbb{P}}中心极限定理(CLT)规定,对于X1个,X2,…X1,X2,…X_1,X_2,\dots独立且分布相同(iid),E [ X一世] = 0E[Xi]=0\E[X_i]=0和Var(X一世)&lt; ∞Var⁡(Xi)&lt;∞\operatorname{ Var} (X_i)<\infty,总和收敛为n \ to \ infty的正态分布n → ∞n→∞n\to\infty: ∑我= 1ñX一世→ N( 0 ,n--√)。∑i=1nXi→N(0,n). \sum_{i=1}^n X_i \to N\left(0, \sqrt{n}\right). 取而代之的是,假设X_1,X_2,\点X1个,X2,…X1,X2,…X_1,X_2,\dots形成具有期望值为0和有界方差的固定分布\ P_ \ infty的有限状态马尔可夫链P∞P∞\P_\infty。对于这种情况,是否有CLT的简单扩展? 我在CLT上找到的关于马尔可夫链的论文通常会处理更一般的情况。我将非常感谢您提供有关总体结果的说明以及如何应用的解释。

3
中心极限定理和帕累托分布
有人可以提供有关帕累托分布和中心极限定理之间关系的简单解释(例如,适用吗?为什么/为什么不呢?)?我试图理解以下陈述: “中心极限定理不适用于所有分布。这是由于一个偷偷摸摸的事实-样本均值聚集在基础分布的均值周围(如果存在的话)。但是分布如何没有均值呢?帕累托分布没有任何意义。如果您尝试使用通常的方法进行计算,则它会发散到无穷大。”

2
独立平方均匀随机变量之和的平方根的期望
让X1,…,Xn∼U(0,1)X1,…,Xn∼U(0,1)X_1,\dots,X_n \sim U(0,1)是独立的,identicallly分布式标准统一的随机变量。 Let Yn=∑inX2iI seek: E[Yn−−√]Let Yn=∑inXi2I seek: E[Yn]\text{Let }\quad Y_n=\sum_i^nX_i^2 \quad \quad \text{I seek: } \quad \mathbb{E}\big[\sqrt{Y_n } \big] YnYnY_n的期望很容易: E[X2]E[Yn]=∫10y2y√=13=E[∑inX2i]=∑inE[X2i]=n3E[X2]=∫01y2y=13E[Yn]=E[∑inXi2]=∑inE[Xi2]=n3\begin{align} \mathbb{E}\left[X^2\right] &=\int_0^1\frac{y}{2\sqrt{y}}=\frac{1}{3}\\ \mathbb{E}\left[Y_n\right] &=\mathbb{E}\left[\sum_i^nX_i^2\right] = \sum_i^n\mathbb{E}\left[X_i^2\right]=\frac{n}{3} \end{align} 现在是无聊的部分。要申请LOTUS,我需要YnYnY_n的pdf 。当然,两个独立随机变量之和的pdf是其pdf的卷积。但是,这里我们有nnn随机变量,我猜想卷积会导致一个...卷积的表达式(意想不到的双关语)。有没有更聪明的方法? 我希望看到正确的解决方案,但如果不可能或过于复杂,则可以接受大nnn的渐近近似。根据詹森的不等式,我知道 E[Yn]−−−−−√=n3−−√≥E[Yn−−√]E[Yn]=n3≥E[Yn]\sqrt{\mathbb{E}[Y_n]}=\sqrt{\frac{n}{3}}\geq\mathbb{E}\left[\sqrt{Y_n}\right] 但这对我没有多大帮助,除非我还能找到一个不平凡的下限。请注意,CLT不适用于此处,因为我们拥有独立RV的总和的平方根,而不仅仅是独立RV的总和。也许可能存在其他极限定理(我忽略了),在这里可能会有帮助。

1
正态分布误差和中心极限定理
在Wooldridge的《计量经济学入门》一书中有一个报价: 证明误差的正态分布合理的参数通常是这样的:由于是影响的许多不同的未观察因素的总和,因此我们可以调用中心极限定理来得出具有近似正态分布的结论。uuuyyyuuu 此引用与线性模型假设之一有关,即: u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2) 其中uuu是总体模型中的误差项。 现在,据我所知,中心极限定理指出 Zi=(Yi¯¯¯¯¯−μ)/(σ/√n)Zi=(Yi¯−μ)/(σ/√n)Z_i=(\overline{Y_i}-μ)/(σ/√n) (其中Yi¯¯¯¯¯Yi¯\overline{Y_i} 是从任何具有均值μμμ和方差σ^ 2的总体中抽取的随机样本的平均值σ2σ2σ^2) 接近标准正态变量的n→∞n→∞n \rightarrow \infty。 题: 帮助我了解Z_i的渐近正态性如何ZiZiZ_i暗示u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2)


1
完整的概率分布集合的拓扑
我一直在努力使我对概率分布的直观理解与几乎所有概率分布拓扑都具有的怪异属性相协调。 例如,考虑一个混合随机变量:选择一个以0为中心,方差为1且概率为的高斯,将加到结果中。此类随机变量的序列将收敛(微弱且总变化)为以0为中心且方差为1的高斯,但的均值始终为,方差收敛为。我真的不喜欢说这个序列因此而收敛。1XnXnX_n nXn1+∞1n1n\frac{1}{n}nnnXnXnX_n111+∞+∞+\infty 我花了相当长的时间来记住所有关于拓扑遗忘的内容,但最终我弄清楚了这些示例令我感到不满意的是:序列的限制不是常规分布。在上面的示例中,限制为怪异的“均值1和无穷方差的高斯”。用拓扑学的术语来说,在弱者(以及电视以及我看过的所有其他拓扑学)下,概率分布集并不完整。 然后,我面临以下问题: 是否存在拓扑结构使得概率分布集合完整? 如果否,那么这种缺失是否反映了概率分布集合的有趣特性?还是只是无聊? 注意:我已对“概率分布”提出了自己的问题。这些不能关闭,因为它们可以收敛到Diracs和类似没有pdf的东西。但是在薄弱的拓扑结构下仍然没有采取措施,所以我的问题仍然存在 交叉发布到mathoverflow /mathpro/226339/topologies-for-which-the-ensemble-of-probability-measures-is-complete?noredirect=1#comment558738_226339

1
关于t检验的正态假设的问题
对于t检验,根据大多数文献,假设人口数据呈正态分布。我不知道为什么。t检验不是只要求样本均值的抽样分布是正态分布,而不是总体吗? 如果情况是t检验最终只要求样本分布具有正态性,那么总体可以看起来像任何分布,对吗?只要样本数量合理即可。那不是中央极限定理所陈述的吗? (我在这里指的是一个样本或独立样本的t检验)

3
如果,
假定设置如下: 令Zi=min{ki,Xi},i=1,...,nZi=min{ki,Xi},i=1,...,nZ_i = \min\{k_i, X_i\}, i=1,...,n。还有Xi∼U[ai,bi],ai,bi&gt;0Xi∼U[ai,bi],ai,bi&gt;0X_i \sim U[a_i, b_i], \; a_i, b_i >0。而且ki=cai+(1−c)bi,0&lt;c&lt;1ki=cai+(1−c)bi,0&lt;c&lt;1k_i = ca_i + (1-c)b_i,\;\; 0 k_i) = 1- \Pr(X_i \le k_i) =1−ki−aibi−ai=1−(1−c)(bi−ai)bi−ai=c=1−ki−aibi−ai=1−(1−c)(bi−ai)bi−ai=c= 1- \frac {k_i - a_i}{b_i-a_i} = 1-\frac {(1-c)(b_i-a_i)}{b_i-a_i} =c 因此,在所有 FZi(zi)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪0zi&lt;aizi−aibi−aiai≤zi&lt;ki1ki≤ziFZi(zi)={0zi&lt;aizi−aibi−aiai≤zi&lt;ki1ki≤ziF_{Z_i}(z_i) = \begin{cases} 0\qquad z_i0zi=kizi=kiz_i = k_i 总而言之,它等于现实的统一。 我想能够得出或表示随机变量S_n \ equiv \ sum_ {i = …

2
分布\ CLT中的收敛
鉴于 N=nN=nN = n,条件限制区。的YYY 是 χ2(2n)χ2(2n)\chi ^2(2n)。 NNN有边际收益。泊松(θθ\theta), θθ\theta 是一个正常数。 证明为 θ→∞θ→∞\theta \rightarrow \infty, (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1) 在分配。 谁能提出解决这个问题的策略。似乎我们需要使用CLT(中心极限定理),但是要获取任何信息似乎很难YYY在其自己的。是否可以引入rv来取样,生成YYY? 这是家庭作业这样的提示理解。

1
不存在力矩时的CLT示例
考虑Xñ=⎧⎩⎨1个− 12ķWP (1 -2− n)/ 2WP (1 -2− n)/ 2wp 2− k 对于 k &gt; nXn={1w.p. (1−2−n)/2−1w.p. (1−2−n)/22kw.p. 2−k for k&gt;nX_n = \begin{cases} 1 & \text{w.p. } (1 - 2^{-n})/2\\ -1 & \text{w.p. } (1 - 2^{-n})/2\\ 2^k & \text{w.p. } 2^{-k} \text{ for } k > n\\ \end{cases} 我需要证明,即使有无限的瞬间,ñ--√(X¯ñ)→dñ(0 …

2
混合模型的参数,半参数和非参数引导
接下来的嫁接摘自本文。我是新手,要引导并尝试为带有R boot包的线性混合模型实现参数,半参数和非参数自举。 R代码 这是我的R代码: library(SASmixed) library(lme4) library(boot) fm1Cult &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn &lt;- function(data, indices){ data &lt;- data[indices, ] mod &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out &lt;- boot(data=Cultivation, statistic=boot.fn, R=99) Out 问题 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.