Questions tagged «convergence»

收敛通常是指随着样本量趋于无穷大,一定样本量的序列趋于恒定。收敛还是迭代算法的一个属性,可以稳定在某个目标值上。

1
Gelman和Rubin收敛性诊断,如何泛化以使用向量?
Gelman和Rubin诊断程序用于检查并行运行的多个mcmc链的收敛性。它将链内方差与链间方差进行比较,说明如下: 步骤(针对每个参数): 从过度分散的起始值运行m≥2个长度为2n的链。 丢弃每个链中的前n个平局。 计算链内和链间方差。 将参数的估计方差计算为链内方差和链间方差的加权和。 计算潜在的水垢减少因子。 项目清单 我想使用此统计信息,但我想使用的变量是随机向量。 在这种情况下,取协方差矩阵的均值是否有意义?

4
对一致和渐近无偏的区别的直觉理解
我试图对“一致”和“渐近无偏”一词之间的区别和实际区别获得直观的理解和感觉。我知道他们的数学/统计定义,但是我正在寻找直观的东西。在我看来,看看他们的个人定义,他们几乎是同一回事。我意识到差异一定很细微,但我看不到。我试图将差异可视化,但不能做到。有人可以帮忙吗?

1
使用进行假设检验,因为收敛速度更快?
假设我有是iid,并且我想做一个假设检验,为0。假设我有大n,并且可以使用中心极限定理。我还可以做一个测试为0,这等效于测试为0。此外,收敛到卡方,其中收敛到法线。因为具有更快的收敛速度,所以我不应该将其用于测试统计量,这样我将获得更快的收敛速度并且测试会更高效吗?X1,…,XnX1,…,XnX_1,\ldots,X_nμμ\muμ2μ2\mu^2μμ\mun(X¯2−0)n(X¯2−0)n(\bar{X}^2 - 0)n−−√(X¯−0)n(X¯−0)\sqrt{n}(\bar{X} - 0)X¯2X¯2\bar{X}^2 我知道这种逻辑是错误的,但是我已经思考了很长时间,无法弄清原因。

2
当两个序列都收敛到一个非退化随机变量时,Slutsky定理仍然有效吗?
我对Slutsky定理的一些细节感到困惑: 令{Xn}{Xn}\{X_n\},{Yn}{Yn}\{Y_n\}是两个标量/向量/矩阵随机元素序列。 如果XnXnX_n的分布收敛到一个随机元素XXX而YnYnY_n 的概率收敛到一个常数ccc,则Xn+Yn XnYn Xn/Yn →d X+c→d cX→d X/c,Xn+Yn →d X+cXnYn →d cXXn/Yn →d X/c,\eqalign{ X_{n}+Y_{n}\ &{\xrightarrow {d}}\ X+c\\ X_{n}Y_{n}\ &{\xrightarrow {d}}\ cX\\ X_{n}/Y_{n}\ &{\xrightarrow {d}}\ X/c, } 前提是ccc是可逆的,其中→d→d{\xrightarrow {d}}表示分布收敛。 如果Slutsky定理中的两个序列都收敛到一个非退化的随机变量,那么该定理仍然有效,如果无效(有人可以提供一个例子吗?),使它有效的额外条件是什么?

3
关于概率收敛
让{Xn}n≥1{Xn}n≥1\{X_n\}_{n\geq 1}是随机变量ST的序列Xn→aXn→aX_n \to a在概率,其中a&gt;0a&gt;0a>0是固定不变的。我正在尝试显示以下内容: Xn−−−√→a−−√Xn→a\sqrt{X_n} \to \sqrt{a} 和 aXn→1aXn→1\frac{a}{X_n}\to 1 的概率均相同。我在这里看看我的逻辑是否正确。这是我的工作 尝试 对于第一部分,我们有 |Xn−−−√−a−−√|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn−−−√+a−−√|=ϵ|(Xn−−−√−sqrta)+2a−−√||Xn−a|&lt;ϵ⟸|Xn−a|&lt;ϵ|Xn+a|=ϵ|(Xn−sqrta)+2a||\sqrt{X_n}-\sqrt{a}|<\epsilon \impliedby |X_n-a|<\epsilon|\sqrt{X_n}+\sqrt{a}|=\epsilon|(\sqrt{X_n}-sqrt{a})+2\sqrt{a}| ≤ϵ|Xn−−−√−a−−√|+2ϵa−−√&lt;ϵ2+2ϵa−−√≤ϵ|Xn−a|+2ϵa&lt;ϵ2+2ϵa\leq \epsilon|\sqrt{X_n}-\sqrt{a}|+2\epsilon\sqrt{a}<\epsilon^2+2\epsilon\sqrt{a} 注意, ϵ2+2ϵa−−√&gt;ϵa−−√ϵ2+2ϵa&gt;ϵa\epsilon^2+2\epsilon\sqrt{a}>\epsilon\sqrt{a} 则 P(|Xn−−−√−a−−√|≤ϵ)≥P(|Xn−a|≤ϵa−−√)→1asn→∞P(|Xn−a|≤ϵ)≥P(|Xn−a|≤ϵa)→1asn→∞P(|\sqrt{X_n}-\sqrt{a}|\leq \epsilon)\geq P(|X_n-a|\leq \epsilon\sqrt{a})\to 1 \;\;as\;n\to\infty ⟹Xn−−−√→a−−√inprobability⟹Xn→ainprobability\implies \sqrt{X_n}\to\sqrt{a} \;\;in\;probability 对于第二部分,我们有 现在,由于 X n → a为 n → ∞,我们得到 X n是有界序列。换句话说,存在一个实数中号&lt; ∞ ST | X n | ≤ 中号。因此, | …


3
另一个中心极限定理问题
令为具有的独立伯努利随机变量序列 设置 表明在分布上收敛于标准正态变量因为趋于无穷大。P { X ķ = 1 } = 1 - P { X ķ = 0 } = 1{Xn:n≥1}{Xn:n≥1}\{X_n:n\ge1\}Sn= n ∑ k=1(Xk−1P{Xk=1}=1−P{Xk=0}=1k.P{Xk=1}=1−P{Xk=0}=1k.P\{X_k=1\}=1-P\{X_k=0\}=\frac{1}{k}.小号ÑSn=∑k=1n(Xk−1k), B2n=∑k=1nk−1k2Sn=∑k=1n(Xk−1k), Bn2=∑k=1nk−1k2S_n=\sum^{n}_{k=1}\left(X_k-\frac{1}{k}\right), \ B_n^2=\sum^{n}_{k=1}\frac{k-1}{k^2} žÑSnBnSnBn\frac{S_n}{B_n}ZZZnnn 我的尝试是使用Lyapunov CLT,因此我们需要显示存在一个,使得 δ&gt;0δ&gt;0\delta>0limn→∞1B2+δn∑k=1nE[|Xk−1k|2+δ]=0.limn→∞1Bn2+δ∑k=1nE[|Xk−1k|2+δ]=0.\lim_{n\rightarrow \infty}\frac{1}{B_n^{2+\delta}}\sum_{k=1}^{n}E[|X_k-\frac{1}{k}|^{2+\delta}]=0. 因此设置δ=1δ=1\delta=1∑k=1nE∣∣Xk−k−1∣∣3=∑k=1n(1k−3k2+4k3−2k4)∑k=1nE|Xk−k−1|3=∑k=1n(1k−3k2+4k3−2k4) \sum_{k=1}^{n}E\left|X_k-k^{-1}\right|^{3}=\sum_{k=1}^{n} \left(\frac{1}{k}-\frac{3}{k^2}+\frac{4}{k^3}-\frac{2}{k^4}\right) 和 B3n=(∑k=1n1k−1k2)(∑k=1n1k−1k2)−−−−−−−−−−−−⎷Bn3=(∑k=1n1k−1k2)(∑k=1n1k−1k2) B_n^3=\left( \sum_{k=1}^n \frac{1}{k}-\frac{1}{k^2} \right) \sqrt{\left( \sum_{k=1}^n \frac{1}{k}-\frac{1}{k^2} \right)} 通过在计算机上评估大n,它显示∑nk=1E|Xk−k−1|3→∞∑k=1nE|Xk−k−1|3→∞\sum_{k=1}^{n}E|X_k-k^{-1}|^{3} \to \infty和B3n→∞Bn3→∞B_n^3 \to …

1
是MLE
假设(X,Y)(X,Y)(X,Y)具有pdf Fθ(x ,y)= e- (X / θ + θ ÿ)1个x &gt; 0 ,y&gt; 0,θ &gt; 0fθ(x,y)=e−(x/θ+θy)1x&gt;0,y&gt;0,θ&gt;0f_{\theta}(x,y)=e^{-(x/\theta+\theta y)}\mathbf1_{x>0,y>0}\quad,\,\theta>0 样品的密度(X,Y)= (X一世,Y一世)1个≤ 我≤ Ñ(X,Y)=(Xi,Yi)1≤i≤n(\mathbf X,\mathbf Y)=(X_i,Y_i)_{1\le i\le n}从这一人群得出因此是 Gθ(x,y)= ∏我= 1ñFθ(x一世,ÿ一世)= 经验[ - Σ我= 1ñ(x一世θ+ θ ÿ一世) ] 1X1个,… ,xñ,ÿ1个,… ,yñ&gt; 0= 经验[ − n x¯θ- θ Ñ ÿ¯] 1X(1 ),ÿ(1 )&gt; 0,θ …

1
通过订单统计显示预估值收敛到百分位数
令是从alpha稳定分布中采样的iid随机变量序列,其参数。X1,X2,…,X3nX1,X2,…,X3nX_1, X_2, \ldots, X_{3n}α=1.5,β=0,c=1.0,μ=1.0α=1.5,β=0,c=1.0,μ=1.0\alpha = 1.5, \; \beta = 0, \; c = 1.0, \; \mu = 1.0 现在考虑序列,其中Y_ {j + 1} = X_ {3j + 1} X_ {3j + 2} X_ {3j + 3}-1,对于j = 0, \ ldots,n-1。Y1,Y2,…,YnY1,Y2,…,YnY_1, Y_2, \ldots, Y_{n}Yj+1=X3j+1X3j+2X3j+3−1Yj+1=X3j+1X3j+2X3j+3−1个Y_{j+1} = X_{3j+1}X_{3j+2}X_{3j+3} - 1j = 0 ,… ,n …

3
统计测试,以验证两个相似的时间序列何时开始偏离
从标题开始,我想知道是否存在统计测试,可以帮助我确定两个相似时间序列之间的重大差异。具体来说,看下图,我想检测到序列在时间t1开始发散,即它们之间的差异开始显着。此外,我还将检测系列之间的差异何时不显着。 有任何有用的统计检验可以做到这一点吗?

2
证明或提供反例: 如果,则XnXnX_n →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, (∏ n i = 1 X i )1 / nXXX(∏ni=1Xi)1/n(∏i=1nXi)1/n(\prod_{i=1}^{n}X_i)^{1/n} →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, XXX 我的尝试: 否:假设只能取负值,并且假设X ñ ≡ X ∀ ñXXXXn≡XXn≡XX_n \equiv X ∀∀\forall nnn THEN,但是即使,也不严格是负数。相反,它将负数替换为正数和负数。因此,不收敛几乎肯定到。XnXnX_n →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, n (∏ n i = 1 X i )1 / n(∏ n i …

1
有一个定理说
令为具有定义的均值μ和标准偏差σ的任何分布。中心极限定理说 √XXXμμ\muσσ\sigma 收敛于标准正态分布。如果用样本标准差S代替σ,则有一个定理表明 √n−−√X¯−μσnX¯−μσ \sqrt{n}\frac{\bar{X} - \mu}{\sigma} σσ\sigmaSSS 收敛到t分布吗?由于对于较大的n,t分布接近正态,因此如果存在该定理,则该定理可以声明该极限为标准正态分布。因此,在我看来t分布不是​​很有用-仅当X大致为正态时才有用。是这样吗 n−−√X¯−μSnX¯−μS \sqrt{n}\frac{\bar{X} - \mu}{S} nnnXXX 如果可能的话,当被S替换时,您是否会指出包含该CLT证明的引用?这样的参考可以优选地使用度量理论概念。但是在这一点上,任何事情对我来说都是很棒的。σσ\sigmaSSS

1
K-均值:实际情况下有多少次迭代?
我没有数据挖掘或大数据方面的行业经验,所以很高兴听到您分享一些经验。 人们实际上在一个非常大的数据集上运行k-means,PAM,CLARA等吗?还是他们只是从中随机抽取一个样本?如果他们只是对数据集进行抽样,如果数据集不是正态分布的,结果是否可靠? 在实际情况下,运行这些算法时,我们能否说出收敛之前通常需要进行多少次迭代?还是迭代次数总是随数据大小而增长? 我之所以这样问,是因为我正在考虑开发一种在收敛之前终止迭代算法的方法,但是结果仍然可以接受。我认为值得尝试的是,如果迭代次数大于1,000,则可以节省一些计算成本和时间。你怎么看?

1
几乎可以肯定,收敛并不意味着完全收敛
如果每个我们说完全收敛到。X1,X2,…X1,X2,…X_1, X_2, \ldotsXXXϵ&gt;0ϵ&gt;0\epsilon>0 ∑∞n=1P(|Xn−X|&gt;ϵ)&lt;∞∑n=1∞P(|Xn−X|&gt;ϵ)&lt;∞\sum_{n=1}^\infty \text{P}\left(|X_n-X|>\epsilon\right) <\infty 有了Borel Cantelli的引理,就可以直接证明完全收敛意味着几乎肯定的收敛。 我正在寻找一个几乎可以确定Borel Cantelli无法证明融合的示例。这是一个随机变量序列,几乎可以肯定收敛,但不能完全收敛。

1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.