Questions tagged «variance»

随机变量与其均值的期望平方偏差;或有关其均值的数据的平均平方偏差。

3
使用R计算多元回归中每个预测变量所解释的方差
我进行了一次多元回归分析,该模型作为一个整体是有意义的,并解释了约13%的方差。但是,我需要找到每个重要预测变量所解释的方差量。如何使用R做到这一点? 以下是一些示例数据和代码: D = data.frame( dv = c( 0.75, 1.00, 1.00, 0.75, 0.50, 0.75, 1.00, 1.00, 0.75, 0.50 ), iv1 = c( 0.75, 1.00, 1.00, 0.75, 0.75, 1.00, 0.50, 0.50, 0.75, 0.25 ), iv2 = c( 0.882, 0.867, 0.900, 0.333, 0.875, 0.500, 0.882, 0.875, 0.778, 0.867 ), iv3 = c( …
14 r  regression  variance 

3
图像是否由空间相连的独立区域组成的统计量度
考虑以下两个灰度图像: 第一张图片显示了蜿蜒的河流格局。第二张图片显示了随机噪声。 我正在寻找一种统计量,可以用来确定图像是否可能显示河流图案。 河流图像有两个区域:河流=高价值,其他地方=低价值。 结果是直方图是双峰的: 因此,具有河流图案的图像应具有较高的方差。 但是上面的随机图像也是如此: River_var = 0.0269, Random_var = 0.0310 另一方面,随机图像具有较低的空间连续性,而河流图像具有较高的空间连续性,这在实验方差图中清楚显示: 就像方差“汇总”一个数量的直方图一样,我正在寻找一种空间连续性的度量,以“汇总”实验方差图。 我希望这种度量可以在较小的滞后比较大的滞后更“惩罚”高半方差,因此我想出了: s v a r = ∑ñh = 1γ(小时)/ 小时2 svar=∑h=1nγ(h)/h2\ svar = \sum_{h=1}^n \gamma(h)/h^2 如果我仅从滞后= 1到15加起来,我得到: River_svar = 0.0228, Random_svar = 0.0488 我认为河流图像应该具有较高的方差,但空间方差较低,因此我引入了方差比: r a t i o = v a r / s …

2
CNN Xavier权重初始化
在一些教程中,我发现有人说“ Xavier”权重初始化(论文:了解训练深度前馈神经网络的难度)是初始化神经网络权重的有效方法。 对于完全连接的层,这些教程中有一条经验法则: V一个[R (W ^)= 2ñ我ñ+ nØ ü Ť,更简单的选择:V一个[R (W ^)= 1ñ我ñV一种[R(w ^)=2ñ一世ñ+ñØüŤ,更简单的选择:V一种[R(w ^)=1个ñ一世ñVar(W) = \frac{2}{n_{in} + n_{out}}, \quad \text{simpler alternative:} \quad Var(W) = \frac{1}{n_{in}} 其中是图层的权重方差,使用正态分布进行初始化,,是父图层和当前图层中神经元的数量。ñ 我ñ Ñ Ò ù 吨V一个[R (W ^)V一种[R(w ^)Var(W)ñ我ññ一世ñn_{in}ñØ ü ŤñØüŤn_{out} 卷积层有类似的经验法则吗? 我正在努力找出最适合初始化卷积层权重的方法。例如在权重形状为的层中(5, 5, 3, 8),即内核大小为5x5,过滤三个输入通道(RGB输入)并创建8特征图...是否将被3视为输入神经元的数量?或者说75 = 5*5*3,因为输入是5x5每个颜色通道的色标? 我既可以接受一个明确的问题答案,也可以接受一个更“通用”的答案,这可以解释找到正确的权重初始化并最好链接源的一般过程。

2
逻辑回归中的过度分散
我正在尝试处理逻辑回归中过度分散的概念。我已经读到过度分散是指观察到的响应变量方差大于二项式分布的预期值。 但是,如果一个二项式变量只能具有两个值(1/0),那么它如何具有均值和方差? 我可以通过x次数的Bernoulli试验来计算成功的均值和方差。但是我无法将只能具有两个值的变量的均值和方差的概念笼罩在脑海中。 任何人都可以提供以下内容的直观概述: 只能有两个值的变量的均值和方差的概念 只能有两个值的变量中的超分散概念

2
我不明白二项式的方差
即使问这样一个基本问题,我也感到很愚蠢,但这里有: 如果我有一个随机变量可以取值和,且和,那么如果我从中抽取样本,我将得到二项式分布。XXX000111P(X=1)=pP(X=1)=pP(X=1) = pP(X=0)=1−pP(X=0)=1−pP(X=0) = 1-pnnn 分布的平均值是 μ=np=E(X)μ=np=E(X)\mu = np = E(X) 分布的方差为 σ2=np(1−p)σ2=np(1−p)\sigma^2 = np(1-p) 这是我的麻烦开始的地方: 方差由。因为两个可能的结果的平方不改变任何东西(和),所以意味着,这意味着 X 0 2 = 0 1 2 = 1 ë (X 2)= È (X )σ2=E(X2)−E(X)2σ2=E(X2)−E(X)2\sigma^2 = E(X^2) - E(X)^2XXX02=002=00^2 = 012=112=11^2 = 1E(X2)=E(X)E(X2)=E(X)E(X^2) = E(X) σ2=E(X2)−E(X)2=E(X)−E(X)2=np−n2p2=np(1−np)≠np(1−p)σ2=E(X2)−E(X)2=E(X)−E(X)2=np−n2p2=np(1−np)≠np(1−p)\sigma^2 = E(X^2) - E(X)^2 = E(X) …

1
偏差方差分解
在Bishop的模式识别和机器学习的 3.2节中,他讨论了偏差方差分解,指出对于平方损失函数,预期损失可以分解为平方偏差项(它描述了平均预测与真实预测之间的距离。模型),方差项(描述了平均值周围的预测范围)和噪声项(给出了数据的固有噪声)。 可以使用除平方损失以外的损失函数执行偏差方差分解吗? 对于给定的模型数据集,是否有多个模型的预期损失在所有模型中均是最小的,如果是这样,是否意味着可能会有不同的偏差和方差组合产生相同的最小预期损失? 如果模型涉及正则化,则偏差,方差和正则化系数之间是否存在数学关系?λλ\lambda 如果您不知道真实的模型,如何计算偏差? 在某些情况下,将偏差或方差最小化而不是预期损失(偏差和方差的平方和)更有意义吗?

1
长期差异是多少?
如何定义时间序列分析领域中的长期差异? 我知道在数据中存在相关结构的情况下会使用它。因此,我们的随机过程不会是X1,X2…X1,X2…X_1, X_2 \dots iid随机变量的一个家族,而只会是相同分布的? 我可以将标准参考作为该概念及其估计中所涉及的困难的介绍吗?

3
为了得出“天花板效应”正在发生,必须满足什么条件?
根据SAGE社会科学研究方法百科全书 ... [a]上限效应发生在一项措施具有潜在响应的明显上限并且参与者集中度达到或接近该上限时。尺度衰减是一个方法学问题,每当以这种方式限制方差时都会发生。…例如,某种程度的态度可能会产生天花板效应,其中高分表示一种有利态度,而最高的反应却无法捕捉到最积极的评价。…解决天花板效应的最佳解决方案是试点测试,这可以尽早发现问题。如果发现上限效应,并且[结果]度量标准是任务绩效,则可以使任务更加难以增加潜在响应的范围。1个 [重点添加] 似乎有很多的建议和问题,(在这里)处理分析这表明类似于上述报价的天花板埋入影响的数据。 我的问题可能很简单,也可能很幼稚,但是如何真正检测出数据中存在上限效应呢?更具体地说,例如,创建了一个心理测验,并怀疑其导致了上限效应(仅视觉检查),然后对该测验进行了修改,以产生更大范围的值。如何显示修订后的测试已从其生成的数据中消除了上限效应?是否有一项测试表明数据集a中存在上限效应,但数据集b中没有上限效应? 我幼稚的方法是仅检查分布偏斜,如果不偏斜,则得出结论没有上限效应。这太简单了吗? 编辑 再举一个更具体的例子,我说开发了一种可以测量某些潜在特征x的工具,该特征x随着年龄的增长而增加,但最终趋于平稳,并随着年龄的增长而开始下降。我制作了第一个版本,范围为1-14,进行了一些试验,发现似乎有一个上限效应(很多响应在14或接近14时,最大值。)查看数据,但是为什么呢?是否有严格的方法来支持该主张? 然后,我将度量值修改为1-20,并收集更多数据。我看到趋势更加符合我的期望,但是我怎么知道测量范围足够大。我需要再次修改吗?从外观上看,这似乎还可以,但是有没有一种方法可以验证我的怀疑? 我想知道如何才能在数据中检测到这种上限效应,而不仅仅是查看它。这些图代表实际数据,而非理论数据。扩大仪器的范围可以产生更好的数据分布,但这足够吗?我该如何测试? 1 Hessling,R.,Traxel,N.,&Schmidt,T.(2004)。天花板效果。SAGE社会科学研究方法百科全书,由 Michael S. Lewis-Beck,A。Bryman和Tim Futing Liao(编)撰写。(第107页)。加利福尼亚州千橡市:Sage Publications,Inc. doi:10.4135 / 9781412950589.n102



2
样本最大值的方差是多少?
我正在寻找一组随机变量的最大值的方差的界限。换句话说,我想找的闭合形式的公式乙BB,使得 其中 X = { X 1,... ,X 中号 }是一组固定的中号与有限装置的随机变量 μ 1,... ,μ 中号和方差 σ 2 1,... ,σ 2 中号。瓦尔(最大一世X一世)≤ 乙,Var(maxiXi)≤B, \mbox{Var}(\max_i X_i) \leq B \enspace, X= { X1个,… ,X中号}X={X1,…,XM}X = \{ X_1, \ldots, X_M \}中号MMμ1个,… ,μ中号μ1,…,μM\mu_1, \ldots, \mu_Mσ21个,… ,σ2中号σ12,…,σM2\sigma_1^2, \ldots, \sigma_M^2 我可以推断出 但是这个界限似乎很松散。数值试验似乎表明,乙= 最大值我σ 2 我可能是一种可能性,但我一直没能证明这一点。任何帮助表示赞赏。瓦尔(最大一世X一世)≤ Σ一世σ2一世,Var(maxiXi)≤∑iσi2, \mbox{Var}(\max_i X_i) …

4
方差的实际应用是什么?
我正在自学概率论,但我不确定我是否理解方差相对于标准差的任何用法。在我正在查看的实际情况下,方差大于范围,因此在直观上似乎没有用。
13 variance 

3
具有无限方差的正态分布的值大于平均值的概率是多少?
今天在面试中我被问到类似的问题。 面试官想知道,当波动性趋于无穷大时,平价期权最终会平价化的可能性是多少。 我说0%是因为在Black-Scholes模型和随机游走假设下的正态分布将具有无限方差。因此,我计算出所有值的可能性为零。 我的面试官说正确的答案是50%,因为正态分布仍将是对称且几乎均匀的。因此,当您从均值到+无穷大积分时,您将获得50%。 我仍然不相信他的推理。 谁是对的?

2
解释回归模型的方差
这可能是一个简单的解释(无论如何我都希望如此)。 我已经使用回归工具箱在Matlab中进行了一些回归分析。但是,我遇到了一项研究指出: “使用回归分析,可以仅使用四个解释60%差异的声音特征来建立预测模型” 如果需要,可以在此处找到文章的链接: 文章 我不确定这意味着什么,但我希望它简单一些。60%也是一件好事吗?我试图进行搜索,但是由于“方差”一词之前总是有一个百分比,因此很难找到答案。
13 variance 

4
解释glmer中的随机效应方差
我正在修订有关授粉的论文,其中数据按二项分布(水果成熟或没有成熟)。因此,我使用glmer了一种随机效果(单个植物)和一种固定效果(治疗)。审稿人想知道植物是否对坐果有影响-但我在解释glmer结果时遇到困难。 我已经在网络上阅读过,似乎直接比较glm和glmer模型可能存在问题,所以我没有这样做。我认为回答这个问题的最直接方法是将随机效应方差(下面的1.449)与总方差进行比较,或者将处理结果解释为方差。但是,如何计算这些其他方差?它们似乎未包含在下面的输出中。我读到一些关于二项式不包括残差的信息glmer-我如何解释随机效应的相对重要性? > summary(exclusionM_stem) Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) [glmerMod] Family: binomial ( logit ) Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID) AIC BIC logLik deviance df.resid 125.9 131.5 -59.0 117.9 26 Scaled residuals: Min 1Q Median 3Q Max -2.0793 -0.8021 -0.0603 0.6544 …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.