Questions tagged «heteroscedasticity»

沿着随机过程中某些连续体的非恒定方差。

2
这两个布劳希-帕根检验之间有什么区别?
在某些数据上使用R并尝试查看我的数据是否为异方差,我发现了Breusch-Pagan测试的两个实现,即bptest(包lmtest)和ncvTest(包车)。但是,这些产生不同的结果。两者有什么区别?您何时应该选择使用其中一个? > model <- lm(y ~ x) > bp <- bptest(model) > bp studentized Breusch-Pagan test data: model BP = 3.3596, df = 1, p-value = 0.06681 > ncvTest(model) Non-constant Variance Score Test Variance formula: ~ fitted.values Chisquare = 3.858704 Df = 1 p = 0.04948855 这些示例表明,根据测试,我的数据在一种情况下是异方差的,在另一种情况下是同方的。我确实在这里找到了这个问题,所以bptest可能是学生化的,而ncvTest可能不是,但是,那意味着什么呢?

3
回归系数的偏差方差折衷是什么?如何推导?
在本文中(仅使用误差对比度进行方差分量的贝叶斯推断,Harville,1974年),作者声称 成为“众所周知的线性回归 其中 (y- Xβ)′H− 1(y- Xβ)= (y- Xβ^)′H− 1(y- Xβ^)+ (β- β^)′(X′H− 1X)(β- β^)(ÿ-Xβ)′H-1个(ÿ-Xβ)=(ÿ-Xβ^)′H-1个(ÿ-Xβ^)+(β-β^)′(X′H-1个X)(β-β^)(y-X\beta)'H^{-1}(y-X\beta)=(y-X\hat\beta)'H^{-1}(y-X\hat\beta)+(\beta-\hat\beta)'(X'H^{-1}X)(\beta-\hat\beta)ε 〜ñÿ= Xβ+ϵ,y=Xβ+ϵ,y=X\beta+\epsilon,ϵ∼N(0,H).ϵ∼N(0,H).\epsilon\sim\mathcal{N}(0, H). 这个怎么知名的?证明这一点的最简单方法是什么?

2
在异方差下OLS渐近有效
我知道在线性回归设置下,OLS是无偏的,但在异方差下效率不高。 在维基百科 http://en.wikipedia.org/wiki/Minimum_mean_square_error MMSE估计量是渐近无偏的,并且其分布收敛到正态分布: ,其中I(x)是x的Fisher信息。因此,MMSE估计器是渐近有效的。n−−√(x^−x)→dN(0,I−1(x))ñ(X^-X)→dñ(0,一世-1个(X))\sqrt{n}(\hat{x} - x) \xrightarrow{d} \mathcal{N}\left(0 , I^{-1}(x)\right) MMSE被认为是渐近有效的。我在这里有些困惑。 这是否意味着OLS在有限样本中无效,但在异方差下渐近有效? 对当前答案的批评:到目前为止,提出的答案还没有解决限制分布的问题。 提前致谢

1
拟合二项响应的异方差广义线性模型
我从以下实验设计中获得了数据:我的观察结果是对K相应治疗次数()中成功次数()的计数,对N两组分别由I个体组成的两组进行了测量,这些结果来自T治疗,其中每个这样的因子组合中都有R重复项。因此,共我有2 * I * T * R ķ的和对应Ñ的。 数据来自生物学。每个人都是一个基因,我通过它测量两种替代形式的表达水平(由于一种称为替代剪接的现象)。因此,K是其中一种形式的表达水平,而N是这两种形式的表达水平的总和。在一个单一的表达拷贝的两种形式之间的选择被假定为一个伯努利试验,因此ķ出Ñ副本遵循二项式。每个组由约20个不同的基因组成,并且每个组中的基因具有某些共同的功能,这在两组之间是不同的。对于每组中的每个基因,我从三个不同的组织(治疗)中分别进行了约30次这样的测量。我想估计组和治疗对K / N方差的影响。 已知基因表达过度分散,因此在下面的代码中使用负二项式。 例如,R模拟数据的代码: library(MASS) set.seed(1) I = 20 # individuals in each group G = 2 # groups T = 3 # treatments R = 30 # replicates of each individual, in each group, in each treatment groups = letters[1:G] …

2
残差与潜在的干扰有何关系?
在最小二乘法中,我们要估计模型中的未知参数: Yj=α+βxj+εj(j=1...n)Yj=α+βxj+εj(j=1...n)Y_j = \alpha + \beta x_j + \varepsilon_j \enspace (j=1...n) 一旦完成(对于某些观测值),我们将获得拟合的回归线: Yj=α^+β^x+ej(j=1,...n)Yj=α^+β^x+ej(j=1,...n)Y_j = \hat{\alpha} + \hat{\beta}x +e_j \enspace (j =1,...n) 现在显然我们想检查一些图以确保满足假设。假设您要检查均方差,但是,实际上我们正在检查残差。假设您检查了残差与预测值的关系图,如果这表明我们看到了明显的异方差性,那么这与干扰项什么关系?残差中的异方差是否表示扰动方面的异方差? ejeje_jεjεj\varepsilon_j

3
统计检验以查看关系是线性还是非线性
我有一个示例数据集,如下所示: Volume <- seq(1,20,0.1) var1 <- 100 x2 <- 1000000 x3 <- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power <- jitter(Power, factor = 1, amount = 0.1) plot(Volume,Power) 从图中可以看出,在“体积”和“功率”的特定范围之间,关系是线性的,然后,当“体积”变得相对小时,关系变为非线性。有统计检验可以说明这一点吗? 关于对《任择议定书》的答复中显示的一些建议: 此处显示的示例只是一个示例,尽管噪声较大,但我拥有的数据集看起来与此处看到的关系相似。到目前为止,我进行的分析表明,当我分析特定液体的体积时,当体积较小时,信号的功率会急剧增加。因此,可以说我只有一个音量在15到20之间的环境,几乎就像线性关系。但是,通过增加点的范围(即具有较小的体积),我们看到该关系完全不是线性的。我现在正在寻找有关如何统计显示这一点的统计建议。希望这是有道理的。


1
有条件异方差的线性模型的推论
假设我观察到独立变量向量和以及因变量y。我想拟合以下形式的模型: y = \ vec {x} ^ {\ top} \ vec {\ beta_1} + \ sigma g \ left(\ vec {z} ^ {\ top} \ vec {\ beta_2} \ right)\ epsilon, 其中g是某个正值二次可微函数,\ sigma是未知的缩放参数,\ epsilon是零均值,单位方差高斯随机变量(假定独立于\ vec {x}和\ vec {z})。这实质上是Koenker异方差检验的设置(至少据我所知)。x⃗ x→\vec{x}z⃗ z→\vec{z}yyyy=x⃗ ⊤β1→+σg(z⃗ ⊤β2→)ϵ,y=x→⊤β1→+σg(z→⊤β2→)ϵ,y = \vec{x}^{\top}\vec{\beta_1} + \sigma g\left(\vec{z}^{\top} \vec{\beta_2}\right) \epsilon,gggσσ\sigmaϵϵ\epsilonx⃗ x→\vec{x}z⃗ …

3
Spearman或Pearson与李克特量表的相关性,可能会违反线性和均方差
我想在使用李克特量表的许多测量结果上进行相关性分析。从散点图来看,似乎已经违反了线性和均方差性的假设。 鉴于似乎有一些关于序数级别分级近似间隔级别缩放的争论,我应该安全地使用Spearman的Rho而不是Pearson的r? 如果我与Spearman的Rho一起使用,是否有可以引用的参考文献?

2
我该如何解释布劳奇-帕根检验的结果?
在其中,R我可以使用程序包的ncvTest功能对异方差进行Breusch-Pagan测试car。Breusch-Pagan检验是卡方检验的一种。 我如何解释这些结果: > require(car) > set.seed(100) > x1 = runif(100, -1, 1) > x2 = runif(100, -1, 1) > ncvTest(lm(x1 ~ x2)) Non-constant Variance Score Test Variance formula: ~ fitted.values Chisquare = 0.2343406 Df = 1 p = 0.6283239 > y1 = cumsum(runif(100, -1, 1)) > y2 = runif(100, -1, …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.