Questions tagged «heteroscedasticity»

沿着随机过程中某些连续体的非恒定方差。

2
异方差和残差正态性
我猜想我有一个很好的线性回归(这是用于大学项目的,因此我并不一定要非常准确)。 关键是,如果我绘制残差与预测值的关系图,(根据我的老师的话)会有异方差的迹象。 但是,如果我绘制残差的QQ图,则很明显它们是正态分布的。此外,残差的Shapiro检验的值为,因此我认为毫无疑问,残差实际上是正态分布的。ppp0.80.80.8 问题:如果残差呈正态分布,预测值怎么会有异方差?

2
巴特利特测试vs莱文测试
我目前正在尝试解决违反方差分析假设的问题。我曾用Shapiro-Wilk检验正态性,并涉猎了Levene检验和Bartlett检验方差相等。从那以后,我用对数转换了我的数据,以尝试纠正不平等的差异。我对经过对数转换的数据重新进行了Bartlett检验,但仍然收到了显着的p值,出于好奇,我也进行了Levene检验,得到了不重要的p值。我应该依靠哪个测试?

2
估计具有独立变量的标准偏差缩放的速率
我有在我以正态分布变量的测量实验,YYY Y∼N(μ,σ)Y∼N(μ,σ)Y \sim N(\mu,\sigma) 但是,先前的实验提供了一些证据,表明标准偏差是自变量的仿射函数,即Xσσ\sigmaXXX σ=a|X|+bσ=a|X|+b\sigma = a|X| + b Y∼N(μ,a|X|+b)Y∼N(μ,a|X|+b)Y \sim N(\mu,a|X| + b) 我想估计参数和通过取样在的多个值。此外,由于实验的限制,我只能采集有限数量(大约30-40)的样本,并且出于与实验无关的原因,我更愿意以X的多个值进行采样。给定这些约束,可以使用哪些方法来估计a和b?b Y XaaabbbYYYXXXYYYXXXaaabbb 实验说明 如果您对我为什么要问上述问题感兴趣,这是额外的信息。我的实验测量听觉和视觉空间知觉。我有一个实验设置,其中我可以显示来自不同位置X的听觉或视觉目标XXX,并且被摄对象指示目标Y的感知位置YYY。随着偏心率的增加(即| X |增大|X||X||X|),视觉*和听觉都变得不太精确,我在上面将其建模为σσ\sigma。最终,我想估计aaa和bbb对于视觉和听觉来说,所以我知道在空间中一系列位置上每种感觉的精度。这些估计值将用于预测同时显示的视觉和听觉目标的相对权重(类似于此处提出的多感官融合理论:http://www.ncbi.nlm.nih.gov/pubmed/12868643)。 *我知道,当比较中央凹与中央凹空间时,该模型的视觉不准确,但是我的测量仅限于中央凹空间,这是一个不错的近似值。

2
方差不相等的两个样本t检验的贝叶斯对应物是什么?
我正在寻找方差不相等的两个样本t检验的贝叶斯对应物(韦尔奇检验)。我也在寻找多变量检验,例如Hotelling的T统计量。参考文献表示赞赏。 对于多元情况,假设我们有和(z 1,⋯ ,z N),其中y i(resp z i)是样本均值,样本标准差和数量的捷径点。我们可以假设点数在整个数据集中是恒定的,所有y i的标准偏差都相同(resp z i),并且y i的样本均值(resp z i)(y1个,⋯ ,yñ)(y1,⋯,yN)(y_1,\cdots,y_N)(z1个,⋯ ,zñ)(z1,⋯,zN)(z_1,\cdots,z_N)ÿ一世yiy_iž一世ziz_iÿ一世yiy_iž一世ziz_iÿ一世yiy_iž一世ziz_i)是相关的。如果绘制样本均值,它们将彼此跟随并通过连接它们,您将获得平滑的变化函数。现在,在一些地方功能与同意ž功能,但别人没有,因为米Ë 一个ñ (Ÿ 我)- 米Ë 一个ñ (ž 我)yyyzzz变大。我想对此陈述进行量化。 mean(yi)−mean(zi)std(yi)+std(zi)mean(yi)−mean(zi)std(yi)+std(zi)\frac{mean(y_i)-mean(z_i)}{std(y_i)+std(z_i)}

3
由Levene或Bartlett检验方差同质性产生的p值的解释
我对一项实验的一组数据进行了Levene和Bartlett的检验,以验证我没有违反ANOVA的方差均质性假设。如果您不介意的话,我想与大家确认我没有做任何错误的假设 这两个测试返回的p值是我的数据(如果再次使用相等方差生成的数据)相同的概率。因此,通过使用这些检验,可以说我没有违反方差分析关于方差均匀性的假设,我只需要一个高于所选alpha水平(例如0.05)的p值? 例如,根据我当前使用的数据,巴特利特检验返回p = 0.57,而莱文(Levene)检验(我们称其为Brown-Forsythe Levene型检验)得出ap = 0.95。这意味着,无论我使用哪种测试,我都可以说我的数据符合假设。我有什么错误吗? 谢谢。

1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
如何在线性回归中对二元/二分法独立预测变量执行残差分析?
我正在下面的R中执行多元线性回归,以预测所管理基金的回报。 reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) 在这里,只有GRI和MBA是二元/二分法预测因子;其余的预测变量是连续的。 我正在使用此代码生成二进制变量的残差图。 plot(rawdata$GRI, reg$residuals) abline(lm(reg$residuals~rawdata$GRI, data=rawdata), col="red") # regression line (y~x) plot(rawdata$MBA, reg$residuals) abline(lm(reg$residuals~rawdata$MBA, data=rawdata), col="red") # regression line (y~x) 我的问题: 我知道如何检查残差图是否为连续的预测变量,但是当自变量为二进制时,如何测试线性回归的假设,例如均方差? 残留图:

2
如何获得具有可靠标准误差的ANOVA表?
我正在使用R中的plm包运行汇总的OLS回归。尽管,我的问题更多是关于基本统计信息,所以我尝试首先将其发布在这里;) 由于我的回归结果会产生异方差残差,因此我想尝试使用异方差稳健的标准误差。作为结果,coeftest(mod, vcov.=vcovHC(mod, type="HC0"))我得到了一个表格,其中包含每个独立变量的估计值,标准误差,t值和p值,这些基本上就是我的“稳健”回归结果。 为了讨论不同变量的重要性,我想绘制每个独立变量解释的方差份额,因此我需要相应的平方和。但是,使用function aov(),我不知道如何告诉R使用可靠的标准错误。 现在我的问题是:如何获得表示稳健标准误差的ANOVA表/平方和?是否可以基于具有正常标准误差的回归,基于ANOVA表进行计算? 编辑: 换句话说,无视我的R发行: 如果使用稳健的标准误差不影响R,那么不同解释变量对解释方差的各自贡献也将保持不变吗?22^2 编辑: 在R中,aov(mod)实际上是否为panelmodel(plm)提供了正确的ANOVA表?

2
线性混合模型中方差的残差诊断和均质性
在问这个问题之前,我确实搜索了我们的网站并发现了很多类似的问题(例如here,here和here)。但是我觉得这些相关问题没有得到很好的回答或讨论,因此想再次提出这个问题。我觉得应该有很多观众希望对这些问题进行更清晰的解释。 对于我的问题,首先考虑线性混合效果模型y=Xβ+Zγ+ϵy=Xβ+Zγ+ϵ \mathbf{y = X\boldsymbol \beta + Z \boldsymbol \gamma + \boldsymbol \epsilon} 其中XβXβX\boldsymbol \beta是线性固定效果分量,ZZ\mathbf{Z}是对应的所述附加设计矩阵随机效应参数,γγ\boldsymbol \gamma。而ϵ ∼ N(0,σ2I)ϵ ∼ N(0,σ2I)\boldsymbol \epsilon \ \sim \ N(\mathbf{0, \sigma^2 I})是通常的误差项。 让我们假设唯一的固定影响因子是3个不同级别的分类变量Treatment。唯一的随机影响因素是变量Subject。也就是说,我们有一个具有固定治疗效果和随机受试者效应的混合效应模型。 因此,我的问题是: 线性混合模型设置中是否存在与传统线性回归模型类似的方差假设的同质性?如果是这样,那么在上述线性混合模型问题的背景下,假设的具体含义是什么?还有哪些其他重要假设需要评估? 我的想法:是的。假设(我的均值,零误差均值和均方差)仍来自此处:ϵ ∼ N(0,σ2I)ϵ ∼ N(0,σ2I)\boldsymbol \epsilon \ \sim \ N(\mathbf{0, \sigma^2 I})。在传统的线性回归模型设置中,我们可以说假设是“误差的方差(或只是因变量的方差)在所有3个治疗水平上都是恒定的”。但是我不知道如何在混合模型设置下解释这个假设。我们应该说:“在3种治疗水平上,方差是恒定的吗?是否取决于受试者?” 有关残差和影响诊断的SAS在线文档提出了两种不同的残留物,即边际残差,和有条件的残差, 我的问题是,两个残差分别用于什么?我们如何使用它们来检查同质性假设?对我而言,只有边际残差可用于解决同质性问题,因为它对应于模型的。我的理解对吗?rm=Y−Xβ^rm=Y−Xβ^ \mathbf{r_m = Y - X \hat{\boldsymbol …

1
可视化许多左偏分布
我要显示一系列左偏/重尾分布。有跨越三个因素42个分布(标示为A,B和C下文)。同样,差异也在整个因数间缩小B。 我的问题是,很难在结果的范围(比例或倍数变化)上区分分布: 记录数据似乎过分强调了左偏度,并将更多样本移到尾部(创建了多个离群点): 有人对其他可视化这些数据的技术有建议吗?

3
线性模型异方差
我有以下线性模型: 为了解决残差的异方差性,我尝试对因变量应用log转换为但我仍然看到对残差具有相同的扇出效果。DV值相对较小,因此在这种情况下,取对数前的+1常数加法可能不合适。日志(是+ 1 )log⁡(Y+1)\log(Y + 1) > summary(Y) Min. :-0.0005647 1st Qu.: 0.0001066 Median : 0.0003060 Mean : 0.0004617 3rd Qu.: 0.0006333 Max. : 0.0105730 NA's :30.0000000 如何转换变量以改善预测误差和方差,尤其是对于最右边的拟合值?


2
独立性测试与同质性测试
我正在教授基础统计学课程,今天我将介绍两类独立性的卡方检验和同质性检验。这两种方案在概念上是不同的,但是可以使用相同的测试统计量和分布。在同质性测试中,其中一个类别的边际总数被认为是设计本身的一部分-它们代表为每个实验组选择的主题数。但是,由于卡方检验围绕所有边际总数的条件进行,因此,对同质性检验和具有分类数据的独立性检验进行区分不会有任何数学上的影响-使用该检验时至少没有。 我的问题如下:是否有任何流派的统计思想或统计方法会得出不同的分析结果,这取决于我们是在测试独立性(所有边际都是随机变量)还是在检验同质性(其中一组边际是由设计设置)? 在连续的情况下,假设我们在同一主题上观察并进行独立性检验,或者观察不同人群中的并检验它们是否来自同一分布,则方法是不同的(相关性分析与t检验)。如果分类数据来自离散连续变量怎么办?独立性和同质性的检验是否应该区分开?(X,Y)(X,Y)(X,Y)(X1个,X2)(X1,X2)(X_1, X_2)

2
用异方差模拟线性回归
我正在尝试模拟与我拥有的经验数据匹配的数据集,但是不确定如何估算原始数据中的错误。经验数据包括异方差性,但是我不希望将其转换掉,而是使用带有误差项的线性模型来再现经验数据的模拟。 例如,假设我有一些经验数据集和一个模型: n=rep(1:100,2) a=0 b = 1 sigma2 = n^1.3 eps = rnorm(n,mean=0,sd=sqrt(sigma2)) y=a+b*n + eps mod <- lm(y ~ n) 使用plot(n,y)我们得到以下内容。 但是,如果尝试模拟数据simulate(mod),则异方差性将被删除并且不会被模型捕获。 我可以使用广义最小二乘法模型 VMat <- varFixed(~n) mod2 = gls(y ~ n, weights = VMat) 可以基于AIC提供更好的模型拟合,但是我不知道如何使用输出来模拟数据。 我的问题是,如何创建一个模型,使我能够模拟数据以匹配原始的经验数据(上述n和y)。具体来说,我需要一种使用模型来估算sigma2的方法吗?


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.