Questions tagged «heteroscedasticity»

沿着随机过程中某些连续体的非恒定方差。

8
生成与现有变量具有定义的相关性的随机变量
对于模拟研究,我必须生成随机变量,这些变量显示与现有变量的预定义(填充)相关性。ÿYY 我研究了这些R软件包copula,CDVine它们可以生成具有给定依赖关系结构的随机多变量分布。但是,不可能将结果变量之一固定为现有变量。 任何想法和现有功能的链接表示赞赏! 结论: 提出了两个有效的答案,有不同的解决方案: 一个R 脚本由卡拉卡尔,其计算与一个随机变量精确(样品)的相关性,以一个预定义的变量 我发现了一个R 函数,该函数计算与预定义变量具有定义的总体相关性的随机变量 [@ttnphns的补充:我可以自由地将问题标题从单个固定变量的情况扩展到任意数量的固定变量;即如何生成具有预定义正确性和一些固定的现有变量的变量]



1
异方差数据的单向方差分析的替代方法
我有3个藻类生物量(,,)的数据,它们包含不相等的样本大小(,,),我想比较一下这两个组是否来自同一种群。AAABBBCCCnA=15nA=15n_A=15nB=13nB=13n_B=13nC=12nC=12n_C=12 单向ANOVA绝对是必经之路,但是在对我的数据进行正态性测试时,异质性似乎是主要问题。我的原始数据未经任何转换就产生了方差比(),该比率远高于临界值(F _ {\ rm crit} = 4.16),因此我无法执行单向方差分析。Fmax=19.1Fmax=19.1F_{\max} = 19.1Fcrit=4.16Fcrit=4.16F_{\rm crit} = 4.16 我还尝试了转换以标准化我的数据。即使经过各种变换(对数,平方根,平方)的试验,使用\ log_ {10}变换进行变换后产生的最低F _ {\ max}也为7.16,与F _ {\ rm crit}相比仍然更高。FmaxFmaxF_{\max}log10log10\log_{10}7.167.167.16FcritFcritF_{\rm crit} 这里有人可以建议我从这里出发吗?我想不出其他通过数据标准化的转换方法。有单向方差分析的替代方法吗? PS:我的原始数据如下: A: 0.178 0.195 0.225 0.294 0.315 0.341 0.36 0.363 0.371 0.398 0.407 0.409 0.432 0.494 0.719 B: 0.11 0.111 0.204 0.416 0.417 0.441 0.492 …

5
为什么会有“异方差”或“异方差”两个拼写?
我经常看到“ heteroskedastic”和“ heteroscedastic”这两个拼写,以及“ homoscedastic”和“ homoskedastic”的相似。“ c”和“ k”变体之间的含义似乎没有差异,只是与该词的希腊词源有关的正字法差异。 这两种不同的拼法的起源是什么? 一种用法是否比另一种用法更常见,它们是否反映了地区或研究领域之间的差异,还是仅反映了作者(或实际上是社论)的偏爱? 顺便说一句,其他语言在将希腊语根源拉丁化为英语方面也有不同的政策:我注意到,我认为法语中总是“hétéroscédasticité”,而德语中则总是“Heteroskedastizität”。因此,如果以英语为第二语言的作者可能偏爱与其母语相对应的英语拼写,我不会感到惊讶。也许真正的考验是希腊统计学家用英语书写时所说的!

5
违反线性回归的同调假设的危险是什么?
例如,考虑ChickWeightR中的数据集。方差明显随时间增长,因此,如果我使用简单的线性回归,例如: m <- lm(weight ~ Time*Diet, data=ChickWeight) 我的问题: 该模型的哪些方面值得怀疑? 问题是否仅限于在Time范围外推断? 线性回归对这种假设的违反有多大的容忍度(即必须引起异方差才能引起问题)?

3
方差不等的回归建模
我想拟合一个线性模型(lm),其中残差方差显然取决于解释变量。 我知道的方法是将glm与Gamma族一起使用,对方差建模,然后将其逆值放入lm函数的权重中(例如:http : //nitro.biosci.arizona.edu/r/chapter31 .pdf) 我在想: 这是唯一的技术吗? 还有哪些其他相关方法? 哪些R包/功能与此类建模相关?(其他然后是glm,lm)

2
您如何找到加权最小二乘回归的权重?
在WLS回归过程中,我有些失落。我已经获得了数据集,我的任务是测试是否存在异方差性,如果可以,我应该运行WLS回归。 我进行了测试,并发现了异方差的证据,因此我需要运行WLS。有人告诉我WLS基本上是转换模型的OLS回归,但是我对找到转换函数有些困惑。我读过一些文章,建议转换可以是OLS回归的残差平方的函数,但是如果有人可以帮助我走上正确的道路,我将不胜感激。


4
如何将新向量投影到PCA空间上?
执行主成分分析(PCA)之后,我想将一个新向量投影到PCA空间上(即在PCA坐标系中找到其坐标)。 我已经使用R计算了R语言的PCA prcomp。现在,我应该可以将向量乘以PCA旋转矩阵。该矩阵中的主要成分应该按行还是按列排列?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 


2
转换比例数据:arcsin平方根不足时
对于百分比/比例数据,是否有(更强的)替代arcsin平方根的变换?在我目前正在处理的数据集中,应用此转换后仍存在明显的异方差性,即残差与拟合值的关系图仍然是菱形。 编辑以回应评论:数据是实验参与者的投资决定,他们可能以10%的倍数投资捐赠基金的0-100%。我还使用序数逻辑回归分析了这些数据,但想了解有效的glm会产生什么。另外,我认为答案对将来的工作很有用,因为反正弦方根似乎被用作我领域的一种“千篇一律”的解决方案,而且我没有遇到任何采用的替代方法。


4
实际上,当数据与假设不完全一致时,人们如何处理方差分析?
这不是一个严格的统计问题-我可以阅读所有有关ANOVA假设的教科书-我试图弄清楚实际工作的分析师如何处理不完全符合假设的数据。我在该网站上遇到了很多问题,寻找答案,并且不断寻找有关何时不使用ANOVA(在抽象的,理想化的数学上下文中)或如何完成我在R中描述的某些事情的文章。我实际上是在试图弄清人们实际做出的决定以及原因。 我正在对来自四组树(实际树,而非统计树)中的分组数据进行分析。我已经为每棵树获取了大约35个属性的数据,并且正在研究每个属性以确定这些属性上的组是否存在显着差异。但是,在某些情况下,由于方差不相等,因此违反了ANOVA假设(根据Levene检验,使用alpha = .05)。 正如我所看到的,我的选择是:1.对数据进行功率变换,看看它是否会改变Levene p值。2.使用非参数测试,例如Wilcoxon(如果是,是哪个?)。3.对方差分析结果进行某种校正,例如Bonferroni(我实际上不确定是否存在这样的东西吗?)。我尝试了前两个选项,但结果略有不同-在某些情况下,一种方法很重要,而另一种则没有。我担心会掉入p值钓鱼陷阱,并且正在寻找可以帮助我确定使用哪种方法的建议。 我还读过一些东西,表明除非方差和方差相互关联(即,两者都一起增加),否则异方差对ANOVA来说并不是真正的大问题,因此,除非我看到Levene的结果,否则我可以忽略它这样的模式?如果是这样,是否有测试方法? 最后,我应该补充一点,我正在做此分析,以便在同行评审的期刊上发表,因此,无论我采用哪种方法,都必须通过评审员的评审。因此,如果任何人都可以提供指向相似的已发布示例的链接,那就太好了。

4
处理异方差的最佳方法?
我有一个线性模型的残差值随拟合值的函数关系图,其中异方差非常清楚。但是,我不确定现在应该如何进行,因为据我了解,这种异方差会使我的线性模型无效。(那正确吗?) 使用封装的rlm()功能使用健壮的线性拟合,MASS因为它显然对异方差具有健壮性。 由于我的系数的标准误差由于异方差性而错了,因此我可以调整标准误差以使其对异方差性很强吗?使用此处发布在堆栈溢出上的方法:具有异方差的回归校正的标准错误 哪种方法是解决我的问题的最佳方法?如果我使用解决方案2,那么我对模型的预测能力完全没有用吗? Breusch-Pagan检验确认方差不是恒定的。 我的残差在拟合值的函数中看起来像这样: (较大版本)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.