Questions tagged «contrasts»

在线性模型中,尤其是在方差分析中,对比度是参数的线性组合,系数总和为零。它用于检验相应的零假设。对比尤其经常与分类预测变量(因素)一起使用,以便在各组(分类)之间进行比较。[另请参见标签“类别编码”]

4
什么是对比度矩阵?
什么究竟是对比矩阵(一个术语,关于与分类预测分析),以及如何准确地进行对比矩阵指定?即什么是列,什么是行,对该矩阵的约束是什么,列j和行中的数字i是什么意思?我试图研究文档和网络,但似乎每个人都在使用它,但任何地方都没有定义。我可以对可用的预定义对比进行后向工程,但是我认为没有该定义就应该可用。 > contr.treatment(4) 2 3 4 1 0 0 0 2 1 0 0 3 0 1 0 4 0 0 1 > contr.sum(4) [,1] [,2] [,3] 1 1 0 0 2 0 1 0 3 0 0 1 4 -1 -1 -1 > contr.helmert(4) [,1] [,2] [,3] 1 -1 …

7
R中带有对比代码的III型SS ANOVA如何处理?
请提供R代码,该代码允许以-3,-1、1、3的对比度进行对象间ANOVA。我了解对于此类分析的适当平方和(SS)类型存在争议。但是,由于SAS和SPSS中使用的默认SS类型(III型)被认为是我所在地区的标准。因此,我希望此分析的结果与那些统计程序生成的结果完全匹配。要被接受,答案必须直接调用aov(),但其他答案可能会被投票(尤其是如果它们易于理解/使用)。 sample.data <- data.frame(IV=rep(1:4,each=20),DV=rep(c(-3,-3,1,3),each=20)+rnorm(80)) 编辑:请注意,我要求的对比度不是简单的线性或多项式对比度,而是通过理论预测得出的对比度,即Rosenthal和Rosnow讨论的对比度类型。


2
用于回归的多项式对比
我无法理解回归拟合中多项式对比的用法。特别是,我指的是,用于R表示此页面上描述的间隔变量(具有相等间距的正交变量)使用的编码。 在该页面的示例中,如果我理解正确的话,R适合间隔变量的模型,返回一些权重,以加权其线性,二次或三次趋势。因此,拟合模型应为: write=52.7870+14.2587X−0.9680X2−0.1554X3,write=52.7870+14.2587X−0.9680X2−0.1554X3,{\rm write} = 52.7870 + 14.2587X - 0.9680X^2 - 0.1554X^3, 其中应取的值,,,或根据不同的电平的间隔可变的。XXX111222333444 它是否正确?而且,如果是这样,多项式对比的目的是什么?

1
如何设置和解释ANOVA与R中的汽车包装的对比?
假设我有一个想要进行ANOVA的简单2x2阶乘实验。像这样: d <- data.frame(a=factor(sample(c('a1','a2'), 100, rep=T)), b=factor(sample(c('b1','b2'), 100, rep=T))); d$y <- as.numeric(d$a)*rnorm(100, mean=.75, sd=1) + as.numeric(d$b)*rnorm(100, mean=1.2, sd=1) + as.numeric(d$a)*as.numeric(d$b)*rnorm(100, mean=.5, sd=1) + rnorm(100); 在没有重大交互作用的情况下,默认情况下(即contr.treatment)的输出Anova()是的a所有级别b和的b所有级别的总体重要性a,对吗? 我应该如何指定一个对比,让我来测试效果的意义a与b在B1水平保持恒定,效果a与b被关押在B2水平不变,并相互作用的a:b?
15 r  anova  contrasts 

1
可用于分类变量(R中)的不同编码类型是什么?何时使用它们?
如果您拟合线性模型或混合模型,则可以使用不同类型的编码将类别或名义变量转换为估计参数的多个变量,例如虚拟编码(R默认)和效果编码。 我听说在进行交互时最好使用效果编码(有时称为偏差编码或对比度编码),但是可能存在哪些对比度,何时使用哪种类型的对比度? 上下文是R中使用的混合建模lme4,但我认为可以使用更广泛的响应。抱歉,如果我错过了类似的问题。 编辑:两个有用的链接是:效果编码和伪编码说明。

1
测试某些对比:这是否确实是一个难题?
我将其发布到mathoverflow上,没有人回答: Scheffé的用于识别统计上显着差异的方法是众所周知的。甲对比度的装置中,我= 1 ,... ,- [R的ř种群是线性组合Σ ř 我= 1 c ^ 我μ 我其中Σ ř 我= 1 c ^ 我 = 0μ一世μi\mu_ii = 1 ,… ,ri=1,…,ri=1,\ldots,r[Rrr∑[R我= 1C一世μ一世∑i=1rciμi\sum_{i=1}^r c_i \mu_i∑[R我= 1C一世= 0∑i=1rci=0\sum_{i=1}^r c_i=0,并且对比度的标量倍数本质上是相同的对比度,因此可以说这组对比度是一个投影空间。Scheffé的方法测试了一个零假设,该假设表示这r个总体之间的所有对比均为0,并且在给定显着性水平α的情况下,假设零假设为真,则以概率α拒绝该零假设。而且,如果否定原假设被拒绝,Scheffé指出,他的测试告诉我们哪些对比与0明显不同(我不确定我链接到的Wikipedia文章指出了这一点)。[Rrr000αα\alphaαα\alpha000 我想知道在不同情况下是否可以做类似的事情。考虑一个简单的线性回归模型,其中ε 我〜我。我。d 。ÿ一世= α + βX一世+ ε一世Yi=α+βxi+εiY_i = \alpha + \beta x_i + \varepsilon_i,我= 1 ,... ,Ñ。ε一世〜我。我。d 。ñ(0 ,σ2)εi∼i.i.d.⁡N(0,σ2)\varepsilon_i\sim\operatorname{i.i.d.}N(0,\sigma^2)i=1,…,ni=1,…,ni=1,\ldots,n …

2
如何为使用汽车的重复测量方差分析指定特定的对比?
我正在尝试在R中运行重复测量Anova,然后对该数据集进行一些特定的对比。我认为正确的方法是 Anova()从汽车包装中使用。 让我们用?Anova使用 OBrienKaiser数据的示例来说明我的问题(注意:我省略了示例中的性别因素): 我们设计了一个在受试者因素,治疗之间(3个级别:对照,A,B)和两个重复的因素-测量(在受试者内)因素,阶段(3个级别:测试前,测试后,随访)和小时(5个级别:1至5)。 标准ANOVA表的给出方式为(与example(Anova)不同,我切换到Type 3 Squares of Squares,这是我的领域想要的): require(car) phase <- factor(rep(c("pretest", "posttest", "followup"), c(5, 5, 5)), levels=c("pretest", "posttest", "followup")) hour <- ordered(rep(1:5, 3)) idata <- data.frame(phase, hour) mod.ok <- lm(cbind(pre.1, pre.2, pre.3, pre.4, pre.5, post.1, post.2, post.3, post.4, post.5, fup.1, fup.2, fup.3, fup.4, fup.5) ~ treatment, data=OBrienKaiser) …

1
多项式对比变量的计算
请让我知道如何有效地将分类变量(因子)重新编码为正交多项式对比变量的集合。 对于许多类型的对比变量(例如,偏差,简单,Helmert等),通过是: 组成对应类型的对比度系数矩阵。 对其进行逆运算或广义逆运算可获得代码矩阵。 例如: Suppose there is 3-group factor and we want to recode it into a set of deviation contrast variables. The last group is treated as reference. Then the contrast coefficients matrix L is Group1 Group2 Group3 var1 2/3 -1/3 -1/3 var2 -1/3 2/3 -1/3 and ginv(L) …

1
如何使用R进行4 x 4混合方差分析,在对象间和对象内进行对比?
R的初学者在这里一直在反复测量方差分析。 我有一个数据集,该数据集由一个具有4个级别的主体因素之间的代码(编码为一个称为“组”的单个变量)和一个具有4个级别的主体因素内的数据集(分别编码为四个单独的变量“ DV1”,“ DV2”,“ DV3” ','DV4')。 我的目标如下: 运行总体重复测量方差分析。 使用自定义对比来比较组(如SPSS中的LMATRIX命令)。 使用自定义对比度(如SPSS中的MMATRIX命令)比较不同级别的DV。 同时进行2)和3)的组合,因此我只比较对象内因素处于特定水平的特定组。 运行一组不为零的对比。 我知道我可以在SPSS中做到这一点,但没有很多问题,但是我不清楚如何在R中做到这一点。到目前为止,还没有看到这在R中的一个过程或一组相关过程中如何工作。

2
如何解释这些自定义对比?
我正在使用自定义对比度进行单因素方差分析(每个物种)。 [,1] [,2] [,3] [,4] 0.5 -1 0 0 0 5 1 -1 0 0 12.5 0 1 -1 0 25 0 0 1 -1 50 0 0 0 1 我将强度0.5与5、5与12.5进行比较,依此类推。这些是我正在处理的数据 具有以下结果 Generalized least squares fit by REML Model: dark ~ intensity Data: skofijski.diurnal[skofijski.diurnal$species == "niphargus", ] AIC BIC logLik …

1
如何在R中使用Lmer设置自定义对比度
我在R中使用lmer来检查条件(cond)对某些结果的影响。这是一些组成的数据,其中s是主题标识符a,b和c是条件。 library("tidyr") library("dplyr") set.seed(123) temp <- data.frame(s = paste0("S", 1:30), a = rnorm(30, -2, 1), b = rnorm(30, -3, 1), c = rnorm(30, -4, 1)) 我想比较 级别a的平均水平b,并c与 逐级b升级c。 我的问题是,如何设置对比度以使截距反映三个条件的均值,而两个计算出的估计值直接反映1.和2中定义的差异? 我尝试过 c1 <- cbind(c(-0.5, 0.25, 0.25), c(0, -0.5, 0.5)) gather(temp, cond, result, a, b, c) %>% lmer(result ~ cond + (1|s), …

1
如何为一个级别与另一个级别的平均值之差指定对比度矩阵(以R为单位)?
我有一个看起来像这样的回归模型:Y=β0+β1X1+β2X2+β3X3+β12X1X2+β13X1X3+β123X1X2X3Y=β0+β1X1+β2X2+β3X3+β12X1X2+β13X1X3+β123X1X2X3Y = \beta_0+\beta_1X_1 + \beta_2X_2 + \beta_3X_3 +\beta_{12}X_1X_2+\beta_{13}X_1X_3+\beta_{123}X_1X_2X_3 ...或用R表示法: y ~ x1 + x2 + x3 + x1:x2 + x1:x3 + x1:x2:x3 假设和是分类变量,而是数字。复杂之处在于具有三个级别并且我需要测试以下内容而不是标准对比:X1X1X_1X2X2X_2X3X3X_3X1X1X_1X1a,X1b,X1cX1a,X1b,X1cX_{1a}, X_{1b}, X_{1c} 级的截距是否与和级的平均截距明显不同。X1aX1aX_{1a}X1bX1bX_{1b}X1cX1cX_{1c} 的响应在级与和级的平均值之间是否显着不同。X2X2X_2X1aX1aX_{1a}X1bX1bX_{1b}X1cX1cX_{1c} 的斜率在级别与级别和的平均值之间是否显着不同。X3X3X_3X1aX1aX_{1a}X1bX1bX_{1b}X1cX1cX_{1c} 根据这篇文章,看来我想要的矩阵是... 2 -1 -1 我也是contrasts(mydata$x1)<-t(ginv(cbind(2,-1,-1)))。的估计更改,其他的更改。我可以重现的新的估计通过减去的预测值和组装置(当和处于其基准电平)从值的两倍在这些级别。但是我不能相信自己正确地指定了对比度矩阵,除非我也可以类似地得出其他系数。β1β1\beta_1beta1beta1beta_1X1bX1bX_1bX1cX1cX_1cX3=0X3=0X_3=0X2X2X_2X1aX1aX_1a 有人对如何将我的头脑包扎在单元均值和对比度之间的关系上有任何建议吗?谢谢。这种对比有标准名称吗? 啊哈!根据Glen_b答案中发布的链接,最重要的是,您可以将想要的组的任何比较转换为R样式的对比度属性,如下所示: 制作一个方矩阵。行代表因子水平,列代表对比。除了第一个,它告诉模型截距应该代表什么。 如果您想让截距成为平均值,请在第一列中填写所有相同的非零值,无论如何。如果要让截距成为水平均值之一,则在该行中放置一个数字,并用零填充其余部分。如果您希望截距是多个级别的平均值,则在这些行中输入数字,在其余行中输​​入零。如果希望它是加权平均值,请使用不同的数字,否则请使用相同的数字。您甚至可以在intercept列中输入负值,这也可能意味着某些事情,但是它完全改变了其他对比度,所以我不知道那是什么意思 在正数和负数中填充其余的列,以指示您要与其他水平进行比较的水平。我忘记了为什么总和为零很重要,但是要调整值以使列的总和为零。 使用t()函数转置矩阵。 ginv()从MASS包装中使用或solve()以获得转置矩阵的逆。 删除第一列,例如mycontrast<-mycontrast[,-1]。现在您有了apx p-1矩阵,但是在第5步中,您为截取输入的信息被整体编码为矩阵。 如果您希望摘要输出中的标签比其他lm()人的默认输出更易于阅读,请相应地为矩阵的列命名。截距将始终自动被命名(Intercept)。 使矩阵成为相关因素的新对比,例如 contrasts(mydata$myfactor)<-mymatrix 运行lm()(和使用公式可能很多其他功能)为在标准的R正常,而无需负载glht,doBy或contrasts。 Glen_b,谢谢,也感谢您加州大学洛杉矶分校统计咨询小组。我的应用统计专家花了几天时间研究这个话题,但我仍然不知道如何实际编写自己的对比度矩阵。而现在,一个小时的阅读和使用R的乐趣,我终于觉得我明白了。猜猜我应该改为申请UCLA。或大学StackExchange。
9 r  contrasts 

3
如何将系数项应用于线性方程中的因子和交互项?
使用R,我为来自连续和离散预测变量混合的单个响应变量拟合了线性模型。这是非常基础的,但是我很难理解离散因子的系数是如何工作的。 概念:显然,连续变量'x'的系数是以以下形式应用的,y = coefx(varx) + intercept但是如果该因子是非数值的,那么该因子对因子z怎么起作用?y = coefx(varx) + coefz(factorz???) + intercept 具体:我在R中拟合了一个模型,lm(log(c) ~ log(d) + h + a + f + h:a)其中h和f是离散的非数值因素。系数为: Coefficients: Estimate (Intercept) -0.679695 log(d) 1.791294 h1 0.870735 h2 -0.447570 h3 0.542033 a 0.037362 f1 -0.588362 f2 0.816825 f3 0.534440 h1:a -0.085658 h2:a -0.034970 h3:a -0.040637 我如何使用它们来创建预测方程: …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.