Questions tagged «interaction»

一个解释变量的效果可能取决于另一个解释变量的值的情况。

2
如何绘制具有置信区间的交互图?
我的尝试: 我无法获得置信区间 interaction.plot() 另一方面plotmeans(),“ gplot”包不会显示两个图表。此外,我不能在两个plotmeans()图之间加上两个图,因为默认情况下轴是不同的。 我使用plotCI()了'gplot'包并叠加了两个图形,但取得了一些成功,但是轴的匹配并不完美。 关于如何制作具有置信区间的交互图的任何建议?通过一个函数,或有关如何叠加plotmeans()或plotCI()图形的建议。 代码样本 br=structure(list(tangle = c(140L, 50L, 40L, 140L, 90L, 70L, 110L, 150L, 150L, 110L, 110L, 50L, 90L, 140L, 110L, 50L, 60L, 40L, 40L, 130L, 120L, 140L, 70L, 50L, 140L, 120L, 130L, 50L, 40L, 80L, 140L, 100L, 60L, 70L, 50L, 60L, 60L, 130L, 40L, 130L, …

2
ggplot2中如何通过连续交互来连续绘制一个图?
假设我有数据: x1 <- rnorm(100,2,10) x2 <- rnorm(100,2,10) y <- x1+x2+x1*x2+rnorm(100,1,2) dat <- data.frame(y=y,x1=x1,x2=x2) res <- lm(y~x1*x2,data=dat) summary(res) 我想通过连续交互来绘制连续图,以使x1在X轴上,而x2用3条线表示,一条在Z分数为0时代表x2,在Z分数为+1时代表另一条,而在a Z分数为-1,每行分别有单独的颜色和标签。如何使用ggplot2执行此操作? 例如,它可能看起来像这样(尽管当然使用不同的彩色线条而不是不同的线条类型):

2
如何使用混合效应模型对交互作用词进行事后比较?
我正在研究一个数据集,以评估干燥对沉积物微生物活动的影响。目的是确定干燥的影响是否随沉积物类型和/或沉积物中深度的变化而变化。 实验设计如下: 第一因子沉积物对应于三种沉积物类型(编码为Sed1,Sed2,Sed3)。对于每种沉积物,在三个地点进行采样(Sed1为3个地点,Sed2为3个地点,Sed3为3个地点)。 网站编码:Site1,Site2,...,Site9。 下一个因素是水文:在每个站点内,在干地和湿地(编码为干/湿)中进行采样。 在每个上一个图中,以两个深度(D1,D2)一式三份进行采样。 总共有n = 108个样本= 3个沉积物* 3个地点* 2个水文学* 2个深度* 3个重复项。 我lme()在R(nlme软件包)中使用该函数,如下所示: Sediment <- as.factor(rep(c("Sed1","Sed2","Sed3"),each=36)) Site <- as.factor(rep(c("Site1","Site2","Site3","Site4","Site5", "Site6","Site7","Site8","Site9"),each=12)) Hydrology <- as.factor(rep(rep(c("Dry","Wet"),each=6),9)) Depth <- as.factor(rep(rep(c("D1","D2"),each=3),18)) Variable <- rnorm(108) mydata <- data.frame(Sediment,Site,Hydrology,Depth,Variable) mod1 <- lme(Variable ~ Sediment*Hydrology*Depth, data=mydata, random=~1|Site/Hydrology/Depth) anova(mod1) 我想进行事后比较,以测试一个术语是否有意义。 我能够做到这一点,以获得简单的主要效果(例如,沉积物): summary(glht(mod1,linfct=mcp(Sediment="Tukey"))) 但是该glht()功能不适用于交互条件。 我发现以下方法可以用于两向方差分析: mod1 <- lme(Variable~Sediment*Hydrology, …

3
如何计算两个斜率之差?
有没有一种方法可以了解两条线(或多或少)是否平行?我有两条线是从线性回归生成的,我想了解它们是否平行。换句话说,我想得到这两条线的斜率的不同。 是否有R函数来计算? 编辑: ...,以及如何获得线性回归线的斜率(以度为单位)?


2
对于三向重复测量方差分析,什么是有效的事后分析?
我已经执行了三向重复测量方差分析;事后分析有效吗? 这是一个完全平衡的设计(2x2x2),其中一个因素具有重复进行内部测量的功能。我知道R中重复测量ANOVA的多变量方法,但是我的第一个直觉是继续进行ANOVA的简单aov()风格: aov.repeated <- aov(DV ~ IV1 * IV2 * Time + Error(Subject/Time), data=data) DV =响应变量 IV1 =自变量1(2个级别,A或B) IV2 =自变量2(2个级别,是或否) IV3 =时间(2级,之前或之后) 主题=主题ID(总共40个主题,每个IV1级别20个:nA = 20,nB = 20) summary(aov.repeated) Error: Subject Df Sum Sq Mean Sq F value Pr(>F) IV1 1 5969 5968.5 4.1302 0.049553 * IV2 1 3445 3445.3 2.3842 …

2
在线性回归中,当我们仅对交互作用项感兴趣时,为什么还要包含二次项?
假设我对线性回归模型,用于ÿ一世= β0+ β1个X1个+ β2X2+ β3X1个X2Yi=β0+β1x1+β2x2+β3x1x2Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2,因为我想看看如果两个协变量之间的相互作用产生作用在Y。 在教授的课程笔记中(我没有与之联系),其中指出:当包括互动术语时,您应该包括他们的第二学位术语。即ÿ一世= β0+ β1个X1个+ β2X2+ β3X1个X2+ β4X21个+ β5X22Yi=β0+β1x1+β2x2+β3x1x2+β4x12+β5x22Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 +\beta_4x_1^2 + \beta_5x_2^2应包含在回归。 当我们仅对互动感兴趣时,为什么要包含第二学位?

2
当解释变量之一可能具有二次项和三次项时,我该如何建模?
我衷心希望我对这个问题的表述方式能够得到明确的回答-如果没有,请让我知道,我会再试一次!我还应该注意,我将使用R进行这些分析。 我plant performance (Ys)怀疑有几种措施受到了我实施的四种治疗的影响- flower thinning (X1), fertilization (X2), leaf clipping (X3)和biased flower thinning (X4)。对于所有可能的Y,N至少为242,因此我的样本量很大。所有地块都进行了稀疏或不间断处理,但每个地块也经历了其他三种处理方式中的一种(也只有一种)(或没有,也有对照地块)。该设计的目的是测试其他三种处理是否能够“掩盖”或“增强”细化效果。因此,通过设计,后三种处理(X2-X4)不能相互作用彼此,因为他们没有交叉,但他们可以每疏花互动-他们可能会做。 我的明确假设是:1)开花稀疏将很重要,并且2)X1*X2, X1*X3, and X1*X4,花卉稀疏与其他三种处理之间的相互作用项也将很重要。就是说,疏花应该很重要,但是其他三种处理方式却应该大大改变疏花的方式。 我想将所有这些信息包括在混合模型中: Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects) 但是有一个困扰:我有充分的理由相信细化对Y的影响是非线性的。它们可能是二次方的,但在某些情况下甚至可能是三次方的。这是因为细化对性能的影响很可能在更高的细化水平下更快地增加。如果我尝试通过为X1添加二次项和三次项来通过上述等式对这种非线性关系进行建模,那么我不确定如何对交互项进行建模-我应该包括X1的所有可能组合(X1)^ 2,以及(X1)^ 3 * X2,X3和X4?因为即使有我拥有的数据点的数量,这似乎也要尝试估计很多参数,而且我不确定如何解释得到的结果。就是说,我没有生物学上的理由认为这将是对情况进行建模的不明智的方式。 因此,对于如何解决此问题,我有三点想法: 首先拟合一个较小的模型,例如Y …

1
分类变量和连续变量之间相互作用的解释系数
我对连续变量和分类变量之间的相互作用系数的解释有疑问。这是我的模型: model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), data=base_708) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 21.4836 2.0698 10.380 < 2e-16 *** lg_hag 8.5691 3.7688 2.274 0.02334 * raceblack -8.4715 1.7482 -4.846 1.61e-06 *** racemexican -3.0483 1.7073 -1.785 0.07469 . racemulti/other -4.6002 2.3098 -1.992 0.04687 * pdg 2.8038 0.4268 6.570 1.10e-10 *** sexfemale 4.5691 1.1203 …

1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
R中具有因子的线性回归
我试图了解因素在R中的确切作用。假设我想使用R中的一些样本数据进行回归: > data(CO2) > colnames(CO2) [1] "Plant" "Type" "Treatment" "conc" "uptake" > levels(CO2$Type) [1] "Quebec" "Mississippi" > levels(CO2$Treatment) [1] "nonchilled" "chilled" > lm(uptake ~ Type + Treatment, data = CO2) Call: lm(formula = uptake ~ Type + Treatment, data = CO2) Coefficients: (Intercept) TypeMississippi Treatmentchilled 36.97 -12.66 -6.86 我了解这一点,TypeMississippi并将Treatmentchilled其视为布尔值:对于每一行,初始摄取为36.97,12.66如果它是密西西比州的类型并且6.86是冷藏的,我们就减去它。我在理解以下内容时遇到了麻烦: > …


4
帮助解释一个交互图?
当两个独立变量之间存在交互时,我很难解释交互图。 下图来自此站点: 此处,和是自变量,是因变量。一个AA乙BBd VDVDV 问:有互动的主要作用,但没有主效应一个AA乙BB 我可以看到,如果B在,则的值越高,的值越高,否则,无论的值如何,都是恒定。因此,存在之间的相互作用和和的主效应(因为较高导致更高,保持以恒定)。一个AAd VDVDV乙1个B1B_1d VDVDV一个AA一个AABBBAAAAAADVDVDVBBBB1B1B_1 另外,我可以看到不同层次的会导致不同程度的,拿着常数。因此,存在B的主要作用。但是,事实显然并非如此。因此,这必须表示我错误地解释了交互图。我究竟做错了什么?BBBDVDVDVAAA 我也错误地解释了情节6-8。我用来解释它们的逻辑与我上面使用的逻辑相同,所以如果我知道我在上面犯的错误,我应该能够正确解释其余的逻辑。否则,我将更新此问题。


1
交互项是否使用中心变量分层回归分析?我们应该集中哪些变量?
我正在运行分层回归分析,但我有一些疑问: 我们是否使用居中变量计算交互作用项? 除了因变量外,我们是否必须将数据集中所有连续变量居中? 当我们必须记录一些变量时(因为它们的sd远远高于平均值),我们是否应该将刚刚记录的变量或初始变量居中? 例如:变量“ Turnover” --->记录的成交量(因为sd相对于平均值而言过高)---> Centered_Turnover? 或直接是营业额-> Centered_Turnover(我们一起工作) 谢谢!!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.