Questions tagged «interaction»

一个解释变量的效果可能取决于另一个解释变量的值的情况。


2
在有向无环图中表示交互作用
有向无环图(DAG;例如Greenland等,1999)是因果关系反事实解释的因果形式化形式的一部分。在这些图中从变量的箭头的存在可变断言可变直接引起(在危险情况时),可变,和如果没有这样一个箭头的断言,可变不直接原因(在风险的某些变化的)可变。一种一种A乙乙B一种一种A乙乙B一种一种A乙乙B 例如,在下面的DAG因果图中,从“烟草烟雾暴露”到“间皮瘤”的黑色箭头表示“吸烟直接导致间皮瘤风险”的说法。 同样,在下面的DAG因果图中,从“石棉暴露”到“间皮瘤”的黑色箭头表示“石棉暴露直接导致间皮瘤风险的改变” 。 由于红色箭头,我使用术语DAG来描述以下因果关系图,我打算断言诸如“石棉暴露引起烟草烟雾暴露对间皮瘤风险的直接因果效应发生变化 ”(石棉确实对肺细胞的损害,除了直接引起间皮瘤风险的改变外,还使这些细胞更容易受到烟草烟雾暴露的致癌性损害,结果是,接触石棉和烟草都会导致吸烟增加。风险大于两个单独风险的总和),并且这与我在问题开始时描述的DAG中因果箭头的形式含义不太吻合(即,因为红色箭头未终止于变量中))。 如何在DAG的视觉形式主义中正确表示交互作用? 参考文献 格陵兰,S。,珍珠,J。和罗宾斯,JM(1999)。流行病学研究因果图。流行病学,10(1):37-48。

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
当包含分类变量之间的交互时,解释混合模型的回归输出
我对使用混合模型/ lmer有疑问。基本模型是这样的: lmer(DV ~ group * condition + (1|pptid), data= df) 组和条件都是两个因素:组具有两个级别(组A,组B),条件具有三个级别(条件1,条件2,条件3)。它是来自人类受试者的数据,因此pptid对每个人都是随机效应。 该模型找到以下带有p值的输出: Estimate MCMCmean HPD95lower HPD95upper pMCMC Pr(>|t|) (Intercept) 6.1372 6.1367 6.0418 6.2299 0.0005 0.0000 groupB -0.0614 -0.0602 -0.1941 0.0706 0.3820 0.3880 condition2 0.1150 0.1151 0.0800 0.1497 0.0005 0.0000 condition3 0.1000 0.1004 0.0633 0.1337 0.0005 0.0000 groupB:condition2 -0.1055 -0.1058 …

4
“适度”还是“互动”?
我遇到了在很多情况下可以互换使用的这两个术语。 基本上,调节者(M)是影响X和Y之间关系的因素。调节分析通常使用回归模型进行。例如,性别(M)会影响“产品研究”(X)和“产品购买”(Y)之间的关系。 在交互中,X1和X2交互以影响Y。此处的相同示例是“产品研究”(X1)受“性别”(X2)影响,并且一起影响“产品购买”(Y)。 我可以看到,适度时,M影响XY关系,但在交互作用中,M(在这种情况下为性别)影响其他IV。 问题:如果我的项目目的是看性别如何影响X和Y之间的关系,我应该使用节制还是互动? 注意:我的项目是关于X和Y之间的相关性,而不是X和Y之间的因果关系。

1
回归比率,又称克朗马尔问题
最近,随机浏览的问题引发了我的一位教授几年前对临时评论的记忆,并警告说在回归模型中使用比率。因此,我开始阅读此书,最终导致Kronmal 1993。 我想确保我正确解释了他关于如何建模这些建议的建议。 对于在从属和独立方面均具有相同分母比率的模型: ž− 1ÿ= Z− 11个ñβ0+ Z− 1XβX+ βž+ Z− 1ϵž-1个ÿ=ž-1个1个ñβ0+ž-1个XβX+βž+ž-1个ϵ Z^{-1}Y = Z^{-1}1_n\beta_0 + Z^{-1}X\beta_X + \beta_Z + Z^{-1}\epsilon 除其他比率外,还依赖于(反)分母变量的回归相关比率 分母变量(反)的权重 对于具有因变量作为比率的模型: ÿ= β0+ βXX+ Z1个ñα0+ ZXαX+ Z− 1ϵÿ=β0+βXX+ž1个ñα0+žXαX+ž-1个ϵ Y = \beta_0 + \beta_XX + Z1_n\alpha_0 + ZX\alpha_X + Z^{-1}\epsilon 用原始变量,分母和分母乘以原始变量的回归分子[分类变量是什么?] 权重(反分母) 对于仅具有独立变量比率的模型: ÿ= β0+ XβX+ Z− …

1
结构方程式:如何在R lavaan包中指定相互作用效果
我正在使用R lavaan软件包来估计结构方程模型。假设模型由1个具有1个潜伏的内生清单变量和2个清单解释性变量组成: group = {0,1} attitude1 = latent,scale age = respondent's age 然后,所需的lavaan模型不起作用: model <- ' attitude1 =~ att1 + att2 + att3 outcome ~ age*group + attitude1*group' 我的目标是按照线性回归的方法,确定每个变量和组之间的主要作用和相互作用作用。能做到吗?
13 r  interaction  sem  lavaan 

1
比率分析技术
我正在寻找有关比率和费率分析的建议和意见。在我工作的领域中,尤其是比率的分析非常普遍,但是我已经阅读了几篇论文,表明这可能是有问题的,我在想: Kronmal,Richard A.1993。重新讨论了比率标准的虚假相关和谬误。皇家统计协会杂志A 156(3):379-392 及相关论文。根据我到目前为止所读的内容,比率似乎可以产生虚假的相关性,迫使回归线穿过原点(这并不总是合适的),并且如果不正确地进行建模,可能会违反边际原理(在理查德·戈德斯坦(Richard Goldstein)中使用比率回归))。但是,在某些情况下必须合理使用比率,我希望统计学家对此发表一些意见。

1
套索的LARS与坐标下降
使用LARS [1]与使用坐标下降来拟合L1正则化线性回归有什么优缺点? 我主要对性能方面感兴趣(我的问题往往有N成千上万且p小于20。)但是,任何其他见解也将受到赞赏。 编辑:自从我发布问题以来,chl亲切地指出了Friedman等人的论文[2],其中坐标下降比其他方法快得多。如果是这样,作为执业医生,我是否应该忘掉LARS来支持协调下降? [1]埃弗隆·布拉德利;海蒂·特雷弗;约翰·斯通,伊恩和蒂布希拉尼·罗伯特(2004)。“最小角度回归”。统计年鉴32(2):第407-499页。 [2] Jerome H. Friedman,Trevor Hastie,Rob Tibshirani,“通过坐标下降的广义线性模型的正则化路径”,《统计软件》,第1卷。33,第1期,2010年2月。

1
GBM软件包与使用GBM的插入符
我一直在使用进行模型调整caret,但随后使用该gbm软件包重新运行模型。据我了解,caret程序包使用gbm的输出应相同。然而,data(iris)使用RMSE和R ^ 2作为评估指标,使用进行的快速测试显示模型中的差异约为5%。我想使用来找到最佳模型性能,caret但要重新运行gbm以利用部分依赖图。下面的代码具有可重复性。 我的问题是: 1)为什么即使这两个软件包应该相同,我仍会看到这两个软件包之间的差异(我知道它们是随机的,但5%的差异还是很大的,尤其是当我没有使用iris建模时使用的很好的数据集时) 。 2)同时使用这两个软件包有什么优点或缺点? 3)不相关:使用iris数据集时,最佳interaction.depth值为5,但高于我所阅读的最大值,使用最大值floor(sqrt(ncol(iris)))为2。这是严格的经验法则还是非常灵活? library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric <- "RMSE" trainControl <- trainControl(method="cv", number=10) set.seed(99) gbm.caret <- train(Sepal.Length ~ ., data=iris, distribution="gaussian", method="gbm", trControl=trainControl, verbose=FALSE, tuneGrid=caretGrid, metric=metric, bag.fraction=0.75) print(gbm.caret) # …

3
具有交互作用项的联合模型与用于组比较的单独回归
在收集了先前问题和讨论的宝贵反馈后,我提出了以下问题:假设目标是检测两组之间的效果差异,例如男性与女性之间的差异。有两种方法可以做到这一点: 对两组进行两个单独的回归,并使用Wald检验拒绝(或不拒绝)原假设:,其中是男性回归中一个IV的系数,是相同回归中的系数四,女性退步。H0H0H_0b1−b2=0b1−b2=0b_1-b_2=0b1b1b_1b2b2b_2 将这两个组合并在一起,并通过包含性别虚拟对象和交互项(IV * genderdummy)来运行联合模型。然后,将基于交互作用的符号和显着性的t检验来检测组效应。 如果在情况(1)中拒绝Ho,即组差异很大,但是在情况(2)中交互项项的系数在统计上不重要,即组差异不重要,该怎么办。反之亦然,在情况(1)中不拒绝Ho,并且在情况(2)中交互项很重要。我几次都以这种结果告终,我想知道哪种结果会更可靠,以及这种矛盾背后的原因是什么。 非常感谢!

3
中度回归:为什么我们要计算预测变量之间的*乘积*项?
在社会科学中,经常使用适度的回归分析来评估两个或多个预测变量/协变量之间的相互作用。 通常,使用两个预测变量,将应用以下模型: ÿ= β0+ β1个* X+ β2* M+ β3* X中号+ eY=β0+β1∗X+β2∗M+β3∗XM+eY = β_0 + β_1*X + β_2*M + β_3*XM + e 请注意,适度性测试通过乘积项(自变量X和缓和变量M的乘积)进行运算。我的根本问题是:为什么我们实际上要计算X和M之间的乘积项?心动不如行动,例如,绝对差| M − X | 还是X 和M的总和?X中号XMXMXXX中号MMXXX中号MM| 中号- X||M−X||M-X|X+ MX+MX + M 有趣的是,肯尼(Kenny)在这里http://davidakenny.net/cm/moderation.htm暗示了这个问题,他说:“正如所看到的那样,对适度的测试并不总是通过产品术语XM来进行”,但是没有给出进一步的解释。 。我猜/希望有一个正式的例证或证明是有启发性的。

1
如何在Stata中使用工具化交互作用项进行工具变量回归?
我在Stata语法上有问题。我需要进行以下回归: y=ax+bz+c(xz)+ey=ax+bz+c(xz)+ey = ax + bz + c(xz) + e 其中和均已检测,并且交互项使用和的检测值。xxxzzzxzxzxzxxxzzz 仅生成和的预测值并将其用作回归变量会产生不正确的标准误差。xxxzzz 编辑:我还需要只对其中一个变量进行检测,并将其中一个变量作为交互项进行类似的回归。

2
SVM,变量交互和训练数据拟合
我有2个一般/更多理论问题。 1)我很好奇在建立预测模型时SVM如何处理变量交互。例如,如果我有两个特征f1和f2,并且目标取决于f1,f2,并说f1 * f2(或某些函数h(f1,f2)),则SVM是否适合(不仅适用于OOS,甚至适用于训练数据)在仅包括f1和f2的特征中包括f1,f2和h(f1,f2)时是否有所改善?SVM算法处理特征交互吗?SVM如何尝试在更高维度的空间中创建超平面,但似乎并不确定。 2)在将SVM拟合训练数据时,如果具有足够的功能并找到最佳参数(通过蛮力搜索或其他方法),SVM会总是琐碎地拟合训练数据吗?不知道我的措词是否正确,但是基本上,如果功能中有足够的方差/噪声,SVM是否总是100%适合训练数据?相反,如果SVM无法100%拟合训练数据,这是否意味着某些影响目标变量的信息(或其他功能)并未在数据中捕获? 谢谢 小澄清。我指的是内核SVM

3
交互仅在回归分析中有用吗?
我一直在回归的背景下阅读交互一词。我们是否还应考虑与不同模型(例如knn或svm)的交互? 如果有,甚至更多的功能,并且可以说有观察值,那么找到有用的交互的通常方法是什么?尝试所有组合吗?还是只使用有意义的组合?505050100100100100010001000

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.