后续行动:在ANOVA图表之间的混合内,估计的SE或实际的SE?


14

我目前正在整理一篇论文,从昨天开始偶然发现了这个问题,这使我向自己提出了同样的问题。更好地为我的图表提供来自数据的实际标准误差还是由ANOVA估算的误差?
由于昨天的问题相当具体,我的问题相当具体,我认为提出这个后续问题是适当的。

详细信息:
我已经在某个认知心理学领域(条件推理)中进行了一项实验,将两组(归纳和演绎指令,即受试者之间的操作)与两个受试者内部的操作(问题的类型和问题的内容)进行了比较。两个因素水平)。

结果看起来像这样(左侧面板显示的是ANOVA输出的SE值,右侧面板显示的是根据数据估算的SEs): 替代文字
请注意,不同的行代表两个不同的组(即,对象间操作),而内部在x轴(即2x2因子水平)上绘制受试者操作。

在本文中,我提供了方差分析的相应结果,甚至提供了中间关键交叉交互的计划比较。SE在那里为读者提供了有关数据可变性的一些提示。我更倾向于使用SE,而不是标准偏差和置信区间,因为绘制SD并不常见,并且在比较对象之间和对象之间的CI时存在严重问题(因为肯定适用于SE,错误地推断出显着差异的情况并不常见从他们)。

重复我的问题:绘制从ANOVA估计的SE是更好还是我应该绘制从原始数据估计的SE?

更新:
我认为我应该对SE的估算值更加清楚。SPSS中的ANOVA输出为我estimated marginal means提供了相应的SE和CI。这是在左图中绘制的内容。据我了解,它们应该是残差的标准差。但是,当保存残差时,它们的SD不会以某种方式接近估计的SE。因此,一个次要的(可能是特定于SPSS的问题)将是:这些SE
什么?


更新2:我终于设法编写了一个R函数,该函数应该能够像我最终喜欢的那样自行绘制(请参见我接受的答案)。如果有人有时间,如果您可以看一下,我将不胜感激。这里是。


1
您能否阐明预测变量“平均认可”?这是参与者用于回应的0-100量表,还是衡量参与者说“是,我赞成”(相对于“否,我不赞成”)的试验比例的度量。如果是后者,则不宜按比例分析此数据。相反,您应该使用具有二项式链接函数的混合效应模型来分析原始的,逐项试验的数据。
Mike Lawrence 2010年

抱歉,忽略了这一点:它是0-100的响应等级。
亨里克

您有很多0或100吗?如果没有,我会考虑除以100并执行logit转换,以考虑极端情况下的范围限制。当您拥有二进制数据时,这本质上是通过二项式链接函数实现的,但是如果您仅拥有像此处一样的比例数据,则很有用。但是,你不能Logit模型变换1或0,所以你必须折腾的100或0任何反应
迈克·劳伦斯

糟糕,才意识到我的第一句话不是100%正确。每个标绘的平均值代表0-100范围内两个响应的平均值。在此数据中,有很多值非常接近100,有一些直接在100上,但实际上很少在0和0左右。您有一些文献来证明您的建议吗?
亨里克

1
其他数据可视化人员可能会声称条形图是危害人类的犯罪:操作
Mike Lawrence

Answers:


9

作为对我的问题的有启发性的答案和讨论的结果,我构建了以下图,这些图不依赖于任何基于模型的参数,而是提供了基础数据。

原因是,无论我选择哪种标准误差,标准误差都是基于模型的参数。那么,为什么不显示基础数据从而传输更多信息呢?

此外,如果从方差分析中选择SE,则我的特定问题会出现两个问题。
首先(至少对我而言)目前尚不清楚SPSSANOVA Output中的SE 实际是什么(另请参见注释中的讨论)。它们在某种程度上与MSE相关,但我究竟不知道如何。
其次,它们只有在满足基本假设时才是合理的。但是,如下图所示,明显违反了方差同质性的假设。

有箱线图的图: 替代文字

具有所有数据点的图: 替代文字

请注意,这两个组向左或向右稍微移位:向左演绎,向右演绎。均值仍以黑色绘制,背景中的数据或方框图以灰色绘制。左图和右图之间的差异在于,如果均值与点或箱形图的位置相同,还是在中心位置显示。
抱歉,图表质量不佳,并且缺少x轴标签。

剩下的问题是,以上选择中的哪一个是现在要选择的。我必须考虑一下,并询问我们论文的另一位作者。但是,现在,我更喜欢“意味着手段错位的观点”。我仍然会对评论很感兴趣。


更新:经过一些编程,我终于设法编写了一个R函数来自动创建一个像点均错位的图。检查一下(并向我发送评论)


优秀的亨里克。我也更喜欢“意味深远的观点”。将主题与线段链接可能看起来太混乱。可怜。至于方差的同质性,我有点乐观。方差问题可能不像原始数据那样严重。在大多数情况下,我怀疑您会比较对比-在小组差异内。对比方差将比原始数据方差更均匀。如果比较具有不同方差的原始量度(例如,MP值和合理组中的归纳法与演绎法),则可以使用非参数检验作为备用。
Thylacoleo

1
我喜欢集中的意思。它具有线条的真实表示。您可以缩小分数。
约翰

8

使用这种类型的实验设计,您将找不到一个合理的误差条用于推断。这是一个老问题,没有明确的解决方案。

估计您在这里的SE似乎是不可能的。这种设计有两种主要的误差,S误差和S误差。它们通常彼此非常不同且不可比。确实没有很好的单一误差条来表示您的数据。

有人可能会争辩说,从描述性而非推理的角度来看,数据中的原始SE或SD最重要。他们要么说出集中趋势估计的质量(SE),要么说数据的可变性(SD)。但是,即使那样,它还是有些不屑一顾,因为您在S内测试和测量的东西不是原始值,而是in S变量的作用。因此,报告原始值的可变性对于S效应之内是没有意义的还是具有误导性的。

我通常不认可此类图和相邻效果图上的误差线来指示效果的可变性。在该图中可能会有完全合理的CI。有关效果图的示例,请参见Masson&Loftus(2003)。只需消除它们显示的平均值周围的((几乎完全无用的)误差线),然后使用效果误差线即可。

对于您的研究,我首先将数据重新绘制为2 x 2 x 2设计(2面板2x2),然后以有效性,合理性,说明和交互作用的置信区间紧靠图形绘制。将指令组的SD和SE放在表或文本中。

(等待预期的混合效应分析响应;)

更新:好的,在编辑之后,很明显,您唯一想要的就是使用SE来显示值估计的质量。在这种情况下,请使用您的模型值。这两个值都是基于模型的,样本中没有“真实”值。使用您应用于数据模型中的模型。但是,请确保在图形标题中警告读者,这些SE对您在S效应或相互作用内没有任何推论价值。

UPDATE2:回头看一下您提供的数据...看起来像是百分比,但这些百分比本来就不应该使用ANOVA进行分析。无论是否存在,它都是一个最大为100的变量,并且在极端情况下具有减小的方差,因此仍然不应使用ANOVA对其进行分析。我非常喜欢您的rm.plot图。我仍然很想对条件之间的曲线作图,显示原始数据,并在条件下显示去除S变异性的数据。


1
我有充分的(非统计的)理由来绘制图表,因为它是:您可以直接看到研究问题的答案。此外,由于我知道中间的问题,因此我并不是为了推论目的而寻找错误栏。但是,由于要把我重新定位到梅森和洛夫图斯,我一定忘了他们有一个混杂的例子。我必须考虑它是否符合我的目的。
亨里克

7

看起来这是一个非常不错的实验,恭喜!

我同意约翰·克里斯蒂(John Christie)的观点,它是一个混合模型,但是只要可以在ANOVA设计中适当地指定它(并且是平衡的),我就看不出为什么不能如此表述。主体之间的两个因素和主体之间的一因素,但是主体之间的因素(归纳/演绎)清楚地相互作用(修改)主体内部的效果。我假设绘制的均值来自ANOVA模型(LHS),因此该模型已正确指定。做得好-这是不平凡的!

一些要点:1)“估计”与“实际”“错误”是错误的二分法。两者都假设一个基础模型并在此基础上进行估计。如果模型是合理的,我会认为最好使用基于模型的估计(它们是基于较大样本的集合)。但是正如James所提到的,错误因您进行的比较而异,因此不可能有简单的表示形式。

2)我希望看到绘制的箱形图或单个数据点(如果没有太多),可能会有一些侧向抖动,因此可以区分具有相同值的点。

http://en.wikipedia.org/wiki/Box_plot

3)如果必须绘制均值误差的估计值,则不要绘制SD-它们是样本标准偏差的估计值,并且与总体变异性有关,而不是均值的统计比较。通常最好绘制95%的置信区间而不是SE,但在这种情况下则不行(请参见1和John的观点)

4)与我有关的该数据的一个问题是,可能会违反统一方差的假设,因为“ MP有效和合理”数据显然受到100%限制的约束,尤其是对于演绎人员。我在想自己这个问题有多重要。转向混合效应logit(二项式概率)可能是理想的解决方案,但这是一个难题。最好让别人回答。


我不确定我是否会理解1中的建议。由于实际的SE [即SD / sqrt(n)]和估计的SE都是基于模型的,因此建议您使用基于模型的模型。那么哪一个呢?还是您的意思是:使用更复杂的模型(此处为ANOVA),因为这两个模型都是合理的。
亨里克

完全同意第1点
约翰·

嗨,亨里克,您好,简单示例-比较假设为ND的两组(x1,x2)。假设和模型:1)独立采样,方差不同。x1,x2的SE分别估算。这是许多图形表示中的隐含假设。估计的SE有所不同。2)独立,相同变种 通常的方差分析假设。使用合并的RSS估算SE。如果IF假设正确,则估计更为可靠。3)每个x1有一个x2对。根据x1-x2估算的SE。为了有效地绘制它们,您需要绘制差异x1-x2。混合使用1)和2)后,您将很难绘制出有意义的SE或CI。
Thylacoleo

Henrik,对剧情的评论。你有几门科目?我强烈建议单独绘制数据并使用线段链接个人。(线段的链接方式具有欺骗性。)无需绘制SE。这个想法是在视觉上支持您的统计分析。假设情节不太混乱,读者应看到(例如)对于归纳组来说,大多数分数从MP有效单调上升到AC无效,而对演绎组则下降。参见:jstor.org/stable/2685323?seq= 1特别是图1和9的底部面板。
Thylacoleo

3

最近,我一直在使用混合效果分析,并且在尝试开发伴随的可视化数据分析方法时,我一直在使用引导程序(请参阅此处的描述),该方法产生的置信区间不易受内部问题之间的干扰。常规CI。

另外,就像您在上图中所做的那样,我将避免将多个变量映射到相同的视觉美感。您在x轴上映射了3个变量(MP / AC,有效/无效,合理/难以置信),这使得解析设计和图案相当困难。我建议改为将M​​P / AC映射到x轴,将有效/无效映射到构面列,将其合理/不可行地映射到构面行。在R中签出ggplot2可以轻松实现这一目标,例如:

library(ggplot2)
ggplot(
    data = my_data
    , mapping = aes(
        y = mean_endorsement
        , x = mp_ac
        , linetype = deductive_inductive
        , shape = deductive_inductive
)+
geom_point()+
geom_line()+
facet_grid(
    plausible_implausible ~ valid_invalid
)

Mike,在封装语言R中,pvals.fnc函数执行MCMC来评估lmer模型的假设-但是它不处理具有随机斜率的设计-这使我怀疑在某种程度上使用随机斜率进行MCMC是有原因的某种程度上有问题,您是否明确知道不存在此类问题?
russellpierce

我不得不承认,我仍然没有弄清楚MCMC的工作原理,这是我选择进行引导的原因之一。正如您所暗示的那样,虽然应该使用随机斜率进行引导,但可能是pvals.fnc不允许您对具有随机斜率的模型进行配置项,因为出于某种原因这是无效的,而且可能是这种无效性扩展到了引导此类模型。我不直观地认为引导程序不会有任何问题,但这可能是我有限的专业知识所致。
Mike Lawrence 2010年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.