统计和大数据 anova

3

经过K均值分析后，方差分析表后面的通知表明，不应将显着性水平视为相等均值的检验，因为已基于欧几里得距离得出了最大距离的聚类解。我应该使用哪种测试来显示聚类变量的均值在聚类之间是否不同？我已经在k均值输出提供的ANOVA表中看到了此警告，但是在某些参考资料中，我看到正在运行事后ANOVA测试。我是否应该忽略k均值ANOVA输出，并使用事后测试运行单向ANOVA并以传统方式解释它们？还是我只能暗示F值的大小，哪些变量对差异的贡献更大？另一个困惑是，聚类变量不是违反ANOVA的假设而呈正态分布，那么我可以使用Kruskal-Wallis非参数检验，但是它具有关于相同分布的假设。特定变量的集群间分布似乎并不相同，有些正偏，有些则负...我有1275个大样本，5个聚类，10个以PCA分数衡量的聚类变量。

14 anova k-means

1

如何针对重复测量设计计算方差分析：R中的aov（）vs lm（）

标题说明了一切，我很困惑。下面的代码在R中运行重复的aov（），并运行我认为是等效的lm（）的调用，但是它们返回不同的误差残差（尽管平方和相同）。显然，来自aov（）的残差和拟合值是模型中使用的残差和拟合值，因为它们的平方和加到summary（my.aov）中报告的每个模型/残差平方和。那么，应用于重复测量设计的实际线性模型是什么？ set.seed(1) # make data frame, # 5 participants, with 2 experimental factors, each with 2 levels # factor1 is A, B # factor2 is 1, 2 DF <- data.frame(participant=factor(1:5), A.1=rnorm(5, 50, 20), A.2=rnorm(5, 100, 20), B.1=rnorm(5, 20, 20), B.2=rnorm(5, 50, 20)) # get our experimental conditions conditions <- …

14 r anova repeated-measures linear-model

1

如何确定重复测量方差分析所需的样本量？

我需要有关重复测量方差分析的一些帮助。我们正在调查某些病房中某些干预措施对降低血流感染（BSI）率的影响。我们计划每月获取一次BSI费率信息，首先是在没有干预的情况下12个月，然后在有干预的情况下12个月。我们正在考虑进行时间序列或重复测量方差分析，在我对第一个方法没有太多想法之前，我希望使用后一个方法（额外的问题：时间点太少了吧？），但是接下来另一个问题是，我们需要多少病房才能证明干预对BSI率确实有统计学上的显着影响？我想我要进行两个ANOVA，一个用于“干预之前”，一个用于“干预期间”，并且我认为“ ANOVA”在“干预之前”不应进行显着的F比率检验。我二维地考虑“样本量”一词，无论是病房数还是重复测量数。

14 anova repeated-measures sample-size power

1

复合对称情况下（0 + factor | group）和（1 | group）+（1 | group：factor）随机效应规格的等价关系

道格拉斯·贝茨（Douglas Bates）指出，以下模型是等效的：“如果向量值随机效应的方差-协方差矩阵具有一种特殊形式，称为复合对称”（本演示文稿中的幻灯片91）： m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) 具体而言，贝茨使用以下示例： library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines) 具有相应的输出： print(m1a, …

13 r anova mixed-model repeated-measures lme4-nlme

1

方差分析是否依靠矩量法而不是最大似然法？

我在不同地方看到提到ANOVA使用矩量法进行估算。我对这个说法感到困惑，因为即使我不熟悉矩量法，但我的理解是，它不同于最大似然法，并且不等同于最大似然法。另一方面，方差分析可以看作是具有类别预测变量的线性回归，回归参数的OLS估计是最大可能性。所以：什么使方差分析程序符合力矩方法？鉴于ANOVA等同于带有分类预测变量的OLS，这不是最大可能性吗？如果这两种方法在常规ANOVA的特殊情况下以某种方式等效，那么当差异变得重要时，是否存在某些特定的ANOVA情况？不平衡的设计？重复措施？混合（学科间+学科内）设计？

13 anova mixed-model maximum-likelihood method-of-moments

1

在相同数据上，ANOVA检验的值与多个检验的值相比可以小多少？

简介：注意到今天这个问题引起了人们的注意： “ 当成对t检验都不存在时，方差分析会很重要吗？ ”，我认为我可能能够以一种有趣的方式对其进行重新构架，以得到自己的答案。。当将统计显着性理解为简单的二分法，并仅根据ppp或\ alpha的较高值来判断时，可能会出现各种不一致的结果（以面值计）αα\alpha。@Glen_b 对上述问题的回答提供了以下情况的有用示例： ANOVA FFF检验为具有四个水平的一个自变量（IV）产生pF<.05pF<.05p_F<.05，但是 pt>.08pt>.08p_t>.08对于所有两个样本ttt检验，p_t> .08，用于比较与IV的每对四个水平对应的观测值之间相同因变量（DV）的差异。尽管通过这个问题进行了事后成对比较的Bonferroni校正，但发生了类似的情况：Anova重复测量很重要，但是使用Bonferroni校正的所有多重比较都不是吗？前面提到的情况在多元回归中的检验也略有不同：为什么有可能获得显着的F统计量（p <.001）但无显着的回归t检验？：pF<.001,pβt>.09pF<.001,pβt>.09p_F<.001,p_{\beta t}>.09 回归如何显着但所有预测变量都不显着？在@whuber的答案中，pF=.0003,pβt>.09pF=.0003,pβt>.09p_F=.0003,p_{\beta t}>.09 我打赌，在这样的情况下，一些（但不是全部）成对比较（或回归系数显着性检验）值必须相当接近如果相应综合测试可以实现。我看到@Glen_b的第一个示例就是这种情况，其中，，最大的成对差给出最小的。一般情况下必须这样吗？更具体地说：α p < α pppαα\alphap<αp<αp <\alphap ˚F = 0.046 p 吨 = 0.054F(3,20)=3.19F(3,20)=3.19F_{(3,20)}=3.19pF=.046pF=.046p_F=.046pt=.054pt=.054p_t=.054 问题：如果ANOVA检验对连续DV的一个多静脉IV的影响产生，那么在比较每对IV水平的所有两个样本检验中，最低的值有多高？最小成对意义是否可以高达？p F = .05 p t p t = .50FFFpF=.05pF=.05p_F=.05ppptttpt=.50pt=.50p_t=.50 我欢迎仅解决此特定问题的答案。但是，为了进一步激发这个问题，我将详细阐述并提出一些潜在的反问。欢迎您也解决这些问题，甚至在您愿意时也可以忽略特定的问题，尤其是在特定问题得到明确答案的情况下。重要性：考虑一下，如果用连续的无效假设证据的强度来判断统计显着性，那么和之间的差异的重要性降低了多少（我认为是罗恩·费舍尔的方法？），而不是用高于或低于阈值的二分法来表示在选择是否拒绝零批发时可接受的错误概率。“ hacking ”是一个已知的问题，部分原因是由于对的解释而引入了不必要的漏洞，因此臭名昭著p t = .06pF=.04pF=.04p_F=.04pt=.06pt=.06p_t=.06p p …

13 hypothesis-testing anova statistical-significance t-test multiple-comparisons

3

为什么在方差分析（ANOVA）中使用单尾检验F检验？

您能给出在方差分析中使用单尾检验的原因吗？为什么在方差分析中使用单尾检验-F检验？

13 anova f-test sums-of-squares f-distribution

3

F统计量，F临界值和P值

我对这个领域还很陌生，很难理解基于ANOVA表的结果拒绝零假设的概念。计算出的F和临界值与p值有何关系？并且，如果计算出的F大于1，即使p值小于alpha值，这是否始终表明应该拒绝原假设？很抱歉，如果这些问题表明我无知，但是我今年57岁，缺勤35年后重返校园！谢谢你的帮助。

13 anova

2

如何在显示成对分组的表格中获得Tukey HSD事后测试的结果？

我希望在使用R进行双向Anova后执行TukeyHSD事后测试，以获得包含按显着性差异分组的排序对的表格。（很抱歉，我仍然不熟悉统计数据。）我想要这样的东西：因此，按星号或字母分组。任何想法？我HSD.test()从agricolae程序包中测试了该功能，但似乎无法处理双向表。

13 r anova multiple-comparisons post-hoc tukey-hsd

2

系统发生因变量：方差分析？

我了解从系统发育数据中导出协方差矩阵，以使要进行回归的两个变量的。但是，如果您有一个连续变量（先前已证明依赖于系统发育）和一个序数变量，会发生什么？后者是序数，我不确定如何将其与系统发育依赖性导致测试统计数据偏倚的方式联系起来。Ç ø v （X，Y）= 0cov(X,Y)=0cov(X,Y) = 0 在连续变量上计算费尔森斯坦的系统发生独立对比度并将其用于方差分析是否有意义？ PIC值为：C我Ĵ= （X一世- XĴ）d我Ĵ--√Cij=(Xi−Xj)dijC_{ij} = \frac{(X_i - X_j)}{\sqrt{d_{ij}}} 其中是物种是物种，并且是系统树上物种和之间的成对距离。 X i ，X j X j d i j i jX一世XiX_iXXX我，XĴi,Xji, X_jXXXjjjdijdijd_{ij}iiijjj

13 anova phylogeny

3

如何证明阶乘方差分析中的误差项合理？

关于多元ANOVA的一个可能非常基本的问题。假设采用双向设计，我们同时测试主要效果A，B和交互作用A：B。在测试类型为I SS的A的主要效果时，效果SS的计算方式为差异，其中是仅具有截距的模型的残差平方误差和，和的RSS与因子A的模式添加。我的问题涉及错误术语的选择：- [R 小号小号（1 ）- [R 小号小号（甲）[R 小号小号（1 ）- [R 小号小号（一）RSS(1)−RSS(A)RSS(1) - RSS(A)[R 小号小号（1 ）RSS(1)RSS(1)[R 小号小号（一）RSS(A)RSS(A) 您如何证明此测试的误差项通常是从包含主效应和相互作用的完整模型A + B + A：B的RSS计算而来的？ F一种= （R S小号1个− R S小号一种）/（dF[R 小号小号1个- dF[R 小号小号一种）[R 小号小号A + B + A ：B/天F[R 小号小号A + B + A ：BFA=(RSS1−RSSA)/(dfRSS1−dfRSSA)RSSA+B+A:B/dfRSSA+B+A:B F_{A} = \frac{(RSS_{1} - RSS_{A}) / (df_{RSS 1} - …

13 anova linear-model

4

在百分比上使用ANOVA？

我有一个包含四个组（4个BMI组）的表作为自变量（因子）。我有一个因变量，即“孕期母亲吸烟的百分比”。为此可以使用ANOVA还是必须使用卡方检验或其他测试？

13 anova

4

ANCOVA中的事后测试

问题：在对协变量的影响进行调整之后，有什么好的方法可以进行事后检验组均值之间的差异？典型示例：四组，每组30名参与者（例如，四个不同的临床心理学人群）因变量是数字（例如，智力得分）协变量是数字（例如，社会经济地位指数）研究问题涉及在控制协变量之后，任何一对组在因变量上是否存在显着差异相关问题：首选方法是什么？ R中有哪些可用的实现？关于协变量如何更改事后检验程序，是否有任何一般性参考？

13 anova multiple-comparisons ancova

3

单向方差分析不等方差的替代方法

我想比较三个均等大小的组的均值（均等样本数很小，为21）。每个组的装置是正态分布的，但它们的方差不相等（通过列文的测试）。在这种情况下，转型是否是最佳途径？我应该先考虑别的吗？

13 anova variance heteroscedasticity

1

GAM适合性摘要

如果我们适合GAM，例如： gam.fit = gam::gam(Outstate ~ Private + s(Room.Board, df = 2) + s(PhD, df = 2) + s(perc.alumni, df = 2) + s(Expend, df = 5) + s(Grad.Rate, df = 2), data = College) 在哪里，我们使用数据集College，该数据集可以在package中找到ISLR。现在，如果找到适合的摘要，则可以看到： > summary(gam.fit) Call: gam(formula = Outstate ~ Private + s(Room.Board, df = 2) + …

12 anova gam

Questions tagged «anova»