Questions tagged «kruskal-wallis»

Kruskal-Wallis过程是一种单参数方差分析的非参数等效方法,用于比较三个或更多组的位置。它扩展了Mann-Whitney-Wilcoxon程序的两个示例。

5
如何在机器学习中处理分层/嵌套数据
我将用一个例子来解释我的问题。假设您要根据以下属性预测个人的收入:{年龄,性别,国家/地区,城市}。你有一个像这样的训练数据集 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 



1
Kruskal-Wallis之后的事后测试:Dunn的测试或Bonferroni更正了Mann-Whitney的测试?
我有一些非高斯分布变量,我需要检查5个不同组中该变量的值之间是否存在显着差异。 我已经对Kruskal-Wallis进行了单向方差分析(其显着性上升),然后我必须检查哪些组存在显着差异。由于各组是排序的(第一个组中的变量值应低于第二组中的变量值,第二组中的变量值应低于第三组中的变量,依此类推on)我只执行了4个测试: Group 1 vs Group 2 Group 2 vs Group 3 Group 3 vs Group 4 Group 4 vs Group 5 我用两种不同的方法进行了分析。我从使用Dunn的多重比较测试开始,但是没有发现任何重大问题。另一方面,如果我使用Mann-Whitney检验并使用Bonferroni校正了检验的数量(4),那么有3项检验很有意义。 这是什么意思?我应该相信哪些结果?


1
如何读取邓恩测试的结果?
我如何阅读邓恩 测试的结果?具体来说,下表中的值告诉我什么? 我有4组的非参数数据,我首先进行了Kruskal-Wallis检验,以确认各组的分布彼此之间以及汇总数据集之间是不同的。然后,我使用Dunn的检验来查看哪些组彼此不同,哪些没有。 library(dunn.test) dunn.test(data, g=area, kw=TRUE) Kruskal-Wallis rank sum test data: x and area Kruskal-Wallis chi-squared = 1730.4401, df = 3, p-value = 0 Comparison of x by area (No adjustment) Row Mean-| Col Mean | A B C ---------+--------------------------------- B | 20.62310 | 0.0000 | C | 26.66519 …

2
我应该报告不重要的结果吗?
我已经进行了Kruskal Wallis测试,对于某些问题,p值并不重要。我是否会以有意义的方式报告此问题,并说明df,检验统计量和p值?因此,将进行这样的Kruskal Wallis检验,但发现结果并不显着H(3)= 2.119,p> 0.05(或者我在此处声明确切的p值(.548))


1
Kruskal-Wallis内置的R函数与手动计算之间略有不一致
我对以下内容感到困惑,并且无法在其他地方找到答案。 我试图在做一些统计的同时学习R,并且作为练习,我尝试通过像在R中一样“手动”执行这些内置R函数的结果来仔细检查。 ,对于Kruskal-Wallis考试,我一直得到不同的结果,但我不知道为什么。 例如,我正在查看练习中分发的以下数据 activity <- c(2, 4, 3, 2, 3, 3, 4, 0, 4, 3, 4, 0, 0, 1, 3, 1, 2, 0, 3, 1, 0, 3, 4, 0, 1, 2, 2, 2, 3, 2) group <- c(rep("A", 11), rep("B", 10), rep("C", 9)) group <- factor(group) data.raw <- data.frame(activity, …

4
可以将Mann-Whitney检验用于Kruskal-Wallis之后的事后比较吗?
我进行了模拟,将动物放置在敌对环境中,并定时观察使用某种生存方法可以生存多长时间。它可以使用三种方法来生存。我使用每种生存方法对动物进行了300次模拟。所有模拟都在相同的环境中进行,但存在一定的随机性,因此每次都不同。我计算每次模拟中动物存活多少秒。活得更长些更好。我的数据如下所示: Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these 我不确定在此之后所做的一切,所以请让我知道我是否在做愚蠢和错误的事情。我试图找出使用特定方法在寿命上是否存在统计差异。 我对每个样本都进行了Shapiro测试,结果以很小的p值返回,因此我认为数据没有被标准化。 行上的数据彼此之间没有关系。每个模拟使用的随机种子是不同的。结果,我认为数据没有配对。 由于数据未标准化,不成对并且存在两个以上的样本,因此我进行了Kruskal Wallis检验,得出p值为0.048。然后,我继续工作,选择了曼·惠特尼。真的不确定是否应该在这里使用Mann Whitney。 我通过执行曼恩·惠特尼(Mann Whitney)测试将每种生存方法与其他方法进行了比较,即{(方法1,方法2),(方法1,方法3),(方法2,方法3)}。使用双尾检验在两对之间(方法2,方法3)之间没有统计学意义的发现,但是使用单尾检验存在显着性差异。 问题: 我不知道像这样使用Mann Whitney是否有意义。 我不知道我应该用一两个尾巴的曼·惠特尼(Mann Whitney)。

2
Benjamini-Hochberg依赖性假设是否成立?
我有一个数据集,用于测试三个总体之间在大约50个不同变量方面的显着差异。一方面,我使用Kruskal-Wallis检验,另一方面,通过嵌套GLM模型拟合的似然比检验(具有和不具有总体作为自变量)进行此操作。 结果,一方面,我列出了Kruskal-Wallis,另一方面,我认为是LRT比较中的卡方p值。pppppp 我需要做某种形式的多重测试校正,因为有50多种不同的测试,Benjamini-Hochberg FDR似乎是最明智的选择。 但是,变量可能不是独立的,它们中的几个“氏族”是相关的。然后的问题是:我如何确定我的p值的基础统计信息集是否ppp满足Benjamini-Hochberg过程仍然要绑定到FDR所需的正相关性要求? 2001年的Benjamini-Hochberg-Yekutieli论文指出,PRDS条件适用于多元正态分布和学生分布。对于模型比较,我的似然比检验卡方值怎么样?对于Kruskal-Wallis检验,我的ppp如何? 我可以使用Benjamini-Hochberg-Yekutieli最坏情况的FDR校正,该校正在假设依赖项时不做任何假设,但我认为在这种情况下,它可能过于保守,并且会丢失一些相关信号。

2
测试组之间(某些)分位数Q的差异?
对于某些分为三个组(X)的Y变量,我希望对各组进行比较,并假设所有三个组之间90%的分位数相同。我可以使用哪些测试? 我能想到的一种选择是使用分位数回归,还有其他选择/方法吗? 我想如果我想比较中位数,就可以使用kruskal wallis检验(尽管它是基于等级的,但是如果我没记错的话,当残差分布是对称的时,它也会给出相同的结果) 谢谢。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.