Questions tagged «wilcoxon-mann-whitney»

Wilcoxon秩和检验(也称为Mann-Whitney U检验)是一种非参数秩检验,用于评估两个样本中的一个样本是否具有比另一个样本更大的值。

1
R中的Wilcoxon秩和检验
我将同一测试的结果应用于两个独立样本: x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17) y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14) 我想计算一个Wilcoxon秩和检验。 当我手动计算统计量,我得到: T W = ∑ rank (X i)= 156.5TWTWT_{W}TW=∑rank(Xi)=156.5TW=∑rank(Xi)=156.5 T_{W}=\sum\text{rank}(X_{i}) = 156.5 当我让R执行a时wilcox.test(x, y, correct = F),我得到: W = 101.5 这是为什么?统计不应仅在我执行带符号秩检验时返回吗?还是我误解了等级总和测试?W+W+W^{+}paired = …

1
R中的wilcox.test和coin :: wilcox_test有什么区别?
R中存在这两个函数,但我不知道它们之间的区别。似乎当wilcox.test使用时correct=FALSE,和wilcox_test(在硬币包装中)使用时,它们仅返回相同的p值distribution="aymptotic"。对于其他值,它们返回不同的p值。而且wilcox.test始终为我的数据集返回W = 0,而与参数的设置无关: x = c(1, 1, 1, 3, 3, 3, 3) 和 y = c(4, 4, 6, 7, 7, 8, 10) 另外,当我尝试使用除R以外的其他工具(一些可在线使用,其他作为Excel附加组件)时,有时它们报告的p值不同。 那么我怎么知道哪个工具给出了“正确的” p值呢? 是否存在“正确的” p值,或者如果一些工具给出的p值<0.05,我应该感到高兴吗?(有时这些工具没有提供像R这样的众多参数化可能性。) 我在这里想念什么?


3
为什么对于正态分布数据,Wilcoxon检验的渐进相对效率与Student的t检验相比?
众所周知,如果数据来自正态分布总体,则Wilcoxon符号秩检验的渐近相对效率(ARE)与Student t检验相比为。基本的一样本测试和两个独立样本的变体(Wilcoxon-Mann-Whitney U)都是如此。对于正常数据,与ANOVA F检验相比,它也是Kruskal-Wallis检验的ARE 。3π≈0.9553π≈0.955\frac{3}{\pi} \approx 0.955 这个显着的结果(对我来说,是ππ\pi的“ 最意外的外观之一 ”)和非常简单的结果是否有深刻的,显着的或简单的证明?

2
曼惠特尼U检验:效应大小的置信区间
根据弗里茨,莫里斯和Richler(2011;见下文),可被计算为使用下式的曼-惠特尼U检验的效果大小 - [R = ž[Rrr 这是方便我,我报告[R在其他场合也。除了效果量度,我还要报告r的置信区间。[R = žñ--√r=zN r = \frac{z}{\sqrt N} [Rrr[Rrr 这是我的问题: 我可以像皮尔逊的r一样计算r的置信区间,尽管它被用作非参数检验的效应量度? 一尾测试与二尾测试必须报告什么置信区间? 编辑有关第二个问题的内容:“单尾测试与两尾测试必须报告什么置信区间?” 我发现了一些其他信息,恕我直言可能会回答这个问题。“虽然两边的置信限形成一个置信区间,但它们的单边对应物被称为上下置信界限。” (http://en.wikipedia.org/wiki/Confidence_interval)。从这些信息中,我得出结论,重要性检验(例如检验)是一尾还是二尾不是主要问题,而是关于效应大小的CI感兴趣的信息是什么。我的结论(如果您不同意,请纠正我):Ťtt 两侧CI 对上限和下限感兴趣(因此,尽管单尾显着性检验为p <.05,尤其是在值接近的情况下,两侧CI可能为0。 05.)→→\rightarrow 一侧的“ CI” 仅对上限或下限感兴趣(由于理论推理);然而,在检验了有针对性的假设之后,这并不一定是主要关注的问题。如果将焦点放在效果大小的可能范围上,则双面CI则非常合适。对?→→\rightarrow 弗里兹,莫里斯和里奇勒(Fritz,Morris,&Richler(2011))的文字段落见下文,内容涉及我在上文中提到的曼·惠特尼检验的效应大小估计。 “我们在此描述的大多数效应量估计值都假设数据具有正态分布。但是,某些数据不满足参数检验的要求,例如,按序数而不是区间标度的数据。对于此类数据,研究人员通常使用非参数统计检验,例如曼恩·惠特尼检验和Wilcoxon检验,这些检验的重要性通常通过在样本量不太小的情况下将检验统计量的分布近似于分布来评估,而统计学包,如SPSS,运行这些测试报告适当ž除了为值值û或Ť ; žžzzžzzüUUŤTTžzz也可以手工计算(例如,Siegel&Castellan,1988)。所述值可以用于计算作用大小,如ř由科恩(1988)提出; Cohen的r准则是:大影响为0.5,中影响为0.3,小影响为0.1(Coolican,2009,第395页)。这是很容易计算- [R ,- [R 2,或η 2从这些Ž值,因为 - [R = žžzz[Rrr[Rrr[R2r2r^2η2η2\eta^2žzz 和 r2r=zN−−√r=zN r = \frac{z}{\sqrt N} 尽管公式中存在N,但这些效应大小的估计仍独立于样本大小。这是因为z对样本大小敏感。除以N的函数会从结果效应量估计中消除样本量的影响。”(第12页)r2orη2=z2Nr2orη2=z2N r^2\quad{\rm or}\quad \eta^2 …

1
显示有序数据-均值,中位数和均值等级
我有一些顺序数据不是正态分布的,所以我决定使用Mann-Whitney U检验进行非参数检验。我正在寻找七个分数的组间差异-每个主题的分数分别为0、1、2或3。我很难弄清楚如何显示我的数据! 如果我使用中位数(和中位数的IQR)显示数据,那么根本就不清楚差异在哪里,因为在大多数情况下,中位数落在0或1上。因此,尽管Mann-Whitney U检验显示出显着差异,桌子看起来没意思。 我也可以使用手段呈现数据。那里有一些科学论文说,您可以使用具有序数数据的均值,但是不能对分数之间的差异做出相同类型的假设(例如0和1之间的差异与1和1之间的差异不相同) 2)。尽管表中的数字很好地说明了我使用它们时的故事,但使用方法会引起一些争议。 第三种选择是使用SPSS在曼恩·惠特尼(Mann-Whitney)输出中给我的平均排名。平均等级是各组之间正在比较的,所以也许我应该使用那些?我唯一遇到的问题是,平均排名对实际数据没有任何意义(例如,使用平均等级,我看不到对象更接近3,而控件更接近1。) 最后的选择是在将得分分为两组(低分为0和1,高分为2和3)后,比较受试者和对照者进行卡方分析。但是,当我这样做时,差异并不明显(可能是由于多种原因)。

1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
您如何报告曼惠特尼检验?
我正在做我的论文,并且正在进行一些测试。使用Kruskal–Wallis检验后,我通常会报告如下结果: 有一个显著差异的平均值之间...(χ2(2)=7.448,p=.024)(χ(2)2=7.448,p=.024)(\chi^2_{(2)}=7.448, p=.024) 但是现在我进行了一次Mann-Whitney测验,我不确定要显示哪些值。SPSS为我提供了Mann–Whitney ,Wilcoxon W,Z和P值。我是否要提供所有这四个值?还是无关紧要的?UUUWWWZZZPPP

1
如何在ARIMA模型的观察值48中加入创新的离群值?
我正在处理数据集。使用一些模型识别技术后,我得出了一个ARIMA(0,2,1)模型。 我使用R detectIO包TSA中的函数在对原始数据集进行第48次观察时检测到创新的离群值(IO)。 如何将这个离群值合并到模型中,以便将其用于预测?我不想使用ARIMAX模型,因为我可能无法根据R中的模型做出任何预测。还有其他方法可以做到吗? 以下是我的价值观: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

2
R中的Wilcoxon-Mann-Whitney临界值
我注意到,当我尝试使用R查找Mann-Whitney U的临界值时,该值始终为1+临界值。例如,对于α = .05 ,n = 10 ,m = 5α=.05,n=10,m=5\alpha=.05, n = 10, m = 5,(两尾)临界值是8;而对于α = .05 ,n = 12 ,m = 8α=.05,n=12,m=8\alpha=.05, n=12, m=8,(两尾)临界值值是22(请检查表格),但是: > qwilcox(.05/2,10,5) [1] 9 > qwilcox(.05/2,12,8) [1] 23 我当然不在考虑什么,但是...谁能解释我为什么?

1
曼·惠特尼检验中的原假设是什么?
令为分布1的随机值,令为分布2的随机值。我认为曼恩·惠特尼检验的原假设为。X1X1X_1X2X2X_2P(X1&lt;X2)=P(X2&lt;X1)P(X1&lt;X2)=P(X2&lt;X1)P(X_1 < X_2) = P(X_2 < X_1) 如果我对均值均等且方差相等的正态分布的数据进行的Mann-Whitney检验模拟,则得出的I类错误率非常接近0.05。但是,如果我使方差不相等(但均值相等),则拒绝原假设的模拟比例将大于0.05,这是我没有想到的,因为仍然成立。这发生在我使用的R,不管我是否拥有,或。α=0.05α=0.05\alpha=0.05P(X1&lt;X2)=P(X2&lt;X1)P(X1&lt;X2)=P(X2&lt;X1)P(X_1 < X_2) = P(X_2 < X_1)wilcox.testexact=TRUEexact=FALSE, correct=TRUEexact=FALSE, correct=FALSE 零假设与我上面写的有所不同吗?或者,如果方差不相等,那么就类型I错误而言,检验是否不准确?

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
哪种深度学习模型可以对不互斥的类别进行分类
示例:我的职位描述中有一句话:“英国Java高级工程师”。 我想使用深度学习模型将其预测为2类:English 和IT jobs。如果我使用传统的分类模型,则只能预测softmax最后一层具有功能的标签。因此,我可以使用2个模型神经网络来预测两个类别的“是” /“否”,但是如果我们有更多类别,那就太贵了。那么,我们是否有任何深度学习或机器学习模型可以同时预测2个或更多类别? “编辑”:使用传统方法使用3个标签,它将由[1,0,0]编码,但在我的情况下,它将由[1,1,0]或[1,1,1]编码 示例:如果我们有3个标签,并且所有这些标签都适合一个句子。因此,如果softmax函数的输出为[0.45,0.35,0.2],我们应该将其分类为3个标签或2个标签,或者可以是一个?我们这样做的主要问题是:分类为1个,2个或3个标签的最佳阈值是多少?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
可以将Mann-Whitney检验用于Kruskal-Wallis之后的事后比较吗?
我进行了模拟,将动物放置在敌对环境中,并定时观察使用某种生存方法可以生存多长时间。它可以使用三种方法来生存。我使用每种生存方法对动物进行了300次模拟。所有模拟都在相同的环境中进行,但存在一定的随机性,因此每次都不同。我计算每次模拟中动物存活多少秒。活得更长些更好。我的数据如下所示: Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these 我不确定在此之后所做的一切,所以请让我知道我是否在做愚蠢和错误的事情。我试图找出使用特定方法在寿命上是否存在统计差异。 我对每个样本都进行了Shapiro测试,结果以很小的p值返回,因此我认为数据没有被标准化。 行上的数据彼此之间没有关系。每个模拟使用的随机种子是不同的。结果,我认为数据没有配对。 由于数据未标准化,不成对并且存在两个以上的样本,因此我进行了Kruskal Wallis检验,得出p值为0.048。然后,我继续工作,选择了曼·惠特尼。真的不确定是否应该在这里使用Mann Whitney。 我通过执行曼恩·惠特尼(Mann Whitney)测试将每种生存方法与其他方法进行了比较,即{(方法1,方法2),(方法1,方法3),(方法2,方法3)}。使用双尾检验在两对之间(方法2,方法3)之间没有统计学意义的发现,但是使用单尾检验存在显着性差异。 问题: 我不知道像这样使用Mann Whitney是否有意义。 我不知道我应该用一两个尾巴的曼·惠特尼(Mann Whitney)。

2
不等方差条件下的Mann-Whitney零假设
我只是对Mann-Whitney U检验的零假设感到好奇。我经常看到它指出零假设是两个总体具有相等的分布。但是我在想-如果我有两个均值相同但方差极不相等的正常群体,则Mann-Whitney检验可能不会检测到这种差异。 我还看到它表明曼·惠特尼检验的原假设是或一个总体(X)的观察结果超过第二总体(Y)的观察结果的概率(在排除并列)等于0.5。这似乎更有意义,但似乎不等同于我陈述的第一个零假设。Pr(X&gt;Y)=0.5Pr(X&gt;Y)=0.5\Pr(X>Y)=0.5XXXYYY 我希望能对此有所帮助。谢谢!
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.