Questions tagged «wilcoxon-signed-rank»

Wilcoxon符号秩检验是一种非参数秩检验,用于比较两个配对的样本,无论一个样本中的值是否大于另一个样本。也可以用于将一个样本与固定值进行比较。[不要将测试与“ sign-test”混淆。

5
如何在机器学习中处理分层/嵌套数据
我将用一个例子来解释我的问题。假设您要根据以下属性预测个人的收入:{年龄,性别,国家/地区,城市}。你有一个像这样的训练数据集 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

2
Wilcoxon秩和检验与Wilcoxon符号秩检验之间的差异
我想知道使用配对观测值的Wilcoxon秩和检验与Wilcoxon符号秩检验之间的理论差异是什么。我知道Wilcoxon秩和检验允许在两个不同样本中进行不同数量的观察,而配对样本的Signed-Rank检验则不允许这样做,但是在我看来,它们似乎都对相同的事物进行了检验。有人可以使用Wilcoxon秩和检验,什么时候可以使用成对观测值进行Wilcoxon符号秩检验,有人可以给我更多背景知识或理论信息吗?

1
非参数检验是否从同一分布中抽取两个样本
我想检验一个假设,即从同一总体中抽取两个样本,而无需对样本或总体的分布进行任何假设。我应该怎么做? 在Wikipedia上,我的印象是Mann Whitney U考试应该是合适的,但实际上似乎对我没有用。 为了具体起见,我创建了一个数据集,其中包含两个样本(a,b),它们大(n = 10000),并从两个非正态(双峰),相似(均值),但不同(标准差)的总体中得出我正在寻找一种测试,可以识别出这些样本不是来自同一群体。 直方图视图: R代码: a <- tibble(group = "a", n = c(rnorm(1e4, mean=50, sd=10), rnorm(1e4, mean=100, sd=10))) b <- tibble(group = "b", n = c(rnorm(1e4, mean=50, sd=3), rnorm(1e4, mean=100, sd=3))) ggplot(rbind(a,b), aes(x=n, fill=group)) + geom_histogram(position='dodge', bins=100) 令人惊讶的是,这是曼·惠特尼(Mann Whitney)检验(?)无法拒绝样本来自同一总体的原假设: > wilcox.test(n ~ group, rbind(a,b)) Wilcoxon rank …

2
效应大小要对Wilcoxon进行秩检验吗?
一些作者(例如Pallant,2007年,第225页;请参见下图)建议通过将测试统计量除以观察次数的平方根来计算Wilcoxon符号秩检验的效应大小: r = ZñX+ nÿ√[R=žñX+ñÿr = \frac{Z}{\sqrt{n_x + n_y}} Z是SPSS(请参见下图)以及wilcoxsign_testR中的测试统计信息输出。(另请参阅我相关的问题:wilcoxsign_test中的teststatistic vs linearstatistic) 其他人建议使用Bravais-Pearson()或Spearman()相关系数(取决于数据类型)。r = c o v (Xÿ)小号d(X)× 小号d(是)[R=CØv(Xÿ)sd(X)×sd(ÿ)r = \frac{cov(XY)}{sd(X) \times sd(Y)}[R小号[R小号r_S 当您计算它们时,两个rs甚至远不是相同的。例如,对于我当前的数据: r = 0.23(对于)r = ZñX+ nÿ√[R=žñX+ñÿr = \frac{Z}{\sqrt{n_x + n_y}} r = 0.43(皮尔逊) 这些将暗示效果大小完全不同。 那么,要使用的正确的效果大小是什么,这两个大小如何r相互关联? Pallant,J.(2007)的第224页(底部)和225页。SPSS生存手册:

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
如何确定在线扑克网站是否公平?
上周,我与我的一个好朋友进行了有趣的讨论。他一直在玩一些在线扑克游戏,并建议新的订阅/其他转账与您所获得的卡之间存在某种关系,即,您获得了不错的卡而上瘾。如果这是真的,那么网站可能会冒很大的风险,但是问题仍然让我着迷。 我的第一种方法是让我的朋友定义“好卡片”并进行简单的二项式检验。我的朋友很难定义什么是好卡片。如果他真的得到了不好的牌,他就知道弃牌,而如果他得到了好牌,他就知道全押-劣牌是介于两者之间的牌。 我的另一种方法是计算每只给定手牌的确切概率,然后查看它是否与预期不同,也许使用Wilcoxon符号秩检验,因为这应该检测到不同的分布形状以及真实的移动。我想最难的部分是计算确切的概率。 数据将包含最初的0-100张发牌,而一周后为300-400张发牌(或在网站上待了一段时间的朋友)。 问题:您如何建议解决此问题? 德州扑克的运作方式 我不是专家,玩家(我只玩德州扑克的3-4倍),但它是相当简单的,你可以找到的维基百科页面的更多细节在这里。 与常规扑克的主要区别是开始时只能获得2张牌。您无需切换这些卡。桌上还有另外5张牌面朝下。通过将您的两个与表5相结合,您可以选择5张最好的纸牌游戏手。 例如,如果您获得2个A,您将有一个良好的开端,并且可能会获得强大的成绩;同样,如果您拥有7和2,您的获胜机会非常渺茫,并且您很快弃牌。困难的部分可能是女王/王后和9,尽管您的牌面高于“平均数”,但您最终可能一无所有。您可以在此处找到扑克手名单。

2
重复测量随时间的小
我获得了用于分析研究的数据,以研究在四个不同时间点(治疗前,治疗结束的当天,治疗后4周和治疗后2-4个月)铁水平的影响。没有对照组。他们正在寻找在三个治疗后时间点的铁水平是否显着增加到治疗前(基线)水平的铁水平。11名患者具有基线水平,但只有8名患者具有所有4个时间点的完整数据(每个时间点 = 11、10、9和8)。不仅测量了铁水平,而且还在每个时间点采取了其他两个实验室测量值以与基线进行比较。ññn 关于如何分析,我有几个问题。我最初认为RM方差分析适用于分析此数据,但我担心样本量小,数据丢失以及数据的非正态分布。然后,我考虑使用Wilcoxon符号秩检验将每个后处理量度与基线进行比较,但随后遇到了多个比较的问题。但是,我读了一些文献,淡化了需要进行多次比较的情况。因此,总的来说,我正在处理小样本量,不完整的数据和多次比较(以及是否必要)。 我希望这一切都是有道理的。我是CrossValidated的新手,它是由同事在这里指导的,可以作为向经验丰富的统计学家学习的地方,因此,我感谢任何建议!谢谢! 编辑以添加来自注释的原始数据: 总共有四个时间点,结果变量是连续的。例如,每个时间点的结果类似于以下内容: Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111] 2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156] 3rd Post …

1
插入符glmnet与cv.glmnet
在glmnet内部caret使用搜索最佳lambda和cv.glmnet执行相同任务的比较中似乎有很多困惑。 提出了许多问题,例如: 分类模型train.glmnet与cv.glmnet? 在插入符号中使用glmnet的正确方法是什么? 使用`caret`交叉验证`glmnet` 但是没有给出答案,这可能是由于问题的可重复性。在第一个问题之后,我给出了一个非常相似的示例,但确实存在相同的问题:为什么估计的lambda如此不同? library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = 0.001),standardize=FALSE) …

1
R中的Wilcoxon秩和检验
我将同一测试的结果应用于两个独立样本: x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17) y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14) 我想计算一个Wilcoxon秩和检验。 当我手动计算统计量,我得到: T W = ∑ rank (X i)= 156.5TWTWT_{W}TW=∑rank(Xi)=156.5TW=∑rank(Xi)=156.5 T_{W}=\sum\text{rank}(X_{i}) = 156.5 当我让R执行a时wilcox.test(x, y, correct = F),我得到: W = 101.5 这是为什么?统计不应仅在我执行带符号秩检验时返回吗?还是我误解了等级总和测试?W+W+W^{+}paired = …

3
为什么对于正态分布数据,Wilcoxon检验的渐进相对效率与Student的t检验相比?
众所周知,如果数据来自正态分布总体,则Wilcoxon符号秩检验的渐近相对效率(ARE)与Student t检验相比为。基本的一样本测试和两个独立样本的变体(Wilcoxon-Mann-Whitney U)都是如此。对于正常数据,与ANOVA F检验相比,它也是Kruskal-Wallis检验的ARE 。3π≈0.9553π≈0.955\frac{3}{\pi} \approx 0.955 这个显着的结果(对我来说,是ππ\pi的“ 最意外的外观之一 ”)和非常简单的结果是否有深刻的,显着的或简单的证明?


1
在什么情况下,Wilcoxon的符号秩检验优于t检验或符号检验?
经过一些讨论(在下面),我现在对焦点问题有了更清晰的了解,因此这是一个修订后的问题,尽管某些评论现在似乎与原始问题无关。 似乎t检验针对对称分布迅速收敛,有符号秩检验假设对称,并且对于对称分布,均值/伪随机数/中位数之间没有差异。如果是这样,在什么情况下,当他/她同时拥有t检验和sign检验时,相对没有经验的统计学家会认为有序检验有用吗?如果我的一位(例如社会科学专业)学生正在尝试测试一种治疗方法是否比另一种治疗方法更好(通过某种相对容易解释的衡量标准,例如某种“平均”差异的概念),那么我将努力寻找一个有签名的地方,即使在我的大学中,虽然通常会进行等级考试,但忽略了符号测试。

2
Wilcoxon符号秩检验需要序数或区间数据吗?
看过多个在线资源后,我似乎无法得到一个直接的答案。有人可以为我澄清一下序数数据是否足以用于WSRT,如果不是,符号测试是否是合适的选择?最后,这是针对我在大学的学位论文项目,因此,如果可以在答案中包含任何参考文献/文献,那将不胜感激,因为我需要以任何一种方式证明我选择测试的理由,并且到目前为止仅从网站上找到了答案(无法参考!)

1
为什么Anova()和drop1()为GLMM提供了不同的答案?
我有以下形式的GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 当我使用时drop1(model, test="Chi"),我得到的结果与Anova(model, type="III")从汽车包装或汽车上获得的结果不同summary(model)。后两个给出相同的答案。 通过使用大量虚构数据,我发现这两种方法通常没有区别。对于平衡线性模型,不平衡线性模型(不同组中的n不相等)和平衡广义线性模型,它们给出相同的答案,但对于平衡广义线性混合模型,它们给出相同的答案。因此看来,只有在包括随机因素的情况下,这种矛盾才会显现出来。 为什么这两种方法之间存在差异? 使用GLMM时应使用Anova()还是drop1()应使用? 至少就我的数据而言,两者之间的差异很小。哪一个使用都重要吗?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.