Questions tagged «ties»

4
生存分析:连续时间与离散时间
我对如何决定在生存分析中将时间视为连续时间还是离散时间感到困惑。具体来说,我想使用生存分析来确定对男孩和女孩(5岁以下)的生存影响最大的儿童和家庭变量。我有一个儿童年龄(以月为单位)的数据集,以及该儿童是否还活着,死亡年龄(以月为单位)以及其他儿童和家庭水平变量的指标。 由于时间是以月为单位记录的,并且所有儿童都在5岁以下,因此生存时间很多(通常每半年间隔:0mos,6mos,12mos等)。根据我对生存分析的了解,有很多捆绑的生存时间,使我认为我应该将时间视为离散的。但是,我还阅读了其他几项研究,例如生存时间以人年为单位(因此肯定存在生存时间),并且使用了诸如Cox比例风险之类的连续时间方法。 我应该使用什么标准来决定将时间视为连续时间还是离散时间?对于我的数据和问题,使用某种连续时间模型(Cox,Weibull等)对我来说很直观,但是我的数据的离散性质和有限的生存时间似乎暗示了其他问题。
20 survival  ties 

2
了解R中的Kolmogorov-Smirnov检验
我正在尝试了解Kolmogorov-Smirnov测试函数的输出(两个样本,两个侧面)。这是一个简单的测试。 x <- c(1,2,2,3,3,3,3,4,5,6) y <- c(2,3,4,5,5,6,6,6,6,7) z <- c(12,13,14,15,15,16,16,16,16,17) ks.test(x,y) # Two-sample Kolmogorov-Smirnov test # #data: x and y #D = 0.5, p-value = 0.1641 #alternative hypothesis: two-sided # #Warning message: #In ks.test(x, y) : cannot compute exact p-value with ties ks.test(x,z) #Two-sample Kolmogorov-Smirnov test #data: x and z …

1
除了Kolmogorov-Smirnov检验之外,还有其他方法可用于校正带约束的数据吗?
我从两个样本(对照样本和处理样本)中得到了一堆数据,每个样本都包含数千个值,这些值将在R中进行显着性检验。理论上,这些值应该是连续的,但是由于测量软件进行了四舍五入,因此它们不是“他们之间建立了联系。分布是未知的,并且对照分布和处理过的分布的形状可能不同,因此我想使用非参数检验来比较样本中的差异是否对10个不同因素有显着影响。 我曾考虑过使用Kolmogorov-Smirnov检验,但是它并不真正适用于平局。我最近偶然发现了一个名为Matching的新R库,该库执行KS测试的引导版本并可以容忍联系。现在,这真的是一个好主意,还是应该改用其他测试?我是否需要调整p值?

4
用kNN处理关系,权重和投票
我正在编写kNN算法,想了解以下内容: 抢七局: 如果在多数表决中没有明确的获胜者会怎样?例如,所有k个最近的邻居都来自不同的类别,或者对于k = 4,有2个来自A类的邻居和2个来自B类的邻居? 如果由于更多的邻居具有相同的距离而无法精确确定k个最近的邻居,会发生什么情况?例如,对于距离列表,(x1;2), (x2;3.5), (x3;4.8), (x4;4.8), (x5;4.8), (x6;9.2)将无法确定k = 3或k = 4最近的邻居,因为第3至第5个邻居都具有相同的距离。 重量: 我读到,在选择获胜级别之前,最好权衡k个最近的邻居。这是如何运作的?即,邻居如何加权,然后如何确定类别? 多数投票的替代方案: 除多数表决外,还有其他规则/策略来确定获胜者吗?

1
为什么在非参数统计中联系如此困难?
我的非参数文本《实践非参数统计》经常为期望,方差,检验统计等提供清晰的公式,但包括警告,只有在我们忽略联系时才有效。在计算Mann-Whitney U统计量时,建议您在比较较大的对数时扔掉配对。 我知道这种联系并不能真正告诉我们哪个人口更大(如果这就是我们感兴趣的人口),因为两个群体都不比另一个更大,但是在开发渐近分布时似乎并不重要。 那为什么在某些非参数过程中如此处理联系呢?有没有办法从关系中提取任何有用的信息,而不是简单地将它们扔掉? 编辑:关于@whuber的评论,我再次检查了我的消息来源,并且某些过程使用了平均等级,而不是完全放弃绑定值。尽管在保留信息方面似乎更明智,但在我看来,它也不够严格。但是,问题的精神仍然存在。

2
R中的单样本Kolmgorov-Smirnov测试中的“不应出现束缚”
我将使用Kolmogorov-Smirnov测试来测试R中MYDATA的正常性。这是我所做的一个示例 ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA)) 这是R给我的结果: data: MYDATA D = 0.13527, p-value = 0.1721 alternative hypothesis: two-sided Warning message: In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) : ties should not be present for the Kolmogorov-Smirnov test 我认为有一个问题,此警告中的“联系”是什么意思?

1
Kruskal-Wallis内置的R函数与手动计算之间略有不一致
我对以下内容感到困惑,并且无法在其他地方找到答案。 我试图在做一些统计的同时学习R,并且作为练习,我尝试通过像在R中一样“手动”执行这些内置R函数的结果来仔细检查。 ,对于Kruskal-Wallis考试,我一直得到不同的结果,但我不知道为什么。 例如,我正在查看练习中分发的以下数据 activity <- c(2, 4, 3, 2, 3, 3, 4, 0, 4, 3, 4, 0, 0, 1, 3, 1, 2, 0, 3, 1, 0, 3, 4, 0, 1, 2, 2, 2, 3, 2) group <- c(rep("A", 11), rep("B", 10), rep("C", 9)) group <- factor(group) data.raw <- data.frame(activity, …

3
在执行Wilcoxon测试之前抖动是错误的吗?
我写了一个脚本,使用来测试数据wilcox.test,但是当我得到结果时,所有p值都等于1。我在一些网站上读到,在测试数据之前,您可能会使用抖动(以避免像他们所说的那样束缚),我做到了,现在我得到了可以接受的结果。这样做是错误的吗? test<- function(column,datacol){ library(ggplot2) t=read.table("data.txt", stringsAsFactors=FALSE) uni=unique(c(t$V9)) for (xp in uni) { for(yp in uni) { testx <- subset(t, V9==xp) testy <- subset(t, V9==yp) zz <- wilcox.test(testx[[datacol]],jitter(testy[[datacol]])) p.value <- zz$p.value } } } 这是输出 dput(head(t)) structure(list(V1 = c(0.268912, 0.314681, 0.347078, 0.286945, 0.39562, 0.282182), V2 = c(0.158921, 0.210526, 0.262024, 0.322006, 0.133417, …
9 r  nonparametric  ties 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.