R中的单样本Kolmgorov-Smirnov测试中的“不应出现束缚”


12

我将使用Kolmogorov-Smirnov测试来测试R中MYDATA的正常性。这是我所做的一个示例

 ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))

这是R给我的结果:

 data:  MYDATA
 D = 0.13527, p-value = 0.1721
 alternative hypothesis: two-sided

 Warning message:
 In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
    ties should not be present for the Kolmogorov-Smirnov test

我认为有一个问题,此警告中的“联系”是什么意思?


2
您为什么要执行此正常性测试?在大多数情况下,测试变量的正态性 几乎没有用,尽管在回归后测试残差的正态性可能很重要。
EdM

2
即使没有关系,KS测试也不是一般正态性的测试,而是完全指定的分布的测试(您需要从数据中估计均值和sd)。您的p值是胡说八道。搜索我们的网站,以获取有关Lilliefors测试的参考
Glen_b -Reinstate Monica

Answers:


10

您在这里有两个问题:

KS测试用于连续分布,因此MYDATA不应包含任何联系(重复值)。

KS测试所基于的理论不允许您像已经做的那样根据数据估算分布的参数。ks.test的帮助对此进行了说明。


为什么ks.test在两个样本的情况下,要从x和中都删除领带y?我的意思是,我x和和yunique(x)unique(y))没有关系,但是两个向量有一个共同的值。难道不应该仅在x和中的值之间考虑这些联系y吗?
Nemesi

@Nemesi如果您有新问题,请使用“询问问题”按钮询问。
mdewey

我虽然这并不足以成为一个不同的问题,但在这里它是:stats.stackexchange.com/questions/389151/...
NEMESI

5

如@mdewey所解释,从数据估计参数时,KS测试不适合。您可以使用以下代码,这些代码依赖于Anderson-Darling检验的正态性,并且不需要您提供均值和stddev。该测试的准确性比Lilliefors测试更强。

install.packages("nortest")
library(nortest)
ad.test(MYDATA)

“准确性”可能适用于狭窄但被误导的搜索。在这两种情况下,这些测试中的任何一种的大多数应用在最坏的情况下都是无用的,并且在大多数情况下具有误导性。人们通常会由对回归方法的假设有错误理解的人教他们使用它们。我猜想KS测试的相对弱点实际上会使其“更好”地使用功能更强大的替代方法,因为它的结果不太可能误导朴素的用户。
DWin
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.