在阅读有关2个样本的KS测试时,我确切地了解它在做什么,但我不知道它为什么起作用。
换句话说,我可以按照所有步骤计算经验分布函数,找到两者之间的最大差值,以找到D统计量,计算临界值,将D统计量转换为p值等。
但是,我不知道为什么其中任何一个实际上告诉我有关这两个分布的任何信息。
有人可以很容易地告诉我,我需要跳过一头驴,计算它跑多快,如果速度小于2 km / hr,那么我会拒绝原假设。当然,我可以做您告诉我的事情,但是那与零假设有什么关系?
为什么2个样本的KS测试有效?计算ECDF之间的最大差异与两个分布的差异有何关系?
任何帮助表示赞赏。我不是统计学家,所以如果可能的话,请假设我是个白痴。