我有一个2D正方形,里面有一组点,例如1000点。我需要一种方法来查看正方形内的点的分布是否散布(或或多或少均匀分布),或者它们倾向于在正方形内的某个点聚集在一起。
我需要一种数学/统计(非编程)方法来确定这一点。我在Google上搜索,发现了诸如拟合优度,Kolmogorov等之类的东西,只是想知道是否还有其他方法可以实现这一目标。需要这个用于课堂论文。
输入:2D正方形和1000点。输出:是/否(是=均匀分布,否=在某些地方聚集在一起)。
R
,可以使用很多工具来完成此任务。
我有一个2D正方形,里面有一组点,例如1000点。我需要一种方法来查看正方形内的点的分布是否散布(或或多或少均匀分布),或者它们倾向于在正方形内的某个点聚集在一起。
我需要一种数学/统计(非编程)方法来确定这一点。我在Google上搜索,发现了诸如拟合优度,Kolmogorov等之类的东西,只是想知道是否还有其他方法可以实现这一目标。需要这个用于课堂论文。
输入:2D正方形和1000点。输出:是/否(是=均匀分布,否=在某些地方聚集在一起)。
R
,可以使用很多工具来完成此任务。
Answers:
我认为@John进行卡方检验的想法是一种方法。
您可能希望在2-d上安装补丁,但是您想使用1路卡方检验来测试它们;也就是说,单元格的期望值为,其中N是单元格的数量。
但是,不同数量的单元格可能会给出不同的结论。
另一种可能性是计算点之间的平均距离,然后将其与该平均值的模拟结果进行比较。这避免了任意数量的单元的问题。
编辑(有关平均距离的更多信息)
对于1000个点,点之间存在成对的距离。这些都可以计算出来(例如,使用欧几里得距离)。这些距离可以平均。
然后,您可以生成N个(大量)1000个点的集合,这些点是均匀分布的。这N个集合中的每一个也具有点之间的平均距离。
将实际点的结果与模拟点进行比较,以获取p值或仅查看其落在何处。
另一种可能性是卡方检验。将正方形划分为大小相等的非重叠面片,并在均匀性假设下将落入面片的点的计数与其预期计数进行比较(如果面片的大小均相等,则面片的期望为total_points / total_patches) ,然后应用卡方检验。对于1000点,9个补丁就足够了,但是您可能希望根据数据的外观使用更多的粒度。
为什么不使用Kolmogorov-Smirnov检验?那就是我要做的,特别是考虑到您的样本量足够大以弥补功效不足。
或者,您可以进行一些模拟。它并不严格,但是它提供了一些有关数据是否均匀分布的证据。
@whuber KS的二维扩展是众所周知的(请参阅此处)。在这种情况下,我们正在研究是否可以从二维联合均匀分布中绘制这1000个绘制(坐标(x,y))-至少这就是我读到的“均匀分布”的方式。@John我可能笨拙地表达了自己(我的母语不是数学也不是英语)。我的意思是,可以使用诸如KS之类的测试来计算确切的p值,而在进行模拟时,p值(或任何您称呼的等效值)只会渐近趋向。