我有同一时间段内发生的事件的数据集。每个事件都有一个类型(很少有不同类型,少于十个)和一个位置,以2D点表示。
我想检查事件类型之间或类型与位置之间是否存在任何关联。例如,也许类型A的事件通常不会发生,而类型B的事件却不会发生。也许在某些地区,大多数是C型事件。
我可以使用哪种工具来执行此操作?作为统计分析的新手,我的第一个想法是在此数据集上使用某种PCA(主成分分析),以查看每种类型的事件是否具有自己的成分,或者某些事件是否共享相同的成分(即相关的成分)?
我不得不提到,我的数据集约为500'000点,因此使处理起来有些困难。
编辑:如下面的答案和评论中所述,方法是将此模型建模为标记点过程,然后使用R来完成所有繁重的工作,如本研讨会报告中的详细说明:http:// /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html