我的数据集包含许多功能,其中包括GPS坐标(纬度和经度)。我想使用这些数据集来探讨以下问题:(1)计算ETA以在起点和终点之间行驶;(2)估算特定点的犯罪数量。
我想使用线性回归模型。但是,我可以直接在线性模型中使用这些GPS坐标吗?
纬度和经度不具有序数属性,例如与人的年龄无关。例如,两个点(40.805996,-96.681473)和(41.226682,-95.986587)似乎没有任何有意义的排序。它们只是空间中的点。我当时想用分类的美国邮政编码替换它们,然后进行一键编码,但这会导致很多变量。
1
您是否必须直接使用它们?您是否听说过分区工具,例如S. Openshaw的AZP算法?如果区域相对一致,您甚至可以手动将地图中的区域划分为单独的区域/区域。
—
Mephy
@Mephy:那意味着我会将纬度/经度转换为区域,对吗?但是然后,我将拥有成百上千个分类区域,就像邮政编码一样。我必须全部编码一次。
—
stackoverflowuser2010
当然,这取决于您如何切割区域。如果选择“赤道线以南/赤道线以北”,则只有两个。许多分区算法都有一些超参数来定义数量,例如区域数或最小区域大小。
—
Mephy
我有同样的问题。我想预测一个人的立场。我已经对训练数据中的所有地理位置特征进行了地理隐藏。之后,使用LabelDecoder转换分类位置特征。最后,结果是可怕的。处理空间预测有什么好主意吗?
—
berisfu '18