1
样条曲线可以用于预测吗?
我无法具体说明数据的性质,因为它是专有的,但是假设我们有这样的数据:每个月都有一些人注册一项服务。然后,在随后的每个月中,这些人可能会升级服务,中止服务或拒绝服务(例如,由于无法付款)。对于最早的数据,我们有大约2年的数据(24个月)。 每个月加入的人数很多(在100,000个范围内),而做这三件事中的任何一个的人数都在数千。但是,我们没有使用单个级别的数据(可能是数百万行),而是按月份和同类群组(每个同类群组每个月做某事的比例)汇总的数据。 我们一直在使用多元自适应回归样条(MARS)对现有数据进行建模,并发现一些有趣的结果。 但是,我担心使用这些推断或预测未来。我担心的是,对未来的预测必然超出样本空间(就时间而言),样条曲线可能会变得不稳定以进行外推。 这是合法方法吗?有什么问题可以解决?