据我了解,我们只能建立一个位于训练数据间隔内的回归函数。
例如(仅一个面板是必要的):
如何使用KNN回归器预测未来?同样,它似乎仅近似位于训练数据间隔内的函数。
我的问题:使用KNN回归器有什么优势?我知道这是一个非常强大的分类工具,但在回归场景中似乎效果不佳。
据我了解,我们只能建立一个位于训练数据间隔内的回归函数。
例如(仅一个面板是必要的):
如何使用KNN回归器预测未来?同样,它似乎仅近似位于训练数据间隔内的函数。
我的问题:使用KNN回归器有什么优势?我知道这是一个非常强大的分类工具,但在回归场景中似乎效果不佳。
Answers:
在某些情况下,像K-NN这样的局部方法很有意义。
我在学业中做过的一个例子与预测各种水泥配料混合物的抗压强度有关。所有这些成分在响应或彼此之间都相对不挥发,KNN对此做出了可靠的预测。换句话说,没有一个独立变量具有不成比例的大方差以单独或可能通过交互作用赋予模型。
带着一粒盐就可以了,因为我不知道有一个数据调查技术可以得出结论,但是从直觉上看,如果您的要素具有一定比例的方差程度,而我不知道比例是多少,这似乎是合理的。 KNN候选人。我当然想知道是否为此进行了一些研究和产生的技术。
如果您从广义领域的角度考虑它,那么会有各种各样的应用程序,其中相似的“配方”产生相似的结果。当然,这似乎可以描述预测水泥混合效果的情况。我想说的是,如果您有按照此描述进行操作的数据,并且您的距离测度对于手边的域也是自然的,最后您有足够的数据,那么我想您应该从KNN或其他本地方法获得有用的结果。
使用局部方法时,您还将获得极低偏差的优势。有时,通用加性模型(GAM)通过使用KNN拟合每个变量来平衡偏差和方差,从而:
我不会这么快就注销KNN。它有它的位置。
我不愿意说,但实际上简短的答案是,用knn或任何其他现有的分类器或回归器实际上不可能“预测未来”。
当然,您可以推断线性回归的线或SVM的超平面,但最后您不知道未来会怎样,就我们所知,这条线可能只是弯曲现实的一小部分。例如,当您查看诸如高斯过程之类的贝叶斯方法时,这将变得显而易见,一旦离开“已知输入域”,您将发现一个很大的不确定性。
当然,您可以尝试从今天发生的事情总结到明天可能发生的事情,这可以使用knn回归轻松完成(例如,圣诞节期间去年的客户数量可以为您提供有关今年数量的很好的提示)。当然,其他方法可能会结合趋势等等,但是最后您可以看到当涉及股市或长期天气预报时,这种方法的效果如何。
首先是“如何使用KNN回归器预测未来?”的示例。
调整权重,参见例如
逆距离加权-IDW插值与-蟒,
和距离度量用于7D“最近邻”。
“使用KNN回归器有什么优势?”
对于其他人的好评,我将添加易于编码和理解的方法,并可以扩展到大数据。
缺点:对数据和调优很敏感,没有太多的了解。
因此,您的第一行“我们只能建立位于训练数据间隔内的回归函数”似乎与令人困惑的“回归”一词有关。)