建立机器学习模型以根据环境数据预测农作物产量


10

我有一个数据集,其中包含一个农场10年(2005年-2014年)的温度,降水和大豆产量的数据。我想根据此数据预测2015年的收益。

请注意,该数据集具有温度和降水量的每日值,但每年只有1个值,因为农作物的收获是在农作物生长季节结束时进行的。

我想建立一个回归模型或其他基于机器学习的模型来预测2015年的产量,该模型基于回归模型/其他模型,该模型是通过研究前几年的产量,温度和降水之间的关系得出的。

我熟悉使用scikit-learn进行机器学习。但是,不确定如何表示此问题。这里最棘手的部分是温度和降水是每天的,但产量仅为每年1个值。

我该如何处理?


甚至我都在尝试建立模型来预测农作物产量。您能否分享您所采用的方法的详细信息?
Nitz

您是否能够获得完整的答案。如果没有,请告诉我,鉴于我在同一域中工作,我将很乐意就该问题写详细的答案
89_Simple

@ Crop89,那太好了!期待您的答案
user308827 '18

你知道了吗?我正面临着同样的问题。如果解决了,您可以分享细节吗?非常感谢
eric huang

Answers:


3

首先,您可以根据上一年的每日数据预测来年的收益。您可以通过将每年的数据作为一个“点”来估计模型参数,然后使用交叉验证来验证模型。您可以考虑的范围比过去一年多,可以扩展此模型,但回头太远了,您将很难验证模型和过度拟合。


谢谢@Emre,我的困惑是如何将全年的数据作为1分?每一行数据(代表一天)是否不是scikit-learn术语中的样本?如何将整年作为一个样本而不是365个样本?
user308827 '16

1
我没有在讲sklearn的细节,但是自您询问以来,您想使用sklearn.cross_validation名称中带有“ Label” 的方法,例如sklearn.cross_validation.LabelKFold
Emre'1

谢谢@Emre,所以这个主意是每年分配一个标签,对吗?
user308827 '16

是的,@ user308827。
Emre'1

再次感谢@Emre,请查看后续问题:datascience.stackexchange.com/questions/9612/…–
user308827


1

您有10个数据点,每个数据点的尺寸为365(每天的温度)+ 365(每天的降水量)。理想情况下,我将首先通过机器学习方法(例如PCA)减小尺寸。然后使用机器学习方法来构建预测模型。但是,由于数据集很小,我认为机器学习技术不适合您的问题。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.