我打算使用天气数据来预测芝加哥的犯罪情况。我很困惑将哪个用作特征:历史天气预报数据或历史实际天气数据?这里的基本逻辑是什么?我假设以后只有预测数据可用于预测。感谢您的任何意见。
使用预报天气数据或实际天气数据进行预测?
数据挖掘
预测建模
特征选择
2021-09-20 12:22:06
4个回答
隐含地使用历史天气数据意味着您相信气象学家和天气预报员会随着时间的推移改进他们的模型,并让他们承担全部责任;但是,一旦您自己的模型部署了预测中的偏差,可能会在您的模型响应中产生偏差。
使用天气预报应该会产生更好的结果,因为您的模型将直接捕捉预测中的潜在偏差;但是,如果天气预报员更新了他们的预测模型,并且如果您错过了此更新,您的模型响应可能会受到影响。
我不会在同一个模型中同时使用历史天气数据和天气预报;我会考虑建立两个模型,一个带有历史数据,一个带有天气预报,如果使用天气预报的改进不显着,则使用历史数据。
你可以预测和实际天气,然后看看哪个提供更好的预测功能?显然预报和实际天气之间会有很多相关性,但是您可以使用特征选择来选择最重要的吗?
我建议同时尝试两者。我的想法是,某些天气条件为犯罪提供了更好的条件。如果我的假设是正确的,那么犯罪分子很可能会利用这一点并查看天气预报。不要笑我。
你最好使用预测。在部署中,您的模型将依赖于天气预报,这显然不是 100% 准确的。因此,如果您根据实际天气训练模型,您可能会人为地夸大您的准确性。使用预测将使您更好地估计模型前进的准确性。
其它你可能感兴趣的问题