我正在尝试使用人工神经网络来学习从加拿大安大略省的采样地获得的大量森林测量数据以及该省区域气候模型提供的相关气候数据。
因此,以下是 ANN 的输入:
- 位置(GPS 坐标)
- 测量年份和月份
- 树种
- 年龄
- 土壤类型
- 土壤水分状况
- 季节或月平均气温
- 季节或月平均降水量
- 更多数据可供选择
目标包括: - 平均总树高 - 平均树高胸径
对于每个样地,测量树木 1-4 次。所以我的问题是,哪种类型的 ANN 最适合从数据中学习,然后它可以用于预测一组新的输入数据?
我正在尝试使用人工神经网络来学习从加拿大安大略省的采样地获得的大量森林测量数据以及该省区域气候模型提供的相关气候数据。
因此,以下是 ANN 的输入:
目标包括: - 平均总树高 - 平均树高胸径
对于每个样地,测量树木 1-4 次。所以我的问题是,哪种类型的 ANN 最适合从数据中学习,然后它可以用于预测一组新的输入数据?
我的建议不是使用人工神经网络,而是使用更简单的回归算法。主要原因是人工神经网络需要很长时间来训练,并且在使用大量数据时工作得更好。它们还需要大量参数调整方面的专业知识才能很好地应用。既然你说你没有很多数据,也没有很多使用它们的经验,我认为你最好先应用其他东西。如果其他技术根本不起作用,那么您可能会考虑使用 ANN,但同样,它们往往需要大量数据。
如果你尝试过普通的最小二乘回归,发现效果不好,我的下一个选择是分类回归树。这些模型可以用少量数据做出好的决策,并且不需要大量的时间来训练。它们可以处理实值输出,例如树的高度和宽度。Weka 的REPTree可能是一个不错的起点。
如果 Trees 不起作用,我的下一个建议是尝试使用支持向量机进行回归。SciKitLearn 的SVR是一个不错的选择。当数据有限时,SVR 有时会非常有效,因为它们对如何处理似乎普遍适用的数据贫乏区域做出了假设。在这些区域进行估计时,SVM 也可以报告低置信度。当使用少量数据时,它们的训练速度也相当快,并且可以从数据中学习非线性函数。
如果你真的想使用 ANN,我会从一个简单的Multi-layer perceptron开始。该模型几乎没有可以使用的参数,并且可能很适合您的回归。然而,它可能会在数据较少的地区做出奇怪的决定。
希望这可以帮助!