我目前正在寻找一种监督学习算法,该算法可用于在给定足够大的训练集的情况下预测输出。
这是一个简单的例子。假设训练数据集是{[A=1, B=330, C=1358.238902], result=234.244378}
和测试数据集{[A=893, B=34, C=293], result=?}
我的意图是?
使用训练数据集中给出的输入值和结果进行预测。
考虑到我的输入/输出值范围很广,什么算法对这个问题有效?这需要某种回归算法吗?
我目前正在寻找一种监督学习算法,该算法可用于在给定足够大的训练集的情况下预测输出。
这是一个简单的例子。假设训练数据集是{[A=1, B=330, C=1358.238902], result=234.244378}
和测试数据集{[A=893, B=34, C=293], result=?}
我的意图是?
使用训练数据集中给出的输入值和结果进行预测。
考虑到我的输入/输出值范围很广,什么算法对这个问题有效?这需要某种回归算法吗?
在定义误差测量之前无法解决(例如或者) 以及当 A、B 和 C 发生变化时此错误如何变化。
极端例子:假设是随机的(与 A、B、C 值无关)但静态的(总是相同的对于相同的 A、B、C 值)。给定 A、B、C 的一些值,你只能回答当 A,B,C 在训练集中时。当 A、B、C 不在训练集中时,是未定义且不可预测的。
此外,如果可以进行改进有一些属性,例如,如果可以声明或者那个如果.
是的,您正在尝试预测实数输出,所以这是一个回归问题。要知道哪种算法最好,我认为您必须询问您拥有多少数据以及您对数字关系的了解程度。如果你尝试简单的线性回归,你会得到什么样的错误?
如果您尝试线性回归并且得到一个可以接受的错误,那么这可能是一个非常简单的问题。除了线性回归之外,您还可以查看更高级的东西,例如高斯过程和神经网络,它们都会做出您正在寻找的各种预测。