我在一家公司工作,该公司试图使用机器学习方法,特别是梯度提升和神经网络来预测股市数据,因此使用历史数据来预测股票/资产的价格从现在开始的时间段。我们使用这些方法进行回归而不是分类,我在实验科学中接受训练的习惯是总是根据,给出一个预测区间,而不仅仅是一个数字。我的经理(他似乎不是很技术)告诉我这是不可接受的/作弊,因为我使用间隔来掩盖我的算法无法产生单个正确数字的事实。我对这种态度有点困惑,因为来自实验室科学(化学),我们总是以.
所以,我想知道这里的统计专家是怎么想的?出于好奇,我查看了 Hastie、Witten 等人的机器学习教科书。等,他们使用测试集上的 MSE 来给出关于他们在梯度提升中使用的示例的预测,所以这样做似乎是标准的......
谢谢。