如何使用机器学习算法预测产品价格范围

数据挖掘 机器学习
2022-03-04 21:01:41

我想通过历史数据运行回归算法(线性、SVM、随机森林、Xgboost)来预测产品的价格范围。

为了获得价格范围,我将使用最高预测值作为上限,下一个最佳值作为下限)。

Ex: Product a price range preicttion - $1000 to $5000. 

$5000 is from top predicted price. 
$1000 is from next best-predicted price. 

我的方法正确吗?

尚未接收数据,因此没有太多数据样本可提供。

请建议。

3个回答

如果在您的数据集中,您有两列作为最小值和最大值作为列 n-1 和 n,您可以为 n-1 列训练数据集,其中第 n-1 列是您的依赖值,那么对于预测第 n 列,第 n 列将是您的从属值,而其他 n-1 列是独立的。

从你的问题来看,你在看什么并不是很清楚。我假设你会有这样的数据,

feature 1, feature 2, ..., feature n, price (multiple entries like this)

现在您需要训练这些数据来训练模型来预测价格。价格是您的输出变量,特征是输入变量。训练模型后,使用一些测试数据(您知道价格的地方)来查看预测价格是多少。并查看与实际值相比预测的好/坏。

不知道为什么你需要最高价格和次优价格。

我相信你期望你的模型有两个结果,

 1. Minimum price
 2. Maximum price

假设您的训练数据集有两个标签,即最低价格和最高价格。如果是这样,我认为您应该训练两个单独的回归模型,1. 将最低价格标签作为目标,将休息作为特征。2. 保持最大价格标签为目标,其余为特征。

如果您的训练数据只有一个标签,即只有价格。在这种情况下,根据我的说法,您可以设置一些阈值,它将作为价格差异发挥作用。