我建立了一个回归模型来预测基于客户、销售人员、产品类别、客户行业和客户区域的利润。
在尝试了几个调整超参数的模型后,我发现 Gradient Boosting Regressor 和 Ridge Regression 表现最好(它们的 RMSE 相似)。
然而,当我运行每个模型的特征重要性和系数来分析哪些特征对利润预测很重要时,结果表明 GB Regressor 将客户和销售人员作为最高特征,而岭回归将客户区域和行业作为最高系数。
我意识到我一直在考虑系数和特征重要性几乎是同一件事。有人可以帮我弄清楚我应该如何解释这个结果 - 当我想找到列和目标之间的关系时,哪个更有意义?