特征加权和特征选择的区别

数据挖掘 机器学习 特征选择 特征工程
2022-03-07 18:24:44

特征加权和特征选择有什么区别?特征重要性和特征加权一样吗?

2个回答

功能选择是在您的功能中选择最重要的功能。

特征权重来自您选择的特征,对模型贡献最大的特征进行排名。

只是为了保持基本和简单的反应。

TL;博士

特征选择是一个预处理步骤。

特征加权是一个学习的步骤。

特征选择

这是一个预处理步骤。这意味着您可以选择模型甚至可以看到的功能。这很重要,因为在大型企业中,并非所有数据都可以从同一来源获得,或者获取某些数据需要成本。因此,需要事先选择特征,并努力只检索必要的数据。

例子:

  1. 医疗记录可能有助于确定保险费,但由于法规的原因,您可能会忽略该功能。
  2. 您正在检测传入电子邮件的主题。发件人过去的购买可能有助于确定电子邮件中的主题,但访问购买数据库比电子邮件更困难,因此您可以选择仅使用电子邮件文本。

特征加权

这是一个学习步骤。此时,您可以假设已完成特征选择,并且您可以访问所需的所有数据。

现在的想法是确定该功能对您的模型的重要性。这可以手动设置,但理想情况下是基于一些学习的指标。

特征重要性就像特征加权。

例子:

  1. 您有一个集成模型,其中进入该模型的所有特征实际上都是来自其他模型的预测。您可以根据这些其他模型的个人表现对它们的预测进行加权。然后,您的集成器从具有比个人性能较差的模型更大的权重的良好性能模型中进行预测。