我有一个包含 900,000 行和 8 个特征的数据集。我想查看每个功能的重要性,以便评估我添加的功能是否可行。
我在做一些研究后使用的一种方法是套索方法,据我了解,它通过尝试最小化这个函数来为每个变量提供系数。

将我的 alpha 更改为 .001 后,我能够为每个功能获得这些系数,但我不确定如何处理它们以及它们的含义。是越高越重要,还是我应该将这些系数应用于我的数据?
Feature 1 : 11.3697897122
Feature 2 : 0.210785096352
Feature 3 : 4.94093396164e-05
Feature 4 : 0.0
Feature 5 : 0.0
Feature 6 : 0.0
Feature 7 : -0.0370673794819
Feature 8 : -0.15121827904