如何在 Weka 中使用预定义范围离散化数值?

数据挖掘 机器学习 数据挖掘 特征工程 威卡
2022-03-11 23:52:58

我已将 csv 文件导入 Weka。其中一个特征的值最小为 0,最大为 160。现在,我想将该值离散为三个范围,如下所示:

小于 6 > L

大于 6 小于 20 > M

超过 20 > H

我怎样才能做到这一点?

1个回答

离散化或分箱,很常见。Weka 中有一个过滤器。您可以在weka.filters.unsupervised.attribute.Discretise下找到它。它也在 GUI 中。

您可以在以下位置找到文档:https ://weka.sourceforge.io/doc.dev/weka/filters/unsupervised/attribute/Discretize.html