我目前正在使用 bnlearn 包中的 discretize 对 R 中的训练集进行离散化。
library(bnlearn)
discretize(train, method = "quantile", breaks = 2)
一个区间的下限和另一个区间的上限是相应列的最小值和最大值。
在测试集上执行相同的命令
discretize(test, method = "quantile", breaks = 2)
将导致不同的离散化,因为测试集上的最小值和最大值可能不同。在 R 中(使用另一个库或命令)是否可以将离散化从训练集转移到测试集?
显然,这在 Weka 和 Orange 中很容易做到,但是,我更愿意在 R 中做到这一点(不使用 RWeka)。