我正在尝试在大约 7k 行和 456 列的数据集上使用 rpart 构建 CART 模型
cmodel2=rpart(DV ~ .,data=teltrain2,method="class")
这还没有返回结果。我正在使用带有 R 3.2.3 的 16GB 内存机器。每次运行时,R 执行都会继续,我必须终止 R GUI 进程才能最终停止它。
列说明
id --> 唯一 id(我已从训练集中删除)
位置 --> 号码
col3 到 col400 --> 这些已由我热编码,并且仅包含 0 或 1 作为值
col400-col456 --> 这些是具有数值的特征,例如 23,144 等,均小于 1000
DV --> 因变量是具有超过 2 个值的分类变量。
我试过用一组较小的 1000 行和 456 列运行 rpart,但仍然没有运气。我不想在第一次运行时进行任何类型的特征消除,截至目前我不知道它们是否会影响因变量。
我也试过minbucket=25,20,15,10没有运气提及。
我的目标是在整个数据集上获得 rpart 的结果模型。我有哪些选择?