我已经看过并且令人惊讶地没有发现太多关于caretande1071包的相对优势的讨论。据我了解,这些包执行许多相同的 ML 算法。考虑到这一点,我感兴趣的是那些有这两种经验的从业者认为这些软件包的相对优势和劣势是什么。您如何看待代码的可读性、编码的易用性、方法、速度等...
特别是我对多类 SVM 感兴趣
我已经看过并且令人惊讶地没有发现太多关于caretande1071包的相对优势的讨论。据我了解,这些包执行许多相同的 ML 算法。考虑到这一点,我感兴趣的是那些有这两种经验的从业者认为这些软件包的相对优势和劣势是什么。您如何看待代码的可读性、编码的易用性、方法、速度等...
特别是我对多类 SVM 感兴趣
我认为这caret有e1071不同的目的。首先让我们讨论caret一下,它最接近的竞争对手是mlr包。两者都是允许跨参数优化模型的元包。例如,您不确定是否要使用 Lasso 或 Ridge 来创建模型的问题。正如这里 caret所解释的,允许根据不同类型的交叉验证选择最佳 lambda。
相反,该e1071包是由 TU Wien 开发的功能包。它可能是最流行的支持向量机包之一,由caret. 但它的目标与 非常不同caret,它实现了学习算法和其他功能,同时caret寻求在学习模型中找到最佳参数。
这取决于。
几乎所有的教授(在我的大学里)都会向学生展示e1071. 有点奇怪的名字e1071来自课程名称。
但是,如果您有行业或 kaggle 的实践经验,您会发现预处理功能caret非常有用。通过几个参数指定您想要的内容。您可以获得标准化、填充 NA、交叉验证等。非常容易。一点头也不疼。
如果时间允许,两个都玩。