我想对一个数据集Credit Scoring进行分类,该数据集由 21 个属性组成,其中一些是数字,另一些是布尔值。
对于输出,我想根据这些属性知道他们的信用是好是坏,而不需要计算信用评分的任何数值。
我正在使用 Weka 来完成这项任务。但是,我不确定哪种数据集的最佳/理想分类器是什么。
这里的任何人都可以将我引向正确的方向吗?
我想对一个数据集Credit Scoring进行分类,该数据集由 21 个属性组成,其中一些是数字,另一些是布尔值。
对于输出,我想根据这些属性知道他们的信用是好是坏,而不需要计算信用评分的任何数值。
我正在使用 Weka 来完成这项任务。但是,我不确定哪种数据集的最佳/理想分类器是什么。
这里的任何人都可以将我引向正确的方向吗?
嗯,这取决于数据的结构。最好的方法是通过网格搜索尝试所有具有不同参数的智能模型,如朴素贝叶斯、随机森林、支持向量机。没有任何模型在分类时总是效果最好。但是,如果设置正确,神经网络(weka 上称为多层感知器)应该会更好。