如果您的响应和所有预测变量都是分类的,那么可以替代名义 Logistic 回归的最佳分类方法是什么?

数据挖掘 机器学习 机器学习模型 逻辑回归
2022-03-12 11:05:18

嗨,我需要帮助来选择最佳分类方法。我的响应变量是标称的,有“4”个类别和五个预测变量,其中两个是标称的,三个是二元的。请向我解释当我尝试使用 R 库“nnet”中的多项逻辑回归时我应该采用哪种方法,但我没有得到令人满意的结果。

1个回答

您可以将分类特征嵌入到某个连续空间中,然后对嵌入执行任何分类方法。例如,使用频谱编码(链接 1)或其他类型的编码(链接 2)。

您可以使用语言建模中的技术,例如本文(链接 3),其中展示了如何学习单词的数字表示(它们是名义事物)。

如果嵌入的数据不是线性分离的,逻辑回归可能仍会显示较差的结果。在这种情况下,请尝试非线性方法,例如决策树、支持向量机、k最近的邻居,随机森林等。

或者,尝试编写一个算法来学习将数据分成类的规则,例如

if var1 == value1 and var2 == value2 and var3 == 0 and var4 == 1 and var 5 == 0 then class1

如果您的名义变量没有太多值,则可以快速学习规则。