有哪些非训练分类方法可用?
数据挖掘
分类
2021-09-27 08:41:45
3个回答
nsl-我是机器学习的初学者,所以请原谅这里的外行描述,但听起来您可能能够使用主题建模,例如潜在狄利克雷分析 (LDA)。它是一种广泛用于对文档进行分类的算法,根据它们所涉及的主题,基于找到的单词以及这些单词在整个语料库中的相对频率。我提出它主要是因为在 LDA 中没有必要提前定义主题。
由于 LDA 的帮助页面主要是为文本分析而编写的,为了将其应用于您的问题,我将使用的类比是: - 将每个基因表达或特征视为一个“单词”(有时在典型的 LDA 文本分类应用程序) - 将每个样本视为文档(即,它包含各种单词或基因表达) - 将签名视为预先存在的主题
如果我没记错的话,LDA 应该给出每个主题的加权概率,关于它在每个文档中的存在程度。
可能是 kNN 和朴素贝叶斯分类器。kNN 非常快,但是 NBC 可以分解很多。线性回归也是不涉及基于梯度的学习的一步解决方案,因此可能会有所帮助。LDA 是您的下一个选择。
其它你可能感兴趣的问题