使用深度学习的具有数值特征的二元分类器示例

数据挖掘 分类 深度学习
2022-02-27 17:40:49

我想对深度学习有更多的了解。浏览网页,我发现了语音识别和手写数字方面的应用。但是,我有兴趣获得一些关于如何在经典环境中应用它的指导:

  • 二元分类器
  • 数值特征(每个样本是个条目的数值向量,没有 2D 像素等)。K

我正在做自己的实验,选择学习率、隐藏神经元的数量等,但我很高兴看到更有经验的人提出应用。

我使用的软件使用受限玻尔兹曼机 (RBM) 提供权重初始化。我想知道这在这种情况下是否有用,以及文献中遇到的其他特殊技术(卷积神经网络)是否在这里有用。

有人可以分享一篇博文、一篇论文或个人经历吗?

2个回答

我使用二进制分类对文本进行情感分析。我通过使用适当的向量器将句子转换为向量,并使用 OneVsRest 分类器进行分类。

在另一种方法中,我的单词被转换为向量,然后我使用基于 CNN 的方法进行分类。到目前为止,在我的数据集上进行测试时,两者都给出了可比较的结果。

如果您有向量,那么已经有非常好的方法可用于二进制分类,您可以尝试。On Binary Classification with Single-Layer Convolutional Neural Networks是一本很好的读物,适合您使用 CNN 进行分类。

是我阅读的第一批博客之一,以获得更多关于此的知识,并且不需要太多的先决条件即可理解(我假设您了解卷积和神经网络的基础知识)。

深度学习现在在 ML 中是一件很有趣的事情,因为它在许多方面都优于其他 ML 算法。卷积神经网络是实现深度学习的方法之一,它高度适用于图像、信号(时间序列)和文本等不同的数据类型。

我主要将 CNN 用于图像和信号。在我的应用程序中,我完成了二进制和多类分类。两者的理论背景相同。根据手头的问题和数据,您可能希望将多类分类分解为简单的二元分类,并在稍后阶段将它们组合起来。这些是构成模型选择的内容。

可以从两个方面考虑将深度(神经)网络应用于特征数据集。一种是在矢量化后应用于文本数据,如@HimaVarsha 所述。我没有处理过文本数据,但我的应用程序主要来自图像、信号或目录(天文目录)。我曾尝试在深度神经网络中使用基本上是数字特征(第二方面)的目录数据,但由于使网络更深,结果并没有得到显着改善——这可能是我的设计问题,也可能是特征本身。(此外,这种方法通常不被认为是深度学习中的一种学习方式,因为深度学习更多的是直接从数据中学习。但这是另一个哲学问题)使用卷积神经网络,我在更深层得到了很好的结果。

除了第一个答案中的博客链接之外,我还建议这样做如果您想研究 CNN,Keras 博客也推荐。