使用机器学习方法的基于方面的情感分析

数据挖掘 机器学习 支持向量机 特征提取
2021-10-05 04:56:37

我是机器学习的新手。我用类别、方面、意见词和情绪对数据进行了注释。例如,对于下面的文本

“苹果真的很好吃”

我有类别->食物,方面->苹果,意见词->美味和情绪->积极。我有这种格式的训练数据。

如何使用这种格式的训练集训练 SVM 分类器?如何提取 n-gram、POS 和情感词等特征来训练分类器?您能否建议使用机器学习算法进行基于此方面的情感分析的任何开始步骤?

2个回答

Aleksandar Blekh 提供了一些关于如何进行情绪分析的大图的非常好的链接;我将尝试提供一些软件链接,并讨论如何使其工作的细节。我将向您指出使用 scikit-learn ( http://scikit-learn.org/stable/ ) 的示例,它是 Python 中的机器学习库。

您首先需要获取数据集并以稀疏格式将其加载到 scikit-learn 中。此链接 ( http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html ) 提供了如何在词袋表示中加载文本的示例,以及相同的模块 (scikit-learn.feature_extraction. text) 也可以计算 n-gram。然后描述如何在该数据集上运行朴素贝叶斯和 SVM。您可以举这个例子并开始使用它。

我建议你从阅读刘冰的入门书“情感分析与观点挖掘”的草稿开始。PDF 文档格式的草稿可在此处免费获取。

有关作者即将出版的新书的更多详细信息,以及有关基于方面的情感分析主题的全面信息,以及数据集的参考和链接,请访问此页面:http://www.cs.uic。 edu/~liub/FBS/sentiment-analysis.html

另一个有趣的资源是 Bo Pang 和 Lillian Lee 的调查书《意见挖掘和情绪分析》。这本书有印刷版和可下载的 PDF 电子书,有出版版本作者格式版本,在内容条款。