我有一个任务,我必须收集电影评论并用 poz neg notr 标签对它们进行分类,然后将它们转换为 info arff 文件。我用正则表达式等做了所有这些事情。
但是对于实验我必须选择十分类算法。我做了一些研究,但无法弄清楚我应该使用哪种算法。
你能帮忙吗?谢谢。
我有一个任务,我必须收集电影评论并用 poz neg notr 标签对它们进行分类,然后将它们转换为 info arff 文件。我用正则表达式等做了所有这些事情。
但是对于实验我必须选择十分类算法。我做了一些研究,但无法弄清楚我应该使用哪种算法。
你能帮忙吗?谢谢。
这里有一个很好的教程:
http://www.unal.edu.co/diracad/einternacional/Weka.pdf
基本上,您想使用 StringToWordVector 过滤器将字符串转换为词向量 (!),然后在该数据上训练贝叶斯分类器。