在跟进我之前的问题时,我能够使用 RTextTools 根据 70 个类别标记调查回复。每个调查都有一个标签,而如果手动编码,一些调查将有多达 8 个标签。
好消息是我的训练数据集确实有多个标签。所以我的问题是,是否可以同时训练 8 个标签?然后在测试数据上,获取与每个标签相关的概率,并根据概率排序,得到前 8 个标签?
或者有人可以提出更好的方法吗?
在跟进我之前的问题时,我能够使用 RTextTools 根据 70 个类别标记调查回复。每个调查都有一个标签,而如果手动编码,一些调查将有多达 8 个标签。
好消息是我的训练数据集确实有多个标签。所以我的问题是,是否可以同时训练 8 个标签?然后在测试数据上,获取与每个标签相关的概率,并根据概率排序,得到前 8 个标签?
或者有人可以提出更好的方法吗?