我正在使用 Google API 对笔记本电脑的问题(硬件、软件、网络、客户满意度、无理由)进行分类和预测。我插入了我的训练数据,并且类别得到了很好的评估和预测。训练数据仅使用 5 个主要类别,因为它来自自由文本并且具体需要一些手动工作。现在我想更深入地标记这些类别:示例。笔记本电脑因显示器被破解而被退回:硬件类别已定义,但我有一本字典,我也可以在其中查找“显示器”一词。例子:
Hardware:
Display:
failure: True
Info:
Physical_damage: Display cracked
无法安装 Skype:
Software:
Applications:
Skype:
failure: True
Info:
Description: Unable to upgrade
我想首先使用主要类别进行分类,然后在选择主要类别后,查看我的文本以从一组单词中寻找可能的选项(例如:{"display": ["screen", "display", "monitor"] }, {"applications", "skype","office","adobe","spotify"}
我应该分两个阶段运行这些吗?有什么推荐的模式或解决方案吗?