如何确定字符串是“食物”还是“饮料”?

数据挖掘 机器学习 javascript
2021-10-11 07:00:28

我的数据存在几个餐厅菜单(以文本形式)。我想检测菜单上可以是“食物”或“饮料”的项目的类别。

我如何称呼这种机器学习?文本分类?

我知道 javascript 不适合这种事情,但我想使用 Brain.js 或 tensorflowjs 来实现概念证明。

提前致谢!

2个回答

菜单通常是餐厅供应的项目列表。项目大致分为两部分:

  1. 食物:列出所有食物的地方
  2. 饮料:列出所有饮料项目。

如果您拥有的所有餐厅菜单都以类似的方式列出项目,我有点困惑在这种情况下您将如何使用 ML。

但是,如果餐厅菜单包括食物/饮料项目的食谱/成分,那么是的,我可以应用机器学习来识别项目的类别。在这种情况下,我们可以使用NLP 或简单文本分类器( by dividing the recipe in some key word tokens and segregate between food and drink) 模型进行预测。

您可以尝试根据食物/饮料名称中存在的单词进行分类。例如,名称中包含“chicken”的项目可能是食物,但如果包含“margarita”则可能是饮料(当然,不一定,因为您可能有“bloody mary with chicken”这样的项目肉汤”或“用玛格丽塔腌制的牛排”,这就是您需要机器学习模型的地方。在足够全面的训练集中训练您的模型,它可能会起作用。