成分、食谱和食谱评级。我想根据成分的组合来预测评分

数据挖掘 数据集 预测建模 预言
2022-02-17 09:55:21

对于我的问题的第一步,我可以使用的建模技术或相关研究的建议(我找不到任何),我真的很感激。

我有一份成分列表(总共 150 种)和一份食谱列表(大约 100 种),其中包含每个食谱中存在哪些成分组合的数据(每个食谱平均 4-5 种成分)。

我的输出变量是这 100 种食谱中每一种食谱的 4 个评分指标(味道、气味、外观和质地),每一种的等级为 1-10。

我的目标是根据我指定的新成分组合(从列表中挑选)来预测 4 个指标。

我应该看什么建模技术来帮助解决这个预测问题?

2个回答

这里有一些想法可以开始:

一个简单的模型是使用多元线性回归 (MLR) 或随机森林

如果您只想根据是否使用某种成分进行评估,您的输入数据集可能如下所示:

黄油面粉鸡蛋...测试气味外观质地 1 0 1 1 5 2 4

如果您想预测每种成分的含量(有些更好,太多不好),您的数据集可能如下所示:

黄油面粉鸡蛋...测试气味外观质地 1.5 3.0 2 1 5 2 4

你可以从这个网站得到一些其他的想法:

https://machinelearningmastery.com/multi-output-regression-models-with-python/

随机森林在这里可以很好地工作,因为它是一个决策树。在调用之前RandomForest,您必须使用OneHotEncode分类变量,例如 Butter Flour Eggs ... 因为回​​归量或分类器(无论您喜欢哪个)都不能处理字符串和 NaN 值。

https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegressor.html