我是机器学习的新手,但我有一个课程可以创建可以从给定文本中提取一些具体特征的程序。
例如:如果我想提取红苹果和青苹果的数量,我会从“在那棵树上长出 3 个红苹果和 5 个青苹果”中提取 3、5 和从“盒子里有 1000 个青苹果”中提取 10、1000和 10 个红色”。实际上,实际示例可能更复杂,例如从广告中提取汽车规格。
具体特征在数据集处理之前是已知的。
你能建议我应该使用什么样的算法吗?以前,我只使用线性回归。
我是机器学习的新手,但我有一个课程可以创建可以从给定文本中提取一些具体特征的程序。
例如:如果我想提取红苹果和青苹果的数量,我会从“在那棵树上长出 3 个红苹果和 5 个青苹果”中提取 3、5 和从“盒子里有 1000 个青苹果”中提取 10、1000和 10 个红色”。实际上,实际示例可能更复杂,例如从广告中提取汽车规格。
具体特征在数据集处理之前是已知的。
你能建议我应该使用什么样的算法吗?以前,我只使用线性回归。
我想如果你知道你想提取什么,你可以使用整数或汽车规格的正则表达式找到它。