- 我正在开发一个基于搜索查询按上下文向客户显示产品的项目。例如,我不希望客户必须输入特定的产品名称,而是根据功能进行搜索(例如,“墙壁不太热”会返回产品名称,例如“Whirlpool NEO IC355 ROY 3S 340 L Double Door Refrigerator ")
- 我有一个由功能相关产品组成的训练集。我打算使用逻辑回归来训练这些数据的模型。如何在 Python 中处理这些数据或提取特征以输入逻辑回归?我听说过“词袋模型”,但不确定如何使用它,或者它甚至适用于这里?
我知道有很多可用的 NLTK 库。但是,我想从头开始实现它,或者尽可能使用最少的外部库。
请帮助或有任何资源可以参考?