我正在尝试找出一种方法来计算承租人进行 > 1 次预订的概率。我更喜欢在这个项目中使用 Python。我准备好了以下列:State、Category(乐趣、冒险等)、returning_renter?(如果 >= 1 预订则为真)。
这个项目最有效的方法是什么?您会推荐任何特定的 Python 库吗?
我正在尝试找出一种方法来计算承租人进行 > 1 次预订的概率。我更喜欢在这个项目中使用 Python。我准备好了以下列:State、Category(乐趣、冒险等)、returning_renter?(如果 >= 1 预订则为真)。
这个项目最有效的方法是什么?您会推荐任何特定的 Python 库吗?
您可以在Orange中简单地对您的解决方案进行原型设计(它是一个在底层使用scikit-learn的 Python 库)。它还具有简洁的 GUI。
但是只有两个功能(state
和renting_reason
),恐怕您的模型可能不像您希望的那样精确,除非您有很多示例可以学习。
使用 python 时,“标准”方法是使用numpy库进行数据操作。如果你有更复杂的需求pandas库也是一个很好的主意。
为了训练预测模型,我强烈推荐scikit-learn。它提供了广泛的机器学习算法,并且有非常好的在线文档和示例。
根据您的需要,可能会有更有效的方法,但根据经验,您使用上述库的实现就足够了。
如果您不处理大型数据集,我建议您使用pickle来保存中间 python 对象,而不必再次重新计算它们。