为什么使用 patsy 为逻辑回归准备数据?

数据挖掘 Python 逻辑回归
2022-02-20 05:39:16

我对 ML 和 scikit-learn 都很陌生。我注意到一些在线示例教程和代码使用 patsy 的 dmatrices 为逻辑回归准备数据。我不明白为什么要这样做。例子

例如,在上面的情况下,直接使用数据集中的数据来训练逻辑回归模型还不够吗?使用 patsy 到底有什么意义?

谢谢!

1个回答

主要是方便。在这种特殊情况下,它会处理 one-hot 编码分类变量,例如C(occupation).

patsy还负责其他事情,比如删除缺失值的行并添加一个常量截距变量。