我对 ML 和 scikit-learn 都很陌生。我注意到一些在线示例教程和代码使用 patsy 的 dmatrices 为逻辑回归准备数据。我不明白为什么要这样做。例子
例如,在上面的情况下,直接使用数据集中的数据来训练逻辑回归模型还不够吗?使用 patsy 到底有什么意义?
谢谢!
我对 ML 和 scikit-learn 都很陌生。我注意到一些在线示例教程和代码使用 patsy 的 dmatrices 为逻辑回归准备数据。我不明白为什么要这样做。例子
例如,在上面的情况下,直接使用数据集中的数据来训练逻辑回归模型还不够吗?使用 patsy 到底有什么意义?
谢谢!
主要是方便。在这种特殊情况下,它会处理 one-hot 编码分类变量,例如C(occupation).
patsy还负责其他事情,比如删除缺失值的行并添加一个常量截距变量。