现场感知分解机(FFM) 已被证明在点击率预测任务中很有用。它们的优势之一来自散列技巧(特征散列)。
当使用来自 sci-kit-learn 的散列技巧时,最终会得到一个稀疏矩阵。
那么如何使用这样一个稀疏矩阵来实现场感知分解机器呢?SKLearn 没有 FFM 的实现。
编辑 1:我想确定执行特征散列/散列技巧,以便能够将 FFM 扩展到数百万个特征。
编辑 2:Pandas 无法扩展到许多领域。我还想将任意 CSV(包含数字和分类特征)转换为 LIBFFM(字段:索引:值)格式并同时执行散列技巧(最好不使用 Pandas)。Pandas2FFM 即使在执行散列技巧之后也无法扩展。