我正在阅读一个演示文稿,它建议不要使用留一编码,但可以使用一种热编码。我以为他们两个是一样的。谁能描述它们之间的区别是什么?
一种热编码和留一种编码有什么区别?
数据挖掘
机器学习
数据挖掘
特征选择
特征提取
特征工程
2021-10-10 01:43:32
1个回答
他们很可能是在用“留一码”来指代 Owen Zhang 的策略。
从这里
编码列不是传统的虚拟变量,而是此分类级别的所有行的平均响应,不包括行本身。这为您提供了分类的单列表示同时避免直接响应泄漏的优势