我正在构建一个模型,该模型具有一些分类变量作为输入。我之前已经处理过这类数据,并应用了不同的技术来创建虚拟变量和因子评分。但是,我现在有一个不同类型的问题,我看不到明显的最佳答案。
对于每个人,我们可以有这个分类变量的多个实例。当这种情况发生在数值变量上时,我通常根据上下文取最大值/平均值/最小值。我当然可以使用所说的上下文在这里构建类似的东西。但是,我对一般方法感到好奇。
假设对于每个对象(输入矩阵中的行),我们可以有一个分类变量的多个条目。此外,假设所述变量可以具有许多不同的值,并且对于上下文,它可以与每行的组合相关。
这个变量的一般方法是什么?