我有两个形状为 (329, 159) 和 (26,24) 的数据集。它们都是 one-hot 编码的。较小数据集中的列存在于较大数据集中。较小的数据集具有我需要应用于较大数据集的分数。
例如:如果一个数据集的性别在较大的数据集中是 M,那么根据较小的数据集,它应该得到 0.80 作为分数。如何比较这两个数据集并分配分数?
我有两个形状为 (329, 159) 和 (26,24) 的数据集。它们都是 one-hot 编码的。较小数据集中的列存在于较大数据集中。较小的数据集具有我需要应用于较大数据集的分数。
例如:如果一个数据集的性别在较大的数据集中是 M,那么根据较小的数据集,它应该得到 0.80 作为分数。如何比较这两个数据集并分配分数?