假设我有一个这样的数据集:
Hotel HasPool AvgPrice
1 1 $123
2 0 $234
3 1 $200
目前我已将数据集分解为 2 个(一个包含所有连续的,其他所有分类的)。连续的,我计算欧几里得距离 b/w 所有观察,而对于分类的,我计算余弦距离。有没有办法有效地结合两个分数。或者,是否有适用于两种数据类型的距离函数?我的最终输出应如下所示:
Hotel 1 2 3
1 1 0.3 0.7
2 0.3 1 0.5
3 0.7 0.5 1
任何帮助将不胜感激!谢谢