我有以下数据集: https ://www.kaggle.com/carolzhangdc/imdb-5000-movie-dataset
我想找到的是基于每个国家/地区每种类型的 imdb 分数的集群。我创建了一个 pandas 数据框,其中包含每个国家/地区的每种独特类型的平均 imdb 评分。
数据框如下所示:
country object
genre object
avgRating float64
dtype: object
由于国家和类型列包含字符串,因此我不能为此使用 Kmeans。
无论如何我可以实现我想要的吗?