我有一个面板数据集(国家和年份),我想按国家/地区对其进行聚类分析。我的数据集有大约 20 个变量。
这是我的面板数据的摘要:
panel variable: country (strongly balanced)
time variable: year, 2010 to 2013
仅对 2013 年的数据进行 kmeans 聚类分析非常简单。但是,考虑到 2010-2013 年期间的所有观察结果,您将如何进行分析?k-means 聚类是一种合适的方法吗?
以下是我仅在 2013 年在 Stata 中运行的内容:
cluster kmeans var1 var2 var3 var4 var5 var6 if year==2013, k(4) name(test1)
谢谢!