我有关于企业的真实世界数据集(120 个数据点),包含4 个特征。我想根据这些特定特征的价值(官方要求)将这些企业准确地分为 4 类。我可以找到一个以特征为参数的方程;或找到每个特征的3 个阈值,这会将我的数据分为 4 个不同的类别。没有其他输入。我尝试了 KMeans,但我想要更多的见解。
如何确定使用哪种方法,以及如何计算阈值?谢谢你。
我的数据看起来像这样(简化):
| 企业 | 在职员工人数 | 收入(货币单位) | 支出(货币单位) | 投资(货币单位) |
|---|---|---|---|---|
| 第一的 | 1200 | 120 | 110 | 20 |
| 第二 | 5 | 60 | 70 | 30 |
| ... | ... | ... | ... | ... |
| 最后的 | 125 | 50 | 55 | 70 |