给定排名和决定排名的因素,逆向工程排名的最佳方法是什么?

数据挖掘 回归 排行
2022-02-19 07:06:40

我有一个排名项目列表以及该组用于创建排名的因素(如大学排名:1、2、3...),我想对他们的方法进行逆向工程。

这是我尝试过的...

  • 我取了每个因素的标准分数(因素值 - 平均值/标准差)。
  • 我为每个因素分配了系数,并将所有这些产品相加来创建一个分数。
  • 我使用分数对项目进行排名,并将这些排名与真实排名进行比较,试图将差异最小化。
  • 冲洗并通过改变系数重复。

这是一种粗略的方法,我对此很陌生。我想知道最好的方法是弄清楚该组如何加权因素以创建排名。

1个回答

根据排名方案的复杂性,这可能或多或少是困难的,但如果你有所有的输入和输出,这是很有可能的。

首先绘制数据并尝试查看是否可以看到模式或任何明显的相关性,即使不一定是线性的。对每个变量都这样做。

您还可以查看每个等级的变量分布(您称之为因素),并了解它们有何不同。

一旦您对因变量(等级)和自变量(因子)之间的关系有了更好的理解,那么您可以:

  • 想出模型就在那里
  • 应用机器学习算法(线性/多项式回归、决策树等),它将为您学习模型的参数。您选择哪一个将取决于您的分析。