学生流失预测

数据挖掘 机器学习 分类 搅拌
2022-03-07 05:14:17

我正在研究用于学生流失预测的 ML 模型。某个学生是否会流失,这是一个分类问题。我有很多数据,比如学生数据和学生的活动。有两个问题想请教:

  1. 前 6 周的学生流失率
  2. 6 周后学生的总体流失率

你会在 6 周内和 6 周后将你的工作分成 2 个模型吗?你会如何开始这样一个项目?

1个回答

流失模型通常只是简单地预测二进制输出:学生会流失吗?是或否,10在您的情况下,有一个附加组件,即 6 周的时间因素,所以问题更多的是“学生什么时候可能流失?” .

您的数据集是否包括学生在流失(即离开课程)之前在课程上停留的时间?


在最高级别,您可以将此问题建模为分类问题或回归问题(带有一些后处理)。

分类方法

如果您选择分类,您应该将每个学生的目标变量(实际流失信息)形成几个离散的类。例如,您可以创建 3 个类:

  • 0-> 学生没有流失
  • 1-> 学生流失的时间晚于 6 周
  • 2-> 学生在 6 周内流失

然后,您可以选择任何可以使用您的数据(输入特征)的模型,并将每种情况分类为这三种情况之一。决策树之类的东西可能会很好地用作基线模型。然后,您也许可以尝试SVM 模型

回归方法

在这种情况下,您将预测每个学生流失的确切时间。为此,您的数据集必须包含例如课程中流失学生离开课程的天数或周数。

在这种情况下,您的目标变量就是这些信息,您的模型将预测数字,例如 3.7 周或 26 周;然后,您只需将这些结果后处理为您的 3 个类别(如上所列)。

在这种情况下,您可以再次尝试决策树(回归变体)或SVM 模型