如何对时间疾病数据进行分类

机器算法验证 机器学习 分类
2022-04-11 06:03:45

我有一些关于 H1N1 传播的数据。三大类人群是未感染者、感染者和携带者。这是一个时间数据,因为测试是每月进行的(Month0Month1

流动的动态是这样的: 未感染 我有一些 H1N1 传播的数据。三大类人群是未感染者、感染者和携带者。这是时间数据,因为测试是每月进行的(Month0,Month1

以下是可能性:

  1. 未感染的载体(双向)
  2. 受感染的载体(双向)
  3. 未感染的载体(单向)

Uninfected+Carrier+Infected=9500(即,同一个人接受了的测试)。每个患者记录是一个行乘列的矩阵,即参数的值。我有所有这些州的的数据,然后是的数据。Month0Month124410244Month0Month1

我必须开发一个预测模型,可以将新患者分类为这些类别。哪种算法/模型可以解决这个问题?

PS:数据大小等于,每个(2个月)。每条记录9500=244×10

数据流

2个回答

我鼓励您从简单的分类技术开始。通常是逻辑回归。非常简单,运行速度很快,R 网上有很多例子。一个简单的决策树也是一种选择(如果你不需要,不要去随机森林)。

从这些开始,因为它们很容易理解并且在 R 中有很好的实现。

这将使您能够对新患者进行分类。如果你想预测状态的变化并像那样思考,那么它会变得更加复杂,并且需要其他技术 - 但仅限于正确表达的问题。

Python scikit-learn 允许像您正在寻找的那样进行分析:scikit-learn RBF SVM