动态属性集的机器学习算法

数据挖掘 机器学习 Python
2022-03-02 08:07:55

我是机器学习编程的新手,正在开发一个应用程序,该应用程序将计算属性的权重,以计算工作流中某些任务的 ETAT(估计周转时间)。属性集不是固定的。

例如:ETAT 将取决于-

  1. 语言
  2. 房产数量
  3. 经验水平的资源等等。

对于每个工作流实体,可以有一组这些属性,即单个工作流可能如下:

  • 英语语言
  • 物业数量 - 1200
  • 资源经验等级 - 专家

  • 语言 - 俄语

  • 物业数量 - 21000

  • 资源的经验等级 - 基本

现在对于上面的一组属性,我该如何设计我的机器学习算法呢?任何指针都会非常有用。

1个回答

我会训练一个伽马分布的 GLM每种语言一个。现在,我假设参数集在每种语言中都是固定的。您可以使用虚拟编码(即,将它们视为分类变量)合并序数变量(基本 -> 中级 -> 专家)。如果没有中间级别,一位就可以(0 = 基本,1 = 专家)。其他属性以此类推。

您可以找到免费软件以各种语言实现 GLM,包括pythonR。