是否可以在 Orange 中创建功能组?

数据挖掘 交叉验证 橘子
2021-10-03 20:37:37

背景: 我正在尝试使用 Orange 来根据患者的咳嗽声对患者是否患有结核病进行分类。

在数据集中,假设有 100 名患者,每个患者咳嗽 10 次。对于每次咳嗽,我们都有一个完整的特征向量(170 个特征)。

给 Orange 这个数据集并训练各种学习算法相当简单,但我遇到的问题是 Orange 会认为每个特征向量独立于另一个特征向量,这意味着它将认为每个患者的每次咳嗽都是独立的,并且他们不是。

所以我的问题是:有没有办法告诉橙色一个病人的所有 10 次咳嗽都属于那个病人,并且在执行留一法或交叉验证方法时,每个病人的所有咳嗽都应该排除在每个折叠中?

1个回答

这不是 Orange 特定的,而是 IIUC,您可以预处理您的数据(例如在 Python 或Excel 中),以使与同一患者行中的患者有关的 10 次咳嗽中的每一次。因此,您将拥有: 100 行患者,每行(10*170 + 其他患者数据)属性宽。