背景: 我正在尝试使用 Orange 来根据患者的咳嗽声对患者是否患有结核病进行分类。
在数据集中,假设有 100 名患者,每个患者咳嗽 10 次。对于每次咳嗽,我们都有一个完整的特征向量(170 个特征)。
给 Orange 这个数据集并训练各种学习算法相当简单,但我遇到的问题是 Orange 会认为每个特征向量独立于另一个特征向量,这意味着它将认为每个患者的每次咳嗽都是独立的,并且他们不是。
所以我的问题是:有没有办法告诉橙色一个病人的所有 10 次咳嗽都属于那个病人,并且在执行留一法或交叉验证方法时,每个病人的所有咳嗽都应该排除在每个折叠中?