我正在努力查明患者是否会在医院中患上这种疾病。
可能是基本信息,但无论如何我只是分享它。
通常通过历史数据,我能够看到在医院或重症监护室待更长时间(更多天)的患者确实患上了这种疾病。
同样,如果他处于通气状态,这也表明他的健康状况
患病和未患病的患者的住院时间和通气时间分布是不同的,我通过肉眼验证了它们。
现在我的问题是
1)我们是否需要将这些作为预测变量(输入变量)包含在我们的模型中?我问是因为我想通过使用这两个变量,模型可能会错过一些对结果有影响的其他输入变量。例如:我可能不知道他的尿素读数是否表明他是否会患病。
基本上我想知道的是我们是否应该将我们确信它们会影响模型结果的变量提供给模型?
或者是帮助我们了解我们不知道的事情的模型。
你能帮我解决这个问题吗?