我有一个数据集,询问人们是否去过某个地方(例如 A、B、C、D),他们可以做出多个选择,然后从他们的鼻子中取出一个标本,看看他们是否感染了某种疾病。
我需要找出一个人去某个地方被感染的相对风险,我现在只能想到逻辑回归,还有其他建议吗?
谢谢。
我有一个数据集,询问人们是否去过某个地方(例如 A、B、C、D),他们可以做出多个选择,然后从他们的鼻子中取出一个标本,看看他们是否感染了某种疾病。
我需要找出一个人去某个地方被感染的相对风险,我现在只能想到逻辑回归,还有其他建议吗?
谢谢。
您仍然可以使用逻辑回归,因为您的结果是二分法,感染与未感染。我只是简单地采用虚拟变量方法并且不使用旅行作为参考类别(即对于您的每个地方,如果他们访问了那个地方,您有一个变量编码为 1,如果他们没有访问那个地方,则编码为 0)。因此,如果您将 beta 系数转换为赔率(即对数赔率求幂),则位置 A 的虚拟变量的解释将是访问位置 A 与不访问位置 A 的优势比,以控制一个访问过的其他地方。另请注意,在这种方法中,多重共线性是一个问题(例如,如果许多前往 A 的人也前往 B,则可能会使他们的每个系数产生偏差)。