假设我们有病例对照数据,其中病例有某种疾病() 和控件没有,我们对其他一些变量的关联感兴趣 ()。我知道在这种情况下,由于实验设计(疾病的边际分布由抽样确定),我们不能将疾病用作响应变量。
我也知道优势比可以在这样的设计中计算,因为在使用条件分布时它采用相同的值或者.
我的问题是:在这种情况下使用逻辑回归来模拟疾病几率是否合适?IE
背景:GWAS(全基因组关联研究)通常是病例对照研究,人们想要评估疾病与特定 SNP 的次要等位基因数量之间的关联。-值通常从独立性的卡方检验中获得。但是,这不允许您添加其他协变量。许多提供 GWAS 分析的软件包还允许您进行逻辑回归。我只是想验证做这样的分析是否有效。