我正在做一个项目,我们观察一项任务的行为(例如响应时间),并将这种行为建模为几个实验操作变量以及几个观察到的变量(参与者性别、参与者智商、对后续事件的响应)的函数-上问卷)。我不担心实验变量之间的多重共线性,因为它们被专门操纵为独立的,但我担心观察到的变量。但是,我不确定如何评估观察到的变量之间的独立性,部分原因是我似乎得到了一些不同的结果,具体取决于我设置评估者的方式,也因为我不太熟悉其中一个或两个变量都是二分法。
例如,这里有两种不同的方法来确定性别是否独立于智商。我不喜欢零假设显着性检验,因此在这两种方法中我都建立了两个模型,一个有关系,一个没有,然后计算和 AIC 校正的对数似然比:
m1 = lm(IQ ~ 1)
m2 = lm(IQ ~ sex)
LLR1 = AIC(m1)-AIC(m2)
m3 = glm(sex~1,family='binomial')
m4 = glm(sex~IQ,family='binomial')
LLR2 = AIC(m3)-AIC(m4)
然而,这些方法产生的答案有些不同。LLR1 约为 7,表明支持关系的有力证据,而 LLR2 约为 0.3,表明支持关系的证据非常弱。
此外,如果我尝试评估性别与另一个二分观测变量“yn”之间的独立性,则生成的 LLR 同样取决于我是否建立了模型来预测来自 yn 的性别,或者预测来自性别的 yn。
关于为什么会出现这些差异以及如何最合理地进行的任何建议?