问题 1的答案将取决于您的研究问题以及结果的受众。
如果您的研究问题指向基于 A 的概况讨论 b 的差异,那么这显然有助于构建您的摘要。在流行病学研究中,即使您不是基于 A(作为暴露/未暴露状态的自变量)进行抽样,使用此分类作为自变量 [暴露] 并将连续变量作为因变量 [结果]。听起来你已经知道这个问题的答案了。
您还应该考虑如何通过向他人展示结果(并自己解释)来解释结果。连续变量作为因变量 [结果] 模型将具有平均差(或相似)作为一个总结;作为结果的二分变量模型将具有优势比(每一个连续变量单位增加的优势的比率,可以缩放以给出例如每增加 5 公斤体重相对增加的 II 型糖尿病的可能性。)
我从咨询设置并向人们解释这一点的经验是,前者(均值差异)通常比后者(连续自变量每单位差异的优势比)更容易向其他人解释。
对于您的问题 2,如果您想运行一个多变量模型,在其中控制协变量,那么在开始时选择因/自变量将有所帮助。从单变量分析到多变量分析,最好坚持使用相同的方法,而不是在两种方法之间进行转换,只是为了便于解释。
关于后一点的最后说明:从假设检验的角度来看,具有连续自变量 [暴露] 和 [单个] 二分因变量的逻辑回归应该返回与未配对 t 检验相同的 p 值,假设变量的方差不相等颠倒了(从记忆中 - 我不完全确定这是否总是正确的。)