我目前正在研究一个问题,其中我们有一个小数据集,并且对治疗对结果的因果关系感兴趣。
我的顾问指示我对每个预测变量执行单变量回归,结果是响应,然后是治疗分配作为响应。即,我被要求一次用一个变量拟合回归并制作结果表格。我问“我们为什么要这样做?”,答案是“我们感兴趣的是哪些预测因子与治疗分配和结果相关,因为这可能表明存在混杂因素”。我的顾问是一位训练有素的统计学家,而不是不同领域的科学家,所以我倾向于相信他们。
这是有道理的,但不清楚如何使用单变量分析的结果。从中进行模型选择会不会导致估计的显着偏差和狭窄的置信区间?为什么有人要这样做?我很困惑,当我提出这个问题时,我的顾问对这个问题相当不透明。有没有人有这个技术的资源?
(注意:我的顾问说我们没有使用 p 值作为截止值,但我们要考虑“一切”。)