我的情况是:
我有 1 个连续因变量和 1 个连续预测变量,我已经对其进行了对数转换,以将它们的残差归一化以进行简单的线性回归。
对于如何将这些转换后的变量与其原始上下文相关联,我将不胜感激。
我想使用线性回归根据学生在 2010 年缺课的天数预测 2011 年缺课的天数。大多数学生缺课 0 天或仅几天数据正向左偏斜。因此,需要进行转换以使用线性回归。
我对这两个变量都使用了 log10(var+1)(我对缺课 0 天的学生使用了 +1)。我使用回归是因为我想添加分类因素 - 性别/种族等。
我的问题是:
我想反馈的观众不会理解 log10(y) = log(constant) + log(var2)x(坦率地说我也不理解)。
我的问题是:
a)是否有更好的方法来解释回归中的转换变量?即在 2010 年永远错过 1 天,他们将在 2011 年错过 2 天,而不是在 2010 年永远改变 1 个对数单位,2011 年会有 x 个对数单位变化?
b) 具体来说,鉴于此来源引用的段落如下:
“这是对数学标准化考试成绩增加一个单位的负二项式回归估计,因为模型中的其他变量保持不变。如果学生将她的数学考试成绩提高一分,则对数的差异预期计数预计将减少 0.0016 个单位,同时保持模型中的其他变量不变。”
我想知道:
- 这段话是说变量数学的分数每增加一个单位就会
UNTRANSFORMED导致常数 (a) 下降 0.0016,所以如果UNTRANSFORMED数学分数上升两分,我从常数 a 中减去 0.0016*2? - 这是否意味着我通过使用指数(a))和指数(a + beta * 2)得到几何平均值,并且我需要计算这两者之间的百分比差异来说明预测变量有什么影响/有因变量吗?
- 还是我完全错了?
我正在使用 SPSS v20。很抱歉在一个很长的问题中提出这个问题。