你怀疑你的教授误解了你是对的。
正确的答案是,对于教师专业知识驱动的学生成绩提高百分比,我们无话可说。什么都没有。
为什么会这样?报价是根据方差解释的。解释的方差与测量量表的实际值无关 - 学生成绩的任何百分比提高都将被考虑在内。两者是完全分开的。
让我们看一个例子。下面是一些模拟数据:
代码:
nn <- 1e2
set.seed(1) # for reproducibility
teaching_expertise <- runif(nn)
student_achievement <- 5+0.1*teaching_expertise+rnorm(nn,0,0.05)
model <- lm(student_achievement~teaching_expertise)
plot(teaching_expertise,student_achievement,pch=19,las=1,
xlab="Teaching Expertise",ylab="Student Achievement")
abline(model,col="red")
请注意,这model
是正确指定的:学生成绩线性取决于教学专业知识,这就是我所建模的。这里没有便宜的技巧。
我们有R2= 0.30,因此教学专业知识确实占学生成绩的 30%(见此处):
> summary(model)
Call:
lm(formula = student_achievement ~ teaching_expertise)
... snip ...
Multiple R-squared: 0.304, Adjusted R-squared: 0.2969
然而,这是我们预测的最底层教师(教学专业知识为 0)与最顶端教师(1)的学生成绩:
> (foo <- predict(model,newdata=data.frame(teaching_expertise=c(0,1))))
1 2
4.991034 5.106651
改进的顺序是5.11 - 4.994.99≈ 2.4 %.
> diff(foo)/foo[1]
2
0.02316497
(另外,这是预期的成就。实际的成就会有所不同。随着回归平均值通常在极端情况下更强,实际差异会更小。)
你知道吗?我们可以将此百分比更改更改为几乎任何我们想要的数字。甚至是负百分比的改善!如何?只需在上面的数据模拟中更改那个无害的数字5
,即截距。
这是怎么回事?方差解释测量模型减少(平方和)残差的量,即回归线的残差与总体平均值的残差之间的差异。通过改变截距(the 5
),我们可以上下移动一切。包括整体平均水平。因此,更改截距将使方差解释完全不变。(如果你有 R,试试这个。我们会等。)
但是,上下移动所有内容都会改变具体分数。特别是“好”老师与“坏”老师的百分比提高。如果我们将所有内容都降低得足够多,那么“坏”老师的学生成绩就会很差。“好”老师相对于负基线的积极变化会给你带来负百分比的改进。(再一次,试试这个。截取-1
作品。)
是的,当然,这种负百分比改进在这里毫无意义。这只是说明方差解释与测量改进百分比之间存在零关系的事实。