我试图了解线性回归参数的置信区间。在此链接Derive Variance of regression coefficient in simple linear regression提供了答案。但是,我在推导中没有完全理解。我们是否将回归参数视为随机变量?
这就是以下回归中的随机变量: 我了解,只有是具有均值 0 和方差的随机变量。考虑作为常数也成为随机变量,均值和方差 ,从中可以计算置信区间。
但是,对于回归系数,也计算置信区间。你能澄清一下回归中的随机变量吗?
谢谢。
我试图了解线性回归参数的置信区间。在此链接Derive Variance of regression coefficient in simple linear regression提供了答案。但是,我在推导中没有完全理解。我们是否将回归参数视为随机变量?
这就是以下回归中的随机变量: 我了解,只有是具有均值 0 和方差的随机变量。考虑作为常数也成为随机变量,均值和方差 ,从中可以计算置信区间。
但是,对于回归系数,也计算置信区间。你能澄清一下回归中的随机变量吗?
谢谢。
我来自不同的领域,使用不同的语言,但也许这会有所帮助。
想象一下做一个实验。是一组给定值,一个“自变量”。不是随机的。对于这些值中的每一个,您测量一个因变量。据推测,以确定性(非随机)方式取决于,但您的测量结果也会受到一些噪声的影响。因此,是一个随机变量。
当您计算线性回归的系数时,和(它们是“真实”的估计,非随机和),它们的值取决于,因此它们也是随机的。如果您再次重复您的实验,对于相同的值,您将得到(稍微或不稍微)不同的,然后将计算不同的和 。
最后,请注意和用线性表示。因此,和成正比。
误差是唯一的随机变量。假设 X 是固定的,但如果您假设线性,则可以推广到 X 的其他值。当然,外推是非常冒险的,而且很少被证明是合理的。