假设我们有一个线性回归模型, 很多时候在文学作品中假定如果由于中心极限定理我们有一个大数据集,这个假设是有意义的。我的问题是,在某些情况下,我认为正态分布的误差项是错误的假设。认为是一个有界变量,例如一个人的年龄,或者一个学生的考试成绩。那么如果在这种情况下是有界的,误差项不可能是这样的吗?超出范围?例如假设代表一个人的年龄,如果误差项是正态分布的,那么可能会发生随机事件,所以一个人有可能活到 1000 年?
因此,当线性方程左侧的因变量有界时,我们如何用误差项解决这个问题。我们可以为误差项选择另一个有界分布,例如在. 然而,这是不现实的,因为这意味着误差项中的所有事件都同样可能发生。我对这里的人们对这个问题的想法很感兴趣。
编辑:通过阅读下面的所有精彩答案和评论,这就是我要说的。将有界域分布强加于例如,特定域上的三角形密度是在。施加这些具有有界域并类似于正态分布的分布类型有什么缺点吗?