我无法解释这个图表。我的因变量是将用于演出的电影票总数。自变量是放映前剩余的天数、季节性虚拟变量(星期几、一年中的月份、假期)、价格、迄今为止售出的门票、电影评分、电影类型(惊悚片、喜剧片等,作为虚拟变量) )。另外,请注意电影院的容量是固定的。也就是说,它最多只能容纳 x 人。我正在创建一个线性回归解决方案,它不适合我的测试数据。所以我想从回归诊断开始。数据来自我想预测需求的单个电影院。
是一个多元数据集。对于每个日期,有 90 行重复,代表演出前几天。因此,对于 2016 年 1 月 1 日,有 90 条记录。有一个“lead_time”变量,它给了我演出前的天数。因此,对于 2016 年 1 月 1 日,如果lead_time 的值为 5,这意味着它将在演出日期前 5 天之前售出门票。在因变量中,售出的总票数,我将有 90 次相同的值。
另外,顺便说一句,是否有任何书解释了如何解释残差图并在之后改进模型?