我目前正在尝试使用在线产品评论的数据进行 OLS 回归,我有两个问题:
我是否必须同时使用模型中的线性和二次效应,还是只在模型中保留平方变量也可以?我读到我必须同时使用两者,但我真的不明白为什么。那么为什么会这样呢?
我正在以在线产品评论的有用性得分作为因变量和评论的星级评分(1 到 5 之间的整数)作为自变量进行回归。我想加入一个平方效应,因为我假设 1 星和 5 星评级比中等评论(例如 3 星)更有帮助。当我只是对星级评分进行平方时,我得到 0、1、4、9 或 25 作为平方变量的可能值。然而,对我来说,首先从评分中减去 3,然后对变量进行平方会更有意义,因为这更好地反映了评分越极端,其有用性得分越高的假设。现在,我得到 4、1、0、1 或 4 作为平方变量的可能值。这样做有意义吗?
感谢您的回答!