在进行多元回归时对每个变量进行不同的转换是否可行

机器算法验证 回归 分类 随机变量
2022-04-03 16:35:42

我有一个包含 10 个变量的数据集......在进行多重回归时以不同方式转换每个变量是否可行......

例如
new_V1 = log(v1)

新_V2= V2^2

新_V3= 1/V3

对于不同的变量同样不同,然后应用多元回归?

1个回答

是的。当然。关键是要理解,在“线性回归”表达中,“线性”一词的意思是“相对于变量前面的系数是线性的”。因此,您不仅可以对每个变量进行不同的转换,还可以对每个变量进行两次不同的转换,并将两者都包含在回归中。但是,您应该记住,理想情况下,您的变量应该彼此不相关并且大致相同。

如果您使用的是 R,您可以直接在公式中转换变量,而无需更改数据框

lm(y ~ I(log(v1)) + I(v2^2) + I(1/v3), data=data)

在这种情况下,如果要对另一个数据帧进行预测newdata,可以直接使用(无需更改)。

或者,您可以在数据框中“手动”转换变量(引入新列,有或没有消除旧列)并使用新变量

lm(y ~ new_v1 + new_v2 + new_v3, data=data)

要在这种情况下进行预测,您需要以newdata与在data.

这两个“实现”的结果将是相同的。两者都是线性回归。