线性回归缩放自变量

机器算法验证 回归 多重回归
2022-04-13 09:00:11

我正在尝试进行线性回归。

我的y变量通常很小,约为 0 到 0.3

我有一些x变量(分别对它们进行回归y首先)虽然这非常大。我有一些x30,000 个变量。我被告知我应该重新设置这些x变量。

我的问题是这会有什么不同吗?还有什么是最好的方法来改变这些x变量假设线性关系?

2个回答

使用输入日志将使您的模型非线性,但这可能是您想要的。对于财务数据,自然对数通常使模型更具可预测性。

通常,如果您要使系数具有相同的比例,则可以通过以下方式对输入进行归一化: x=(x-mean(x))/stdev(x)

话虽如此,只要软件显示所有数字,您是否不重新调整输入实际上并不重要。但是,由于比例不同,您将无法通过系数幅度看到特定输入的影响。

自变量的值x与依赖相比非常高y,β-value 会非常小,会有很多错误,例如.......采样错误,舍入错误。

是的!你真的需要变基x, 最好的办法是取日志

lny^=βlnx^+α

lny=βlnx+α+ϵ  ........ϵ is error
注意:- 线性形式在与协变量相关的回归参数中是线性的。

非线性回归