我正在尝试进行线性回归。
我的变量通常很小,约为 0 到 0.3
我有一些变量(分别对它们进行回归首先)虽然这非常大。我有一些30,000 个变量。我被告知我应该重新设置这些变量。
我的问题是这会有什么不同吗?还有什么是最好的方法来改变这些变量假设线性关系?
我正在尝试进行线性回归。
我的变量通常很小,约为 0 到 0.3
我有一些变量(分别对它们进行回归首先)虽然这非常大。我有一些30,000 个变量。我被告知我应该重新设置这些变量。
我的问题是这会有什么不同吗?还有什么是最好的方法来改变这些变量假设线性关系?
使用输入日志将使您的模型非线性,但这可能是您想要的。对于财务数据,自然对数通常使模型更具可预测性。
通常,如果您要使系数具有相同的比例,则可以通过以下方式对输入进行归一化: x=(x-mean(x))/stdev(x)
话虽如此,只要软件显示所有数字,您是否不重新调整输入实际上并不重要。但是,由于比例不同,您将无法通过系数幅度看到特定输入的影响。
自变量的值与依赖相比非常高,-value 会非常小,会有很多错误,例如.......采样错误,舍入错误。
是的!你真的需要变基, 最好的办法是取日志