免责声明:这是一个家庭作业项目。
我正在尝试根据几个变量提出钻石价格的最佳模型,到目前为止我似乎有一个非常好的模型。但是我遇到了两个明显共线的变量:
>with(diamonds, cor(data.frame(Table, Depth, Carat.Weight)))
Table Depth Carat.Weight
Table 1.00000000 -0.41035485 0.05237998
Depth -0.41035485 1.00000000 0.01779489
Carat.Weight 0.05237998 0.01779489 1.00000000
表和深度相互依赖,但我仍然想将它们包含在我的预测模型中。我对钻石做了一些研究,发现 Table 和 Depth 是钻石顶部的长度和从顶部到底部尖端的距离。由于这些钻石的价格似乎与美丽有关,而美丽似乎与比例有关,我打算将它们的比例包括在内,例如来预测价格。这是处理共线变量的标准程序吗?如果不是,那是什么?
编辑:这是深度图〜表: