我举一个简单的例子:我有一组具有不同特征(# 个房间、周长、# 个邻居等)的房子,差不多 15 个,并且每个房子都有一个价格值。这些特征也非常相关(即周长通常与#rooms 相关)。我想确定决定价格的主要特征(或它们的非线性组合)是什么。
例如,在线性情况下,我可以计算 Lasso 回归并通过系数查看每个特征的重要性。就我而言,每个功能(或它们的组合)都有非线性影响。例如,邻居的数量可以产生二次影响(如果 #neighbours < 10 则增加价格,如果 > 10 则降低价格)。
我想确定功能和价格之间的主要重要关系。我不需要预测器。例如,最后我会发现价格主要取决于#rooms/perimeter 和#neighbours^2。
我正在考虑将内核方法与回归或 PCA 结合使用。但我对内核方法知之甚少。
先感谢您。