我最近通过逻辑回归对某些数据进行建模的各种努力……都没有成功。虽然还有更多数据需要查看,但我也一直想探索数据中的非线性依赖关系。
是否有比逻辑回归(或一般的线性回归)具有更好拟合能力的技术仍然保持易于解释和解释能力(即不是神经网络或其他“黑匣子”技术)?
我最初的直觉是将变换应用于各个变量及其组合。对于变量, 可能性包括采取,, 或者等三阶关系(即) 将被省略,因为它们不容易可视化或绘制图表。
不用说,即使对于少量的变量,这些转换后的变量的数量也很容易膨胀到难以处理的大小,而要系统尝试的这些变量的组合数量也同样巨大。此外,给定变量的各种变换之间会存在多重共线性问题.
编辑:我现在正在考虑对连续变量使用正交多项式,对不同类型的分类变量使用逻辑组合( $x_i & x_j* )。我觉得我在这里重新发明了轮子,但仍然没有找到关于明智地做这类事情的有用信息。任何帮助将不胜感激。