我正在尝试求解具有 40 个自变量 (x1, ..., x40) 和一个因变量 (y) 的一组方程。方程的总数(行数)约为 300,我想求解一组 40 个系数,以最小化 y 和预测值之间的总平方和误差。
我的问题是矩阵非常稀疏,我不知道用稀疏数据求解方程组的最佳方法。数据集的示例如下所示:
y x1 x2 x3 x4 x5 x6 ... x40
87169 14 0 1 0 0 2 ... 0
46449 0 0 4 0 1 4 ... 12
846449 0 0 0 0 0 3 ... 0
....
我目前正在使用遗传算法来解决这个问题,结果出来的结果大约是观察到的和预期的两倍。
任何人都可以提出不同的方法或技术来解决具有稀疏数据的一组方程。