在 Coursera 的 ML 课程之后,我刚刚开始研究一个相对较大的数据集。尝试在https://archive.ics.uci.edu/ml/datasets/YearPredictionMSD上工作。使用倍频程梯度下降的线性回归训练和测试集的准确度为 5.2。
我尝试添加所有可能的二次特征(515345 个实例和 4275 个特征),但代码不会停止在我的 HP Pavilion g6 2320tx 中执行,在 Ubuntu 14.04 中有 4GB RAM。
这是否超出了 Octave 的数据大小容量?