回归模型预测的数据源:机器学习

数据挖掘 机器学习
2021-09-29 00:25:51

我正在尝试使用亚马逊机器学习,但我拥有的数据集很小。我要建立的模型是基于回归的预测,我希望数据集属于的领域是金融,比如产品价格预测,基于宏观/微观经济因素的价格和需求预测。

我正在寻找包含导致产品或商品价值变化的因素的数据集。例如,我想预测 1 单位涤纶纱 1 年后的价值。影响纱线价格的因素有——原油价格、国家 GDP、IIP 数据、通货膨胀等。所以我想要一个数据集,其中包含最终价格所依赖的这些因素的报价。

我发现自己组装这些数据有困难,因为我不知道导致某个预测价格的所有因素。有谁知道我可以从听起来可能包含这些因素的数据集开始?

3个回答

互联网上有多个可用的数据集,但您需要为其中的大部分付费。最好的开始数据集之一(而且它是免费的)是Quantquote 免费数据集

你可以从这里下载。

这是描述(从他们的网站借来的):

对于当前在标准普尔 500 指数中活跃的所有代码,每日分辨率数据的收集可以追溯到 1998 年。它每季度更新一次,最后一次更新是 07/31/2013。

房价是一个流行的回归数据集。是一个例子。

汽车价格是另一个受欢迎的选择。是一个例子。

请记住,机器学习中没有“免费午餐”。模型往往不会跨领域泛化。

转到UCL 机器学习存储库您将通过算法找到各种数据集。

例如:回归、分类、聚类等。

我向你保证,这对练习算法很有帮助。