在哪里可以找到高度数据集或一般数据集

数据挖掘 机器学习 数据集 数据 数据库
2022-03-13 18:10:53

嗨,聪明的人,

我是数据科学的新手,想迈出我的前几步。不幸的是,我很难找到关于我感兴趣的主题的数据集或任何数据。

例如,我想构建一个简单的程序,该程序获取一个人的身高并预测他/她孩子的可能身高。(来自高尔顿的问候)

但即使对于这个比较有名的话题,我也找不到数据。

是否有任何好的网站或列出特定主题的大量数据集的东西?一个数据集的数据库,可以这么说。

我的意思是,我在互联网上,找到一些数据应该不难;)

1个回答

Galton Height 数据集似乎正是您正在寻找的

网上有大量开放数据集的存储库。对于初学者,我经常看到UCI 机器学习存储库它有很多易于使用的数据集。

数据集的其他一些资源:

  • Kaggle - 举办数据科学竞赛,但您可以在不参加竞赛的情况下下载所有数据集。
  • Data.gov - 您可以从美国政府机构免费下载数据
  • AWS 开放数据- 您需要一个 AWS 账户,但这些数据集可免费下载