如何获取大数据集?

数据挖掘 大数据
2021-09-18 16:58:21

这听起来像是转储问题,但作为初学者,我真的很困惑。

对于我的学术论文,我选择了一篇关于医疗保健领域大数据的会议论文。现在,问题是获取数据集。

我找不到任何资源来下载数据集来处理它。当我用谷歌搜索时,人们建议了一些非常好的资源,但这些文件并不大,不能称为大数据。在这一点上我真的很困惑,无法从任何人那里得到正确的答案。

我在想,可能是我们在小批量数据集上工作,并进一步将模型应用于生产领域的大数据。然而,这只是一个假设。我想知道,对于学术层面的论文或分析研究,我们可以免费下载现实生活中的大数据集吗?

如果我遗漏了什么,请纠正我。提前致谢。

1个回答

看看https://goo.gl/yCZvSb,Gapminder健康数据集的视图。在 519 中,您可能会找到一个合适的。

就您的论文而言,我鼓励您将大数据视为具有 n >> 典型临床试验的高维数据。如果您发现除生命统计数据以外的与健康相关的观察数据,例如涉及甚至 10^9 尺度数据的出生/死亡人数,我会感到非常惊讶。