多年来数据集的大小

数据挖掘 数据集 统计数据 大数据 搜索
2022-03-02 14:22:12

我正在寻找统计数据,以了解多年来(公共)数据集大小的演变。

我刚刚发现了以下统计数据:

  • KDnuggets的民意调查实际上显示多年来的情况如下:

千兆字节仍然占主导地位:大多数答案(2018 年 56%、2016 年 57%、2015 年 56%、2014 年 54%、2013 年 53%)都在千兆字节范围内。自 2012 年以来,每年的总体响应中值再次介于 11 和 100 GB 之间(可轻松放入一台笔记本电脑)。

你知道在哪里可以找到更好的统计数据吗?

我猜数据集的平均大小增加了。如果没有,我想看看至少可用的公司数据的大小是否有所增加。

1个回答

在看了你引用的KDNuggets的文章之后,他们在这篇文章中分析了去年的数据(民意调查),但他们已经这样做了好几年了。

也许通过查看过去几年,您可以提取一些更好的数据。

同样在这个其他论坛https://opendata.stackexchange.com/ 他们谈论开放数据,也许在这里您可以获得更准确的答案

KDD 掘金数据历史