大数据三个V的例子?

数据挖掘 大数据
2022-02-12 10:25:47

大数据的三个 V 有哪些例子?三个 V 代表:音量、速度、多样性。

参考:
大数据三V,挪威科技大学提供。
https://www.ntnu.edu/ime/bigdata/what-is

3个回答

容量:
简单地说,大数据对于在一台计算机上工作来说太大了。这是一个相对的定义,在今天的电脑上不能用的东西,在未来的电脑上很容易用。
- 一次谷歌搜索使用了整个阿波罗太空任务的计算能力。
- Excel 过去在单个电子表格中最多可容纳 65k 行。现在它拥有超过一百万。

速度:
数据进来的速度非常快。数百个案例的传统科学研究方法可能需要数周、数月甚至数年的时间来分析和发表。
- 鸢尾花数据集
- 统计编程语言 R
- Twitter Firehose(每秒 6,000 条推文)

多样性:
包含在一种特定数据类型中或不适合关系数据库格式的大数据。这些数据通常以非结构化文本的形式出现。
- 估计 80% 的企业数据是非结构化数据
- 开放数据(政府)
- noSql 数据库

鸢尾花数据集: https ://en.wikipedia.org/wiki/Iris_flower_data_set
开放数据: https ://www.data.gov/open-gov/

实际上,定义大数据的是四个V。

在 CrossValidated 上对类似问题的回答解释了四个 V。

正如@MikeStratton 已经巧妙地解释了三个 V,我将解释第四个 V,即Veracity

准确性是数据的不确定性。

示例可能是数据质量差、调查数据不足等。这使得拟合模型高度偏颇且容易出错。

您可能还想看看这个讨论

IBM 数据科学家将大数据分为四个维度:数量、种类、速度和准确性。此信息图解释并给出了每个示例。

http://www.ibmbigdatahub.com/infographic/extracting-business-value-4-vs-big-data

并且这张图片完美地总结了整个大数据和以上两个答案,并以一个涵盖所有参数的示例。 http://www.ibmbigdatahub.com/infographic/four-vs-big-data