大数据三个V的例子?
数据挖掘
大数据
2022-02-12 10:25:47
3个回答
容量:
简单地说,大数据对于在一台计算机上工作来说太大了。这是一个相对的定义,在今天的电脑上不能用的东西,在未来的电脑上很容易用。
- 一次谷歌搜索使用了整个阿波罗太空任务的计算能力。
- Excel 过去在单个电子表格中最多可容纳 65k 行。现在它拥有超过一百万。
速度:
数据进来的速度非常快。数百个案例的传统科学研究方法可能需要数周、数月甚至数年的时间来分析和发表。
- 鸢尾花数据集
- 统计编程语言 R
- Twitter Firehose(每秒 6,000 条推文)
多样性:
包含在一种特定数据类型中或不适合关系数据库格式的大数据。这些数据通常以非结构化文本的形式出现。
- 估计 80% 的企业数据是非结构化数据
- 开放数据(政府)
- noSql 数据库
鸢尾花数据集: https ://en.wikipedia.org/wiki/Iris_flower_data_set
开放数据: https ://www.data.gov/open-gov/
IBM 数据科学家将大数据分为四个维度:数量、种类、速度和准确性。此信息图解释并给出了每个示例。
http://www.ibmbigdatahub.com/infographic/extracting-business-value-4-vs-big-data
并且这张图片完美地总结了整个大数据和以上两个答案,并以一个涵盖所有参数的示例。 http://www.ibmbigdatahub.com/infographic/four-vs-big-data
其它你可能感兴趣的问题