什么是大数据?

数据挖掘 数据挖掘 数据集 大数据 可视化
2022-02-24 22:40:54

我想知道什么是大数据?我可以举个实际的例子。

大数据可以有多大?我需要适用大数据术语的数字。如果您可以提供带有实际数字的案例研究链接,请参考大数据的 V。

1个回答

如果我想引用维基百科的话,大数据是海量和复杂的数据集,传统的数据处理应用软件不足以处理它们。大数据挑战包括捕获数据、数据存储、数据分析、搜索、共享、传输、可视化、查询、更新、信息隐私和数据源。有五个与大数据相关的概念:数量、多样性、速度以及最近添加的准确性和价值。

大数据可以用以下特征来描述:

  • 体积

生成和存储的数据量。数据的大小决定了它的价值和潜在的洞察力,以及它是否可以被认为是大数据。

  • 种类

数据的类型和性质。这有助于分析它的人有效地使用由此产生的洞察力。大数据来自文本、图像、音频、视频;加上它通过数据融合完成缺失的部分。

  • 速度

在这种情况下,数据生成和处理的速度,以满足增长和发展道路上的需求和挑战。大数据通常是实时可用的。

  • 变化性

数据集的不一致可能会妨碍处理和管理它的进程。

  • 真实性

捕获数据的数据质量可能会有很大差异,影响准确分析。


对我来说,大数据与深度学习时代息息相关。原因是在过去的几十年里,人们可以使用机器学习和数据挖掘对数据进行良好的描述和模型,但由于每天都有新数据出现,社交网络迅速增加,数字小工具在不同国家的普及率越来越高,处理数据并将其转换为信息和知识的需求正在增加。如果我们想使用以前的技术从原始数据中收集信息,如果可能的话,将花费太多时间来达到适当的结果。在大数据和深度学习时代,我们需要更复杂的算法和更强大的硬件来应对困难。

你也可以看看这里这里有相对不同的视角。大数据是一个术语,用于描述大量数据(结构化和非结构化数据)每天都会淹没企业。但重要的不是数据量。重要的是组织如何处理数据。可以分析大数据以获得洞察力,从而做出更好的决策和战略性业务举措。