随着计算机变得越来越大、越来越快,构成单一数据的概念正在发生变化。
例如,在纸笔世界中,我们可能会随时间读取温度并获得时间序列,其中单个数据是时间、温度对。然而,现在通常希望对整个时间序列进行分类,在这种情况下,我们的整个温度时间序列将只是由大量独立时间序列组成的数据集中的单个数据点。在图像处理中,三元组不是一个基准,但这样的值的整个网格是一个单一的基准。对于激光雷达数据和所有其他领域,以前被认为是数据集的东西现在最好被认为是数据。
本身由数据集组成的数据集的术语是什么?
我应该认为,“元数据”一词已被占用。
是否有任何论文讨论了从数据集到数据集的转变?对数据科学家和研究人员有何影响?