通过总计汇总的数据与通过手段汇总的数据的术语是什么?

机器算法验证 造型 术语 测量 聚合 时空
2022-04-10 04:18:07

这两种数据的不同之处在于,如果您决定降低第一种数据的时间(时间)分辨率,则采用降低分辨率的平均值。使用第二个,您将总和超过较低的分辨率。这是一个具体的例子

Gas Used (kWh), Outside Air Temperature (C), Time Resolution (Minutes)
100, 20, 20
140, 22, 20
120, 21, 20

这里每小时(60 分钟)的分辨率数据很清楚

360, 21, 60

并通过平均温度和总结使用的气体来找到。

我真正想知道的是这些类型的数据的名称是什么。我知道这个问题不是最好的,但很难问一个你不知道名字的问题。如果您有更好的方式来表达问题,那么请继续编辑它。

2个回答

物理相加的性质称为广泛性质。质量是广泛的,就像你在天平上添加(字面意思!)重量一样。

广泛属性的一个特点是总计有意义。在您的示例中,使用的气体(以 kWh 为单位)就是一个例子。

物理上的这个词在这里并不意味着限制性的。我四月份的收入和五月份的收入可以相加,我的支出也可以相加。两者都是广泛的属性。因此,在其他非物理情况下,加法是有意义的。

如果总计有意义,那么意味着也有意义。但是,它们是否是您要使用的措施取决于您的目的。

否则,非物理相加的属性称为密集属性。温度很密集。如果你混合身体,得到的温度是某种加权平均值,当然不是总和。

这篇Wikipedia 文章从物理科学的角度说得更多。

Cox, DR and Snell, EJ 1981 强调了这一区别在统计科学中的重要性。应用统计:原理和示例。伦敦:查普曼和霍尔。请参见第 14 页。(他们使用了non-extensive这个词,我觉得这个词没有吸引力。)

在数据库应用程序/数据仓库/BI 中,通常指的是附加措施

附加示例:钱

半加法:平衡(可以跨部门汇总,但不能跨时间汇总)

非加法:比率(例如增长率等)

https://stackoverflow.com/questions/34295293/whats-the-difference-between-additive-semi-additive-and-non-additive-measures

http://www.kimballgroup.com/data-warehouse-business-intelligence-resources/kimball-techniques/Dimension-modeling-techniques/additive-semi-additive-non-additive-fact/