更改比例时失去相关性的计算值的术语

数据挖掘 术语
2022-02-13 19:42:44

我试图找到一种在从时间尺度放大或缩小时无法简单添加或相乘的计算类型或值的术语。我知道这不是很清楚,如果是我只会谷歌这个问题。

举个例子:假设您要比较 2014 年和 2015 年的冰淇淋销量和当天的温度。如果您想按周进行分析,您可以将 7 天的销售额相加,并比较它们之间的周数,信息仍然有意义:有一个事实(该周存入银行的金额)基于与新人物相关的现实。您还可以从每周的总数中计算出每天的平均值。

但是,在现实中添加总温度没有任何意义,您需要计算此类数据的平均值。

那么,对于这种类型的值,是否有一个术语只能作为平均值才有意义,而不能相加或相乘(除了作为计算平均值的中间步骤)?

2个回答

让我们将销售额 ( ) 视为系统的一个属性。您可以将第 1 周想象为一个系统,将第 2 周想象为另一个系统。调用第 1 周系统和第 2 周系统那么, 具有这种加性特征的属性称为extensiveSW1W2

S(W1)+S(W2)=S(W1+W2)

现在将温度 ( ) 视为第 1 周和第 2 周的值为的属性。假设两个值相同。将第 1 周和第 2 周系统合并在一起,以获得另一个系统一起使用两周。 遵循此规则的属性称为密集属性,不能添加。TT(W1)T(W2)TW

T(W)=T(W1+W2)

这些定义是为物理特性和系统发明的,在将定义应用于一般情况时必须小心。我不确定有多少沿着这些思路进入社会科学。

有关更多信息,请参阅https://en.wikipedia.org/wiki/Intensive_and_extensive_properties

我没有得到温度总和失去相关性的断言 现在乘法确实没有意义,如果该值不是基于 0 的 200 度 °F(华氏)不是 100 °F 的两倍, 因为 °F 不是基于零的 您需要转换为绝对值 - °R(兰金) (200 + 459.67) / (100 + 459.67 ) = 1.17867672

avg(T)=sum(T)n
avg(Revenue)avg(Temp)=sum(Revenue)nsum(Temp)n=sum(Revenue)sum(Temp)




不知道你想叫什么术语,但我认为你描述的是基于线性零的属性

不是线性的(即使从零开始) loglog(a)log(b)abab

空间数据不会以简单的线性方式相加、相减或平均。