用一个例子来简化问题。假设我有一个时间序列数据,变量是时间、温度、growth_of_microbe。现在我观察到通常在较高的温度下对微生物的生长有影响。数据样本如下
| Hour of Day(H) | Temp(T) | Microbe(P) | Min-Max of P(P#) | Why shouldn't P# be? |
|:--------------:|:-------:|:---------:|:----------------:|:-------------------:|
| 1 | 30 | 12 | (12-1)/(23-1) |
|
| 2 | 32 | 14 | (14-1)/(23-1) | (14-12)/(14-12) |
| 3 | 31 | 5 | (5-1)/(23-1) | (5-5)/(14-5) |
| 4 | 33 | 23 | (23-1)/(23-1) | (23-5)/(14-5) |
| 5 | 35 | 1 | (1-1)/(23-1) | (1-1)/(23-1) |
关于上表,Min-Max 使用总可用时间内的最低/最高数据,而不是计算值之前的
最低/最高数据,
这不会导致信息丢失吗?