假设我有这个分箱数据作为输入。区间,给出平均值为简单起见,我们假设每个 bin 内的采样密度是均匀的。
现在我想估计基础函数 ( ),即我希望能够为任意、准时的值(例如 = 2.3 或 2.5 或其他)要求是:
- 该函数必须保留每个 bin 的平均值,以免引入偏差
- 函数必须是连续的(即没有间断)
- 该函数必须是非负的。(负值是非物理的。)
简单地查找给定的 bin 值将满足 #1,但违反 #2(在所有 bin 边缘都存在不连续性)。
另一方面,将整个 bin 权重分配给每个 bin 中心,然后在这些点之间进行插值,满足 #2,但违反了 #1(无论是线性插值还是高阶样条插值)。在下图中,没有保留 2< <3 的 bin 平均值;它减少了,因为两个角都被向下切割了。
如何以同时满足这两个要求的方式做到这一点?
另外,这个操作叫什么?这是插值吗?(不知道如何标记这个问题。)