如何平均量化和截断的数据?

机器算法验证 意思是 离散数据 信号处理 增删改查
2022-04-19 14:51:44

所以我有已经被模数转换器量化的数据。(连续数据已转换为离散数据,值范围从 0 到饱和值 ,在本例中为 127)。

我用来收集数据的这个特殊仪器非常嘈杂,假设在实际值中添加了高斯噪声。幸运的是,在进行单次测量时,我有足够的时间进行多次测量并对它们进行平均以减少噪音。请注意,这里的采样率不是问题,因为我正在测量的东西是完全稳定的。

显然,取简单平均值会产生有偏差的结果,因为值不能超过 0 或 127(例如,如果您尝试对“真实”值为 126 的事物使用普通旧平均值,您将得到一个估计值为小于 126。这是因为添加的高斯噪声不会因为截断而给您任何高于 127 的值)。那么我如何取平均值,以便结果会给我一个真实价值的无偏估计?

2个回答

http://en.wikipedia.org/wiki/Truncation_%28statistics%29

这没有多大帮助,但至少它给出了正确的流行语(截断,未量化;量化不是你的问题)和一个指向论文的指针。这应该作为进一步搜索的起点。

哦,Winsorized 的意思与你想要的完全相反。

如果您的数据遵循截断正态分布,则此链接为您提供 R 语言的实现,用于计算截断正态分布的均值和方差:

http://www.r-bloggers.com/truncated-normal-distribution/