“香农熵”是否在机器学习相关文献中使用不正确?

机器算法验证
2022-04-12 15:50:05

在阅读有关机器学习的论文时,我发现作者经常会引用“香农熵”。奇怪的是,给出的等式通常是:

H(p)=i=1npiln(pi)

例如,参见:

https://arxiv.org/pdf/1502.00326.pdf

https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2014-121.pdf

还有很多

问题是,对于曾经上过信息论课程的人来说,熵定义中的对数项是基数2, 不是基础e. 所以他们指的是更像吉布斯熵而不是香农熵。

而本文中的定义对我来说是正确的: http ://www.fizyka.umk.pl/publications/kmk/08-Entropie.pdf

有没有其他人注意到这个现象?如果使用吉布斯熵代替香农熵,会有问题吗?

1个回答

这不是一个问题。事实上,香农本人建议可以使用其他单位,请参阅他的论文“通信的数学理论”中的第一个方程(第 1 页底部)。这是论文的引述:

在涉及积分和微分的分析工作中,基数 e 有时是有用的。由此产生的信息单位将被称为自然单位。从基数 a 变为基数 b 只需要乘以logba.