机器算法验证 - “香农熵”是否在机器学习相关文献中使用不正确？ - 吾爱随笔录 - 问答

“香农熵”是否在机器学习相关文献中使用不正确？

机器算法验证熵

2022-04-12 15:50:05

在阅读有关机器学习的论文时，我发现作者经常会引用“香农熵”。奇怪的是，给出的等式通常是：

H (p) = - \sum_{i = 1}^{n} p_{i} \ln (p_{i})

$H(p) = -\sum\limits_{i = 1}^n p_i \ln(p_i)$

例如，参见：

https://arxiv.org/pdf/1502.00326.pdf

https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2014-121.pdf

还有很多

问题是，对于曾经上过信息论课程的人来说，熵定义中的对数项是基数 $2$ , 不是基础 $e$ . 所以他们指的是更像吉布斯熵而不是香农熵。

而本文中的定义对我来说是正确的： http ://www.fizyka.umk.pl/publications/kmk/08-Entropie.pdf

有没有其他人注意到这个现象？如果使用吉布斯熵代替香农熵，会有问题吗？

1个回答

这不是一个问题。事实上，香农本人建议可以使用其他单位，请参阅他的论文“通信的数学理论”中的第一个方程（第 1 页底部）。这是论文的引述：

在涉及积分和微分的分析工作中，基数 e 有时是有用的。由此产生的信息单位将被称为自然单位。从基数 a 变为基数 b 只需要乘以 $\log_b a$ .

其它你可能感兴趣的问题

上一篇深度学习：在相同数据上重新训练模型后的巨大差异，该怎么办？下一篇斯蒂格勒是如何从伯努利的弱大数定律中得出这个结果的？