一张简单的照片是否比一幅复杂的画包含更多的信息?

信息处理 图片 图像压缩 软问题
2021-12-29 08:10:11

我希望这个问题适合这个网站。

我在刘慈欣的小说《三体》中看到这样一段话:

教授放了两张图:一张是宋代名画《清明上河图》,画面细腻,细节丰富;另一张是晴天的天空照片,深蓝色的大地只被一缕云打破……照片的信息量——它的熵——超过了画作的一两个数量级

代表图片:

这里是画 蓝天 这是真的?如何解释这种违反直觉的现象?

3个回答

这取决于您如何定义术语“信息”或“熵”。

图像熵的传统定义是将图像视为像素的二维矩阵,

H=kpklog2(pk),
在哪里pk是概率,它是从直方图计算出来的,与灰度级相关联k.

如果我们忽略像素之间的相关性,这种熵是正确的。例如,根据这个定义,这两个图像具有相同的熵。

相同的熵图像 1 相同的熵图像 2

如果考虑像素之间的相关性,则不正确。例如,如果左上角的颜色第一个像素有概率pk, 下一个像素肯定有相同的颜色并且它的颜色没有相同的概率pk.

我们人类,以你为例,就是用这种相关性来感知图像的这种相关性被称为“细节”,因此,我们/您期望细节丰富的图像应该比简单的图像具有更多的信息/熵。这就是为什么你发现它违反直觉的原因。

PS:

我尝试计算您发布的两张图像的熵,但它们并没有“一两个数量级”的不同!!!!

《清明上河图》熵约7

“天空”的熵约为 6

它们不能是教授的相同文件。

首先,它不是绘画本身,​​而是它的照片(或扫描),我们可以将其与其他事物的照片(或扫描)进行比较,例如自然场景。

根据您提供的图像,从感知上讲,与简单的天空相比,这幅画当然应该包含更多的信息。结果是在压缩时,绘画文件在相同的压缩算法下会比天空文件大。

话虽如此,简单的天空场景可能包含感知上不可见的组件,例如量化伪影、颜色渐变或类似的东西,即使您无法感知它们的存在,数学算法仍会将其视为统计信息,因此熵增加了图像的边界。导致文件更大。

当然,绘画文件也可能发生同样的情况。

两者都包含相同的信息,即都具有 1 位信息。考虑在板级有 2 两个图像,一个是绘画,另一个是照片。所以一张图像的概率是 1/2 = 0.5 。因为你在看到它们之前不知道哪个是图像。