信息处理 - 一张简单的照片是否比一幅复杂的画包含更多的信息？ - 吾爱随笔录

信息处理图片图像压缩软问题

2021-12-29 08:10:11

我希望这个问题适合这个网站。

我在刘慈欣的小说《三体》中看到这样一段话：

教授放了两张图：一张是宋代名画《清明上河图》，画面细腻，细节丰富；另一张是晴天的天空照片，深蓝色的大地只被一缕云打破……照片的信息量——它的熵——超过了画作的一两个数量级

代表图片：

这是真的？如何解释这种违反直觉的现象？

3个回答

这取决于您如何定义术语“信息”或“熵”。

图像熵的传统定义是将图像视为像素的二维矩阵，

H = - \sum_{k} p_{k} \log_{2} (p_{k}),

$H = - \sum_k p_k \log_2(p_k),$ 在哪里

p_{k}

$p_k$ 是概率，它是从直方图计算出来的，与灰度级相关联

k

$k$ .

如果我们忽略像素之间的相关性，这种熵是正确的。例如，根据这个定义，这两个图像具有相同的熵。

如果考虑像素之间的相关性，则不正确。例如，如果左上角的颜色第一个像素有概率 $p_k$ , 下一个像素肯定有相同的颜色并且它的颜色没有相同的概率 $p_k$ .

我们人类，以你为例，就是用这种相关性来感知图像的。这种相关性被称为“细节”，因此，我们/您期望细节丰富的图像应该比简单的图像具有更多的信息/熵。这就是为什么你发现它违反直觉的原因。

PS：

我尝试计算您发布的两张图像的熵，但它们并没有“一两个数量级”的不同！！！！

《清明上河图》熵约7

“天空”的熵约为 6

它们不能是教授的相同文件。

首先，它不是绘画本身，而是它的照片（或扫描），我们可以将其与其他事物的照片（或扫描）进行比较，例如自然场景。

根据您提供的图像，从感知上讲，与简单的天空相比，这幅画当然应该包含更多的信息。结果是在压缩时，绘画文件在相同的压缩算法下会比天空文件大。

话虽如此，简单的天空场景可能包含感知上不可见的组件，例如量化伪影、颜色渐变或类似的东西，即使您无法感知它们的存在，数学算法仍会将其视为统计信息，因此熵增加了图像的边界。导致文件更大。

当然，绘画文件也可能发生同样的情况。

两者都包含相同的信息，即都具有 1 位信息。考虑在板级有 2 两个图像，一个是绘画，另一个是照片。所以一张图像的概率是 1/2 = 0.5 。因为你在看到它们之前不知道哪个是图像。

其它你可能感兴趣的问题