我希望这个问题适合该网站。
我在刘次新的小说《三体问题》中遇到了这段话:
教授拍了两幅画:一幅是清明节期间著名的宋代画作《河边》,细节丰富,细节丰富;另一幅是晴天的天空照片,深蓝色的广阔区域仅被一团云层打破了...照片的信息内容(其熵)超出了绘画的一两个数量级
代表图片:
我希望这个问题适合该网站。
我在刘次新的小说《三体问题》中遇到了这段话:
教授拍了两幅画:一幅是清明节期间著名的宋代画作《河边》,细节丰富,细节丰富;另一幅是晴天的天空照片,深蓝色的广阔区域仅被一团云层打破了...照片的信息内容(其熵)超出了绘画的一两个数量级
代表图片:
Answers:
这取决于您如何定义术语“信息”或“熵”。
图像熵的常规定义是将图像视为像素和二维矩阵, 其中是根据直方图计算的与灰度级相关的概率。p k k
如果我们忽略像素之间的相关性,则这种熵是正确的。例如,根据此定义,两个图像具有相同的熵。
如果考虑像素之间的相关性,那是不正确的。例如,如果左上角的颜色第一个像素的概率为,那么下一个像素肯定具有相同的颜色,而其颜色则不具有相同的概率。p ķ
以您为例,我们人类使用这种相关性来感知图像。这种相关性称为“细节”,我们/您希望富细节图像比简单图像具有更多的信息/熵。这就是为什么您发现它违反直觉的原因。
PS:
我试过计算您发布的两个图像的熵,但是它们“相差一个或两个数量级”并没有什么不同!
“清明节沿江”熵约7
“天”熵约6
它们不能与教授相同。
首先,它不是绘画本身,而是它的照片(或扫描图),我们可以将其与其他事物(例如自然场景)的照片(或扫描图)进行比较。
根据您提供的图像,从感觉上来讲,与简单的天空相比,绘画当然应该包含更多的信息。结果是,在相同的压缩算法下,压缩后的绘画文件将大于天空文件。
话虽这么说,但是简单的天空场景可能包含感知不可见的组件,例如量化伪像,颜色渐变或类似的东西,尽管您无法感知它们的存在,但数学算法仍将其视为统计信息,因此熵图像边界增大。导致更大的文件。
当然,绘画文件也可能发生相同的情况。
两者都包含相同的信息,即都具有1位信息。考虑在船上水平上有两张绘画和其他照片的两个图像。因此,一张图像的概率为1/2 = 0.5。正如您在看到它们之前不知道是哪个图像。