JPEG图像中的YCbCr颜色空间如何表示?


9

我知道一个24位图像分别为R,G和B分配8位。是否仅用于RGB颜色空间。在24位JPEG图像的YCbCr颜色空间中,如何分配这些位?

Answers:


3

YCbCr有几种格式。一般来说,眼睛对亮度(Y,亮度)的变化比色度(Cb,Cr,颜色)的变化更敏感。因此,可以在保持图像质量的同时擦除一些色度信息。

因此,最“昂贵”的格式是4:4:4,其中每个亮度(Y)分量有1个红色差(Cr)和一个蓝色差(Cb)分量。

然后,按照我提到的原理,存在4:2:2,其中每2个Y组分都有1 Cb和1 Cr。它走得更远,以4:1:1和4:2:0,等更多信息这里


这些模式似乎是指视频的频率采样,而不是JPEG编码。
whuber 2011年

@whuber:它们经常在讨论视频编码时使用,但是JPEG还支持亮度是色度分辨率的两倍。对于JPEG,它是可选的-色度可以是全分辨率或半分辨率。
杰里·科芬

1
尽管很容易覆盖,但是在保存JPEG时,GIMP默认会使用色度二次采样。不记得这是否也适用于Photoshop。
thomasrutter 2011年

@ thomasrutter,Photoshop根据您选择的质量设置选择子采样。这不是一个独立的选择。
Mark Ransom

顺便说一下,数字是指每4个水平像素的Y,Pr和Pb的样本数。因此4:4:4表示所有三个通道都对每个像素采样;4:2:2表示Pr和Pb通道仅水平每隔一个像素采样一次;4:1:1(我认为这在摄影中从未使用过,仅在视频中使用过)意味着Pr和Pb仅水平地每四个像素采样一次。4:2:0是对该规则的特殊偏离。这并不意味着没有铅通道。它的意思是,Pr和Pb通道在减半两个水平和垂直方向上,不只是水平的。
thomasrutter

24

JPEG可能以每个R,G和B通道8位开始,但是当存储在JPEG中时,它的存储方式非常不同,这里没有真正的“位深度”,而是将值存储为给定精度的频率系数。

在JPEG中,更重要的是量化率,它影响在压缩的量化阶段丢弃多少信息,从而影响每个系数的精确度。在Photoshop中保存JPEG时,可以通过“质量”设置来设置此量化率。尽管它与光栅图像中的位深无关,但您甚至可以说JPEG图像中的JPEG图像没有位深,尽管JPEG编码器/解码器以24位开头/结尾光栅图像。

与保存JPEG相关的另一个主要因素是色度子采样类型。在JPEG中,可以选择将颜色(Pr和Pb)通道的水平分辨率(或水平和垂直分辨率)相对于亮度(亮度)通道减半。进行解压缩时,将对色彩通道进行插值,并且在大多数摄影主题中,差异不会很大。

以下是有关如何将图像转换为JPEG的粗略总结。

  1. RGB值转换为Y,Pb,Pr值。YPbPr色彩空间更适合有效压缩,因为它仅在一个通道中保留亮度信息,该信息携带最详细的信息。这种转换是简单的算术运算,除了有舍入误差外,它是完全可逆的。

  2. 如果使用任何色度二次采样(换句话说,使用4:4:4模式以外的任何其他值),则Pb和Pr通道的垂直和/或水平分辨率将减半。因此,这些通道将具有与亮度通道不同的像素尺寸。这导致色彩通道中的分辨率永久丧失。

  3. 对于每个通道,将图像分为8个像素乘以8个像素的块,从而为每个通道中的每个此类块提供64个线性值。如果通道不是两个维度的8像素的倍数,则边缘像素将重复(并且在解压缩时将被丢弃-因此JPEG压缩始终是8像素的倍数或1600的倍数时效率更高)在色度二次采样中)。

  4. 每个块中的64个值经历从空间域到频域的转换,在这种情况下称为离散余弦转换。您最终得到64个系数,每个系数代表该块占用的区域上特定频率图的幅度。第一个值是最低频率,实际上是所有像素的平均值,直到最后一个值描述了该块的最高频率成分。较早的值都相差很多,并且比块中的较晚值对最终图像的外观更重要。只要使用足够的精度,此操作就可以完全逆转。

  5. 然后是量化步骤,您在上一步中获得的64个系数中的每一个都除以某个数字(称为量化系数),其余的被排除在外。这是样本精度受到最大影响的地方,但是与无损压缩相比,您可以从JPEG中节省大量空间。由于自上次变换以来所有内容都在频域中,因此,与仅在此变换之前简单地降低像素的位深/准确性相比,这种准确性上的损失在保持感知图像质量方面表现得最好。此过程的相反步骤就是简单地将系数除以相同的数字,但是当然,由于将余数扔掉,结果系数的精度降低了。这会导致质量永久下降,

  6. 经过这种量化处理后,许多较后的较低有效系数通常为零,因此这些系数被排除在外了。然后,(无损)可变长度编码例程以有效的方式对所有其余系数进行编码,即使每个系数可能使用不同数量的位。

不能说某个量化因子等于某个比特深度,因为量化不会像减小比特深度时那样产生条带,而是会从您注意到的部分开始详细给出总体感知损失更少,因为它的频率幅值如此之低。


2
我认为我的大脑刚刚爆炸。
尼克·贝德福德

色度二次采样不仅会导致“分辨率降低”。它引入了非常明显的伪像,尤其是在红色通道中。
Mark Ransom

@Mark Ransom这些伪像无非是将颜色通道中的分辨率减半的结果,以及为解压缩后的分辨率进行插值所必需的结果。尽管可能存在一些解码器搞砸了该插值或进行了非常简单的最近邻插值,但导致红色出现的块效应非常明显,除了分辨率过高引起的失真外,它不应该产生任何“明显的伪像”。黑色的详细信息(或蓝色的洋红色等)。例如,这是某些早期DVD播放器上的常见问题。
thomasrutter 2011年

5
我认为我从未见过更好,更容易理解的jpeg图像压缩解释-或实际上是有损的-图像压缩。确切+1
jay.lee 2011年

抱歉,我并不是要暗示二次采样会导致伪像。只是量化带来的现有误差被放大了2倍,使它们更加明显。我认为重要的是要知道,二次采样的可见效果不仅仅是增加了一点模糊性。
Mark Ransom

1

在与亮度(Y)分开的通道中表示色度(Cb Cr)对压缩具有另一个积极影响。大多数可见信息在亮度通道中。人眼可以忍受色度通道中较低的空间分辨率和更积极的量化。因此,经过积极压缩的图像最终会占用大约10%的文件空间用于色度,而其余部分用于亮度,并且看起来仍然不错。

归根结底,压缩仍然是有损的。


-1

每个通道大约8位,但是有几种稍微不同的方法。有关详细信息,请参见Wikipedia上有关YCbCr的文章


问题中已经提到了这一点。提供更详细的答案。
尼克·贝德福德

@尼克问题中的“这个”到底在哪里?现在的问题是,“在24位JPEG图像的YCbCr颜色空间中,如何分配这些位?” 我已经说过它们的分布方式,就像任何了解该问题的人一样,它们假定通道是Y,Cb和Cr。我的答案是对Wikipedia文章的正确总结。SE策略是提供摘要,而不是复制材料批发(尽管我承认,很容易在此网站的其他地方提供一些长报价的边界示例)。
whuber 2011年

我认为,这种答案虽然不如完整的解释那么好,但比仅是从Wikipedia剪切或粘贴,甚至改写整个Wikipedia文章的方式要好得多。如果维基百科很好,那么告诉人们这是有帮助的。如果这就是您的答案的全部贡献,那么就在前面,只是给出一个简短的摘要和链接就是正确的选择。
请阅读我的个人资料,
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.