人们的耳朵可以听到频率范围为20 Hz至20 kHz的声音。根据奈奎斯特定理,记录速率应至少为40 kHz。是选择44.1 kHz的原因吗?
人们的耳朵可以听到频率范围为20 Hz至20 kHz的声音。根据奈奎斯特定理,记录速率应至少为40 kHz。是选择44.1 kHz的原因吗?
Answers:
诚然,像任何约定一样,选择44.1 kHz确实是历史性的意外。还有其他一些历史原因。
当然,如果您想要带宽为20 kHz的高质量音频,则采样率必须超过40 kHz。
曾有人讨论过将其设为48.0 kHz(在北美电视中,这与24帧/秒的影片和表面上的30帧/秒的效果非常吻合),但是鉴于其120 mm的物理尺寸,因此有多少数据是有限的CD可以容纳,并且由于需要一个错误检测和纠正方案并且需要某种数据冗余,因此CD可以存储的逻辑数据量(约700 MB)约为物理数据量的一半。考虑到所有这些,以48 kHz的速率,我们被告知它不能容纳贝多芬的所有9号,但可以将整个9号以一个稍慢的速率保存在一张碟片上。因此48 kHz消失了。
但是,为什么是44.1而不是44.0或45.0 kHz或一些不错的整数呢?
那时,在1970年代末期存在一种名为Sony F1的产品,该产品旨在将数字音频记录到易于使用的录像带(Betamax,而不是VHS)上。那是44.1 kHz(或更准确地说是44.056 kHz)。因此,这将使从F1到CD或在另一个方向上轻松传输记录而无需重新采样和插值。
我对它的实现方式的理解是NTSC TV的水平扫描速率是15.750 kHz,而44.1 kHz恰好是其的2.8倍。我不确定,但我相信这意味着您可以在每条水平线上有3个立体声采样对,对于每5行,通常会有15个采样,有14个采样,另外还有一些采样F1中的奇偶校验或冗余。5条线的14个样本与每条水平线的2.8个样本相同,每秒15,750条线,即每秒44,100个样本。
现在,由于引入了彩色电视,他们不得不将水平线速稍微降低到每秒15734线。这项调整导致Sony F1每秒获得44,056个样本。
例如,请参阅http://www1.cs.columbia.edu/~hgs/audio/44.1.html。由于使用了抗混叠滤波器,因此应使用大于40 kHz的采样率。您应该保留一些频率,以防止由于滤波器的响应斜率导致信号失真。索尼公司在1979年讨论音频记录标准时提出了44.1 kHz的实际值。
因此,这通常是历史原因。
在向数字格式的过渡中,音频以伪视频波形存储,可以将其视为黑色或白色(代表二进制格式)。
对于60 Hz视频,电视标准使用的场频和结构如下:每场245行(不包括前35条空白行)。每行三个样本,使得60 x 245 x 3 = 44100 = 44.1 KHz。
由于设备兼容性的考虑,后来将该约定用于CD格式(用于生产用于CD复制的CD母版的最早的设备是基于视频的)。
资料来源:《声音再现艺术》,第2页。228
https://zh.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Nyquist–Shannon采样定理说,采样频率必须大于一个希望复制的最大频率的两倍。由于人类的听力范围大约为20 Hz至20,000 Hz,因此采样率必须大于40 kHz。
此外,在采样之前必须对信号进行低通滤波,以避免混叠。虽然理想的低通滤波器可以完美地通过低于20 kHz的频率(不衰减它们)并完美地截止20 kHz以上的频率,但是从理论上讲,这种理想的滤波器是不可能的(这是无因果的),因此在实践中,过渡带是必不可少的,频率部分衰减的地方。该过渡带越宽,制作抗混叠滤波器越容易,也越经济。44.1 kHz采样频率允许2.05 kHz过渡带。
另外,44,100是前四个素数的平方的乘积(2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2),因此具有许多有用的小因子。
请参阅[ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone以获取描述。。一个称为奈奎斯特采样定理的定理指出,要对X Hz的信号进行采样而又不显着降低质量,您需要以2倍的频率进行采样。人类的听力极限约为20kHz,因此需要约40Khz的采样率。这就是为什么CD以44Khz采样的原因。也就是说,CD中每秒钟的记录包含记录中包含的最高可能频率的44,000次测量。