为什么选择44.1 kHz作为记录采样率?


21

人们的耳朵可以听到频率范围为20 Hz至20 kHz的声音。根据奈奎斯特定理,记录速率应至少为40 kHz。是选择44.1 kHz的原因吗?


4
选择它是为了与视频帧速率兼容。参见en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F
endolith,2014年

高于12-15k的频率几乎没有任何价值。超过40岁的大多数人几乎没有有用的声音。
克里斯·希思

Answers:


32

诚然,像任何约定一样,选择44.1 kHz确实是历史性的意外。还有其他一些历史原因。

当然,如果您想要带宽为20 kHz的高质量音频,则采样率必须超过40 kHz。

曾有人讨论过将其设为48.0 kHz(在北美电视中,这与24帧/秒的影片和表面上的30帧/秒的效果非常吻合),但是鉴于其120 mm的物理尺寸,因此有多少数据是有限的CD可以容纳,并且由于需要一个错误检测和纠正方案并且需要某种数据冗余,因此CD可以存储的逻辑数据量(约700 MB)约为物理数据量的一半。考虑到所有这些,以48 kHz的速率,我们被告知它不能容纳贝多芬的所有9号,但可以将整个9号以一个稍慢的速率保存在一张碟片上。因此48 kHz消失了。

但是,为什么是44.1而不是44.0或45.0 kHz或一些不错的整数呢?

那时,在1970年代末期存在一种名为Sony F1的产品,该产品旨在将数字音频记录到易于使用的录像带(Betamax,而不是VHS)上。那是44.1 kHz(或更准确地说是44.056 kHz)。因此,这将使从F1到CD或在另一个方向上轻松传输记录而无需重新采样和插值。

我对它的实现方式的理解是NTSC TV的水平扫描速率是15.750 kHz,而44.1 kHz恰好是其的2.8倍。我不确定,但我相信这意味着您可以在每条水平线上有3个立体声采样对,对于每5行,通常会有15个采样,有14个采样,另外还有一些采样F1中的奇偶校验或冗余。5条线的14个样本与每条水平线的2.8个样本相同,每秒15,750条线,即每秒44,100个样本。

现在,由于引入了彩色电视,他们不得不将水平线速稍微降低到每秒15734线。这项调整导致Sony F1每秒获得44,056个样本。


8

例如,请参阅http://www1.cs.columbia.edu/~hgs/audio/44.1.html。由于使用了抗混叠滤波器,因此应使用大于40 kHz的采样率。您应该保留一些频率,以防止由于滤波器的响应斜率导致信号失真。索尼公司在1979年讨论音频记录标准时提出了44.1 kHz的实际值。

因此,这通常是历史原因。


6

在向数字格式的过渡中,音频以伪视频波形存储,可以将其视为黑色或白色(代表二进制格式)。

对于60 Hz视频,电视标准使用的场频和结构如下:每场245行(不包括前35条空白行)。每行三个样本,使得60 x 245 x 3 = 44100 = 44.1 KHz。

由于设备兼容性的考虑,后来将该约定用于CD格式(用于生产用于CD复制的CD母版的最早的设备是基于视频的)。

资料来源:《声音再现艺术》,第2页。228


如果那是F1所做的,我必须说“我立场正确”。我认为F1使用的是空行。
罗伯特·布里斯托

嗨,我刚刚在这里读到 “ NTSC彩色编码与System M电视信号一起使用,它每秒包含30 / 1.001(约29.97)个隔行扫描的视频帧。每个帧由两个字段组成,每个字段包含262.5条扫描线,总共525条扫描线。483条扫描线组成可见栅格。其余部分(垂直消隐间隔)允许垂直同步和回扫。”
因此,即使490行也使用了某些(原始NTSC)空白行。
罗伯特·布里斯托

0

如果从“动态”时间分辨率的角度来看,而不是从典型的静态正弦波来看,似乎人类的听力极限可能会远远高于20kHz。关于重建滤波器在20kHz至22kHz之间的余量的有趣评论。实际上,彼得·克雷文(Peter Craven)在时域优化滤波方面做了一些有趣的工作,该技术要求至少96kHz的高保真播放效果。

帕维尔


好吧,有一种方法可以找出答案。它被称为Blind AB Testing。不需要是双盲的(但通常是)。我认为AB测试优于ABX测试。
罗伯特·布里斯托

0

https://zh.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Nyquist–Shannon采样定理说,采样频率必须大于一个希望复制的最大频率的两倍。由于人类的听力范围大约为20 Hz至20,000 Hz,因此采样率必须大于40 kHz。

此外,在采样之前必须对信号进行低通滤波,以避免混叠。虽然理想的低通滤波器可以完美地通过低于20 kHz的频率(不衰减它们)并完美地截止20 kHz以上的频率,但是从理论上讲,这种理想的滤波器是不可能的(这是无因果的),因此在实践中,过渡带是必不可少的,频率部分衰减的地方。该过渡带越宽,制作抗混叠滤波器越容易,也越经济。44.1 kHz采样频率允许2.05 kHz过渡带。

另外,44,100是前四个素数的平方的乘积(2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2),因此具有许多有用的小因子。


因此,如果我们将单位时间从秒更改为“ farg”(即1.001秒),那么这对44100及其许多有用的小因素有什么作用?
罗伯特·布里斯托

-2

请参阅[ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone以获取描述。。一个称为奈奎斯特采样定理的定理指出,要对X Hz的信号进行采样而又不显着降低质量,您需要以2倍的频率进行采样。人类的听力极限约为20kHz,因此需要约40Khz的采样率。这就是为什么CD以44Khz采样的原因。也就是说,CD中每秒钟的记录包含记录中包含的最高可能频率的44,000次测量。


好吧,不是真的因为这个...
jojek

部分原因是因为。对于人来说,听到高于20k的声音很少见,因此发烧友的范围大约略高于40kHz,即42、43、44。如果以22k冲击正弦波很大的人,只有一个孩子有机会听到它。蝙蝠的频率为115kHz,有些海豚的频率为150kHz,除了在水中,听起来更清晰。通过录音在线测试您的高频感知...即在此处audiocheck.net/audiotests_frequencycheckhigh.php
com.prehensible
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.