为什么选择44.1 kHz作为记录采样率？

21

人们的耳朵可以听到频率范围为20 Hz至20 kHz的声音。根据奈奎斯特定理，记录速率应至少为40 kHz。是选择44.1 kHz的原因吗？

audio sampling

— new_comer_forever
source

4

选择它是为了与视频帧速率兼容。参见en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F

— endolith，2014年

高于12-15k的频率几乎没有任何价值。超过40岁的大多数人几乎没有有用的声音。

— 克里斯·希思

32

诚然，像任何约定一样，选择44.1 kHz确实是历史性的意外。还有其他一些历史原因。

当然，如果您想要带宽为20 kHz的高质量音频，则采样率必须超过40 kHz。

曾有人讨论过将其设为48.0 kHz（在北美电视中，这与24帧/秒的影片和表面上的30帧/秒的效果非常吻合），但是鉴于其120 mm的物理尺寸，因此有多少数据是有限的CD可以容纳，并且由于需要一个错误检测和纠正方案并且需要某种数据冗余，因此CD可以存储的逻辑数据量（约700 MB）约为物理数据量的一半。考虑到所有这些，以48 kHz的速率，我们被告知它不能容纳贝多芬的所有9号，但可以将整个9号以一个稍慢的速率保存在一张碟片上。因此48 kHz消失了。

但是，为什么是44.1而不是44.0或45.0 kHz或一些不错的整数呢？

那时，在1970年代末期存在一种名为Sony F1的产品，该产品旨在将数字音频记录到易于使用的录像带（Betamax，而不是VHS）上。那是44.1 kHz（或更准确地说是44.056 kHz）。因此，这将使从F1到CD或在另一个方向上轻松传输记录而无需重新采样和插值。

我对它的实现方式的理解是NTSC TV的水平扫描速率是15.750 kHz，而44.1 kHz恰好是其的2.8倍。我不确定，但我相信这意味着您可以在每条水平线上有3个立体声采样对，对于每5行，通常会有15个采样，有14个采样，另外还有一些采样F1中的奇偶校验或冗余。5条线的14个样本与每条水平线的2.8个样本相同，每秒15,750条线，即每秒44,100个样本。

现在，由于引入了彩色电视，他们不得不将水平线速稍微降低到每秒15734线。这项调整导致Sony F1每秒获得44,056个样本。

— 罗伯特·布里斯托·约翰逊
source

8

例如，请参阅http://www1.cs.columbia.edu/~hgs/audio/44.1.html。由于使用了抗混叠滤波器，因此应使用大于40 kHz的采样率。您应该保留一些频率，以防止由于滤波器的响应斜率导致信号失真。索尼公司在1979年讨论音频记录标准时提出了44.1 kHz的实际值。

因此，这通常是历史原因。

— Serj
source

6

在向数字格式的过渡中，音频以伪视频波形存储，可以将其视为黑色或白色（代表二进制格式）。

对于60 Hz视频，电视标准使用的场频和结构如下：每场245行（不包括前35条空白行）。每行三个样本，使得60 x 245 x 3 = 44100 = 44.1 KHz。

由于设备兼容性的考虑，后来将该约定用于CD格式（用于生产用于CD复制的CD母版的最早的设备是基于视频的）。

资料来源：《声音再现艺术》，第2页。228

— 姆布尔
source

如果那是F1所做的，我必须说“我立场正确”。我认为F1使用的是空行。

— 罗伯特·布里斯托

嗨，我刚刚在这里读到 “ NTSC彩色编码与System M电视信号一起使用，它每秒包含30 / 1.001（约29.97）个隔行扫描的视频帧。每个帧由两个字段组成，每个字段包含262.5条扫描线，总共525条扫描线。483条扫描线组成可见栅格。其余部分（垂直消隐间隔）允许垂直同步和回扫。”

因此，即使490行也使用了某些（原始NTSC）空白行。

— 罗伯特·布里斯托

0

如果从“动态”时间分辨率的角度来看，而不是从典型的静态正弦波来看，似乎人类的听力极限可能会远远高于20kHz。关于重建滤波器在20kHz至22kHz之间的余量的有趣评论。实际上，彼得·克雷文（Peter Craven）在时域优化滤波方面做了一些有趣的工作，该技术要求至少96kHz的高保真播放效果。

帕维尔

— 帕维尔
source

好吧，有一种方法可以找出答案。它被称为Blind AB Testing。不需要是双盲的（但通常是）。我认为AB测试优于ABX测试。

— 罗伯特·布里斯托

0

https://zh.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Nyquist–Shannon采样定理说，采样频率必须大于一个希望复制的最大频率的两倍。由于人类的听力范围大约为20 Hz至20,000 Hz，因此采样率必须大于40 kHz。

此外，在采样之前必须对信号进行低通滤波，以避免混叠。虽然理想的低通滤波器可以完美地通过低于20 kHz的频率（不衰减它们）并完美地截止20 kHz以上的频率，但是从理论上讲，这种理想的滤波器是不可能的（这是无因果的），因此在实践中，过渡带是必不可少的，频率部分衰减的地方。该过渡带越宽，制作抗混叠滤波器越容易，也越经济。44.1 kHz采样频率允许2.05 kHz过渡带。

另外，44,100是前四个素数的平方的乘积（2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2），因此具有许多有用的小因子。

— 中
source

因此，如果我们将单位时间从秒更改为“ farg”（即1.001秒），那么这对44100及其许多有用的小因素有什么作用？

— 罗伯特·布里斯托

-2

请参阅[ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone以获取描述。。一个称为奈奎斯特采样定理的定理指出，要对X Hz的信号进行采样而又不显着降低质量，您需要以2倍的频率进行采样。人类的听力极限约为20kHz，因此需要约40Khz的采样率。这就是为什么CD以44Khz采样的原因。也就是说，CD中每秒钟的记录包含记录中包含的最高可能频率的44,000次测量。

— 阿什·马
source

好吧，不是真的因为这个...

— jojek

部分原因是因为。对于人来说，听到高于20k的声音很少见，因此发烧友的范围大约略高于40kHz，即42、43、44。如果以22k冲击正弦波很大的人，只有一个孩子有机会听到它。蝙蝠的频率为115kHz，有些海豚的频率为150kHz，除了在水中，听起来更清晰。通过录音在线测试您的高频感知...即在此处audiocheck.net/audiotests_frequencycheckhigh.php

— com.prehensible