“ Lena”,“ Mandrill”和“ Cameraman”等图像的音频等效形式是什么?


Answers:


17

我能想到的最接近的例子是Suzanne Vega的“ Tom's Diner”的开端,该开端已用于mpeg-1第3层开发,但仍偶尔用于演示音频编解码器。


3
是的,Tom's Diner是一个相当干净(无混响)和单声道唱歌语音片段,可用于测试音高检测程序。另一个是Boyz II Men的剪辑,是他们披头士乐队的“昨天”的封面(最右边)。适用于单声道人声的音调跟踪。比汤姆的晚餐要难。我记得Digital Performer使用过它。
罗伯特·布里斯托

16

音频处理是一个很大的领域,但是特别是在语音处理中,广泛使用的样本开放数据库被称为哈佛句。哈佛句子是美式英语中在语音上均衡的句子集合。也存在许多其他语言的等效数据库。

可以在这里找到带有哈佛语句演讲的实际文件。


5

我还认为NIST数据库在语音识别任务方面非常受欢迎。实际上,这是在年度挑战期间比较新算法和技术的标准。

此外,MATLAB的GFHandel-Hallelujahload handel片段非常普遍。



2

不要低估0 dBFS时1 kHz正弦波的功率。在单声道。由此可以发现很多信号路径错误的地方。

我已经构建并校准了足够的音频系统,可以准确地吹哨1 kHz。从简单的记忆。

除此之外,唐纳德·法根(Donald Fagen)创作的《 IGY》非常受欢迎,因此在许多节日中都被禁止使用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.