信号处理 dct

4

在语音识别中，前端通常进行信号处理以允许从音频流中提取特征。离散傅里叶变换（DFT）在此过程中应用了两次。第一次是在窗口化之后；在此之后，将进行梅尔合并，然后再进行另一个傅立叶变换。但是，我注意到，在语音识别器（例如CMU Sphinx中的默认前端）中，第二步操作通常使用离散余弦变换（DCT）而不是DFT ，这是很常见的。这两个操作有什么区别？为什么要第一次进行DFT，然后第二次进行DCT？

75 dct dft

3

通过FFT快速进行余弦变换

我想实现快速余弦变换。我在Wikipedia上读到，有一个DCT的快速版本，其计算方法与FFT类似。我尝试阅读引用的Makhoul *论文，了解Scipy中也使用的FTPACK和FFTW实现，但是我无法提取实际的算法。这是我到目前为止所拥有的： FFT代码： def fft(x): if x.size ==1: return x N = x.size x0 = my_fft(x[0:N:2]) x1 = my_fft(x[0+1:N:2]) k = numpy.arange(N/2) e = numpy.exp(-2j*numpy.pi*k/N) l = x0 + x1 * e r = x0 - x1 * e return numpy.hstack([l,r]) DCT代码： def dct(x): k = 0 N = x.size …

15 fft dct

2

DCT可以用于音频幅度频谱而不是DFT吗？

据我了解，DCT具有相同大小N的DFT的二进制大小的一半。DFT还包含相位信息，但是当仅需要幅度谱时，通常不需要此信息。 DCT可以用于提供密度为DFT两倍（仓间隔的一半）的幅度谱吗？或者会丢失异相信息？重叠50％怎么样？

13 dct dft

1

DCT与PCA之间的关系

我对图像和视频压缩中使用的2D 8x8 DCT具有基本的实现知识。在阅读有关主成分分析的同时，我可以看到很多相似之处，尽管PCA显然更通用。当我以前阅读过DCT时，总是将它与DFT结合使用。所以我的问题是，如何从PCA角度得出DCT？（即使挥手解释也足够了）非常感谢

12 image-processing discrete-signals dct video-compression

3

这是对MFCC计算中DCT步骤的正确解释吗？

这是这里讨论的延续。我会在那发表评论，但我没有50名代表，所以我想提出一个新问题。这就是我对MFCC计算过程中DCT步骤的理解：其背后的原理是，由于滤波器的重叠，将对数谱幅值的相关性（与滤波器组分开）。从本质上讲，DCT平滑了由这些对数频谱幅度给出的频谱表示。正确地说，下图中的蓝线代表对数谱幅值矢量所代表的光谱，而红线是经过DCT校正后的矢量吗？

9 mfcc dct

Questions tagged «dct»