信号处理

为信号,图像和视频处理领域的艺术和科学从业者提供的问答

3
如何比较2个音频文件,返回差异百分比
有没有一种方法可以比较2个音频文件,从而返回一定百分比的差异?我正在使用C#VS08,.net framework 3.5。 编辑:声音的差异(例如,音频1 :"HELP"、音频2 :"HELP ME PLEASE",它将返回这2种音频之间的百分比差异。) 我目前正在以wav格式保存录制的文件,其比特率和质量也将与录制和比较的比特率相同。我想问一下是否有一种方法可以比较两个具有相同属性和相同格式(WAV)的音频文件中的声音(而不仅仅是二进制文件),并显示两个音频文件中两个声音之间的百分比差异。 帮助将不胜感激。
12 audio  c# 

3
如果频率分辨率良好,为什么在零填充后DFT中会有频率泄漏?
让我们考虑这个例子: Fs=1000; Ns=500; t=0:1/Fs:(Ns-1)*1/Fs; f1=10; f2=400; x=5+5*sin(2*pi*f1*t)+2*sin(2*pi*f2*t); X=fft(x); 在这种情况下,频率分辨率为2,并且正确捕获了所有频率分量。但是,如果我这样做: X=fft(x,1000); 频率分辨率为1,但存在频谱泄漏。在这里看到类似的效果。在我看来,两个窗口的傅立叶变换(一个长度为500,一个长度为1000)在信号中显示的频率处为零,所以我不明白为什么会发生泄漏?

2
我们为什么说“零填充并不能真正提高频率分辨率”
这是频率f = 236.4 Hz(正弦为10毫秒;N=441以采样率表示点fs=44100Hz)和DFT(无零填充)的正弦曲线: 通过查看DFT可以得出的唯一结论是:“频率大约为200Hz”。 这是信号及其DFT,带有大的零填充: 现在我们可以给出一个更为精确的结论:“通过仔细观察频谱的最大值,我可以估算出236Hz的频率”(我放大并发现最大值接近236Hz)。 我的问题是:为什么我们说“零填充不会增加分辨率”?(我经常看到这句话,然后他们说“只添加插值”) =>以我的示例为例,零填充可帮助我以更精确的分辨率找到合适的频率!


3
我们可以使用数字抗混叠滤波器吗?
我正在开发一个在ADC输入端没有抗混叠滤波器的电路板。我可以选择使用RC +运算放大器电路实现自己的滤波器。但是,在通过ADC采样并在数字域中进行处理之后,是否还可以实现抗混叠滤波器:数字抗混叠滤波器?

5
何时考虑音频的双精度(64位)浮点
在现代处理器上合成和处理音频时,何时会考虑使用单精度(32位)浮点以外的其他东西?显然,进出现实世界的音频是16/24位,所以我只是在谈论软件中信号的精度(包括音频本身和诸如滤波器系数之类的东西)。 假使,假设: CPU / DSP具有对单精度和双精度的硬件浮点支持 优先考虑的是高质量音频,而不是高性能。例如,如果双精度可提供更好的(感知)质量,则将考虑采用双精度。

7
学习卡尔曼滤波器的好书或参考
想要改善这篇文章吗?提供此问题的详细答案,包括引文和答案正确的解释。没有足够详细信息的答案可以被编辑或删除。 我对卡尔曼滤波器完全陌生。我上过一些关于条件概率和线性代数的基础课程。有人可以推荐一本好书或网络上的任何资源来帮助我理解卡尔曼滤波器的操作吗? 大多数网站都直接从公式及其含义开始,但是我对它的推导更感兴趣,或者如果没有详细推导,则至少对每个操作和参数的物理意义感兴趣。

3
如何使用FFT或DFT重新采样音频
我首先通过执行FFT,然后仅获取所需结果的一部分,然后执行逆FFT,来对语音音频进行下采样。但是,只有当我使用两个都是2的幂的频率(例如从32768降到8192的下采样)时,它才能正常工作。我对32k数据执行FFT,丢弃数据的前3/4,然后执行对其余的1/4进行逆FFT。 但是,每当我尝试使用无法正确排列的数据来执行此操作时,就会发生以下两种情况之一:我使用的数学库(Aforge.Math)会产生拟合,因为我的样本不是2的幂。如果我尝试对样本进行零填充,以使它们成为二乘幂,则另一端会产生乱码。我还尝试使用DFT来代替,但最终会变得异常缓慢(这需要实时进行)。 在初始FFT和最后的逆FFT上,我如何正确地对FFT数据进行零填充?假设我有一个44.1khz的样本需要达到16khz,我目前正在尝试这样的样本,样本大小为1000。 将输入数据最后填充到1024 执行FFT 将前512个项目读入数组(我只需要前362个,但需要^ 2) 执行逆FFT 将前362个项目读入音频播放缓冲区 由此,我最后得到了垃圾。进行相同的操作,但由于样本已经是^ 2,而不必在步骤1和3进行填充,可以得出正确的结果。
12 c#  audio 

2
什么统计用于确定噪声中信号的存在?
我相信这是一个检测器问题: 似乎是一个简单的问题使我感到困惑。基本上,我有一个兴趣范围。如果信号能量存在于该感兴趣的频带内,那么我将对信号执行操作X。 我的问题是我不确定如何确定信号是否存在。这样,在执行FFT之后,我可以寻找峰值。 但是现在呢? 通常使用统计信息将此峰与频谱的周围均值进行比较吗?还是其他一些统计数据? 我使用什么统计量来简单地确定是否存在信号,然后从那里去? 如何设置此值?简单的阈值? 编辑基于反馈: 对于这种简单的情况,我假设一个高斯白噪声的音调。我试图解决的是: 如何精确地生成ROC 曲线。是否必须先标记所有数据,然后针对多个阈值获得正确率和错误率? SNR降低如何影响ROC曲线?移到对角线? 对给定的ROC曲线进行自适应阈值处理是什么? 3a。我可以看到哪些常见的自适应阈值技术?

2
选择傅立叶变换的约定和符号?
我在大学里学到的傅立叶变换和傅立叶逆变换的定义是 F(Ĵ ω )= ∫∞- ∞F(吨)Ë- Ĵ ω ŧ dŤF(Ĵω)=∫-∞∞F(Ť)Ë-ĴωŤ dŤ F(j\omega) = \int_{-\infty}^{\infty} f(t) e^{-j\omega t}\ dt F(t )= 12个π∫∞- ∞F(Ĵ ω )ÈĴ ω ŤdωF(Ť)=1个2π∫-∞∞F(Ĵω)ËĴωŤdω f(t)=\frac{1}{2\pi}\int_{-\infty}^{\infty}F(j\omega)e^{j\omega t} d\omega 该公约的主要特点是 非单位变换;频域单位为弧度(变量为ωω\omega) “时域”单位为时间(变量为)ŤŤt 函数转换用大写字母表示(与)˚FFFFFFf 所述在严格表示该函数是一个傅立叶变换˚F (Ĵ ω )ĴĴjF(Ĵ ω )F(Ĵω)F(j\omega) 当然,通常的EE约定。j = − 1---√Ĵ=-1个j=\sqrt{-1} 如今,我使用了非常不同的约定,本质上是在维基百科上使用的约定 : ˚F(X)=∫ ∞ - ∞ ˚F(ξ)ëĴ2πξXdξF^(ξ)= …

12
高斯核模糊的一维信号的反卷积
我已经将一个随机信号与a高斯进行卷积,并添加了噪声(在这种情况下为Poisson噪声)以生成一个噪声信号。现在,我想对这个噪声信号进行反卷积,以使用相同的高斯信号提取原始信号。 问题是我需要执行一维反卷积的代码。(我已经在2D中找到了一些,但我的主要目标是1D)。 您能否建议我一些能够做到的软件包或程序?(最好在MATLAB中) 先谢谢您的帮助。


1
谁是芭芭拉(测试图片)
近年来,我开始从事图像分析工作,并使用了Barbara和Lena图像。早期,我意识到有关Lena图像的有趣历史,这让我感到奇怪:Barbara是谁,图像拍摄在哪里,最初的意图是什么(大概不是为图像研究而创建的)? 许多人引用了艾伦·格肖(Allen Gersho)的实验室或马可·施密特(Marco Schmidt)的(现已失效)测试图像数据库。但是,这让我有些不满意。
11 image 

2
如何构建具有任意相移的移相器
DSP工程师Fred到他最喜欢的DSP商店购物。 弗雷德:嗨,我想买一个移相器。 店员:嗯,你到底是什么意思? 弗雷德:嗯,你知道,如果你把像正弦曲线你的输出,对于任何。当然,必须是可调的。ý (吨)= 罪(ω 0吨- θ )ω 0 θx (t )= 罪(ω0Ť )x(t)=sin⁡(ω0t)x(t)=\sin(\omega_0t)ÿ(t )= 罪(ω0吨- θ )y(t)=sin⁡(ω0t−θ)y(t)=\sin(\omega_0t-\theta)ω0ω0\omega_0θθ\theta 店员:哦,明白了。抱歉,不,我们没有这些。但是我记得其他人也需要同样的东西,他们总是购买一个希尔伯特变压器,几个乘法器和一个加法器,然后以某种方式将所有这些东西连接在一起,制成一个可调移相器。 弗雷德:哦,是的,对! 弗雷德假装明白那个家伙在说什么。当然,他不知道该怎么做。他买了这个家伙说的他需要的所有东西,并且自己认为自己可以在家解决这个问题,或者其他所有失败的事情,都可以在DSP.SE提出。 弗雷德(Fred)如何使用他在商店获得的组件来构建具有可调相移移相器?θθ\theta

6
有执行双傅立叶变换的实际应用程序吗?…或在时域输入上进行傅立叶逆变换?
在数学中,您可以采用函数的双导数或双积分。在许多情况下,执行双导数模型可以模拟实际的实际情况,例如找到对象的加速度。 由于傅立叶变换将实数或复数信号作为输入,并产生复数信号作为输出,因此没有什么会阻止您获取该输出并再次应用傅立叶变换...在此方面有任何实际用途吗?这个?它有助于对一些复杂的现实情况进行建模吗? 按照相同的逻辑,没有什么可以阻止您对原始时域输入信号进行傅立叶逆变换了……这会有用吗?为什么或者为什么不?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.