Questions tagged «noise»

在信号处理中,可以将噪声视为无意义的随机不需要的数据。

2
熵与信噪比之间的关系
通常,任何形式的灌肠被定义为不确定性或随机性。在嘈杂的环境中,随着噪声的增加,我相信熵会增加,因为我们对所需信号的信息内容更加不确定。熵和信噪比之间有什么关系?随着信噪比的增加,噪声功率降低,但这并不意味着信号的信息含量会增加!!信息内容可能保持不变,这是否意味着熵不受影响?

4
为什么在过渡带较窄的数字滤波器的输出中出现振铃?
我正在为音频的频谱修改类型效果做一些“极限”运算。我正在使用砖墙式滤波器,以及非常窄带的通过和拒绝滤波器(vst插件),我想知道对于线性相位/最小相位滤波器的前置/后置“振铃”,我是否可以做些什么。不幸的是,我必须使用陡峭的eq斜率。我准备使用最小相位,因为它避免了预振铃。 具体来说,我想知道: 在最小相位滤波器中,输入之后刚好导致脉冲响应振荡的原因是什么? 这些振荡是否会导致通过陡峭的斜率滤波将通带之前和之后的“振铃”声传给您? 振荡,因此振铃频率是否总是相同的频率,或者振铃频率是否在某种程度上取决于输入信号? 非常感谢您的专业知识。我期待任何回应。大叔

2
在嘈杂的.wav文件中检测鼓bpm
我正在寻找解决以下问题的算法:给定嘈杂的.wav声音捕获(麦克风上有风和摩擦噪声),如何检测柔和鼓声的BPM? 我尝试过搜索该主题,但由于用于分析和生成指纹ID的大量mp3相关软件,结果非常差。他们都没有提供有关如何实际执行操作的信息。 我知道消除噪声的算法,但是仍然使我面临检测BPM的问题。而且,根据解决BPM问题的方式,可能甚至不需要去噪(由于鼓的频率往往较低,而噪声的频率较高,因此简单的低通可能就足够了)。

2
参数化语音以删除情感内容
我很高兴接受R或Matlab中的建议,但是我在下面介绍的代码仅是R。 下面附带的音频文件是两个人之间的简短对话。我的目标是使他们的讲话失真,使情感内容变得无法识别。困难在于,我需要一些参数空间来使这种变形从1到5,其中1是“高度可识别的情绪”,而5是“不可识别的情绪”。我认为我可以使用三种方法来实现R。 从此处下载“快乐”音频波。 从此处下载“愤怒”音频波。 第一种方法是通过引入噪声来降低整体清晰度。下面介绍了此解决方案(感谢@ carl-witthoft的建议)。这将同时降低语音的清晰度和情感内容,但这是非常“肮脏的”方法-很难正确地获得参数空间,因为您可以控制的唯一方面是噪声(音量)。 require(seewave) require(tuneR) require(signal) h <- readWave("happy.wav") h <- cutw(h.norm,f=44100,from=0,to=2)#cut down to 2 sec n <- noisew(d=2,f=44100)#create 2-second white noise h.n <- h + n #combine audio wave with noise oscillo(h.n,f=44100)#visualize wave with noise(black) par(new=T) oscillo(h,f=44100,colwave=2)#visualize original wave(red) 第二种方法是以某种方式调整噪声,仅在特定频带中使语音失真。我以为我可以通过从原始音频波中提取幅度包络,从该包络中产生噪声,然后将噪声重新应用于音频波来做到这一点。下面的代码显示了如何执行此操作。它所做的与噪声本身不同,使声音破裂,但它又回到了同一点-我只能在此处更改噪声的幅度。 n.env <- setenv(n, h,f=44100)#set envelope of …
12 matlab  audio  noise 

3
ADC性能仿真:如何从FFT计算SINAD?
在解决这个问题时,我开始怀疑我最初定义的 SINAD=10log10(pf∑i(pi)−p0−pf)dBSINAD=10log10⁡(pf∑i(pi)−p0−pf)dBSINAD = 10 \log_{10} \left( \frac{p_f} {\sum_i{(p_i)} - p_0 - p_f} \right)dB 是正确的。在式中,是频率为 FFT仓的功率,是包含信号频率的频率仓的功率,而是DC分量。在去除DC分量和信号频率之前,的总和累加所有频率分量。pxpxp_xxxxpfpfp_ffffp0p0p_0iiip0p0p_0pfpfp_f 更具体地说,我不确定部分,我是从Wikipedia描述中解释的∑i(pi)∑i(pi)\sum_i(p_i) (a)原始调制音频信号的功率(即来自调制射频载波的功率)与(b)剩余音频功率(即在去除原始调制音频信号之后剩余的噪声加失真功率)的比值。使用此定义,可以使SINAD级别小于1。 与等式相比,“原始调制音频信号”处于频率,这在FFT 的项中得到解释。我从以下论文中获得了项,该术语表示要除去DC分量:fffpfpfp_fp0p0p_0 在“了解SINAD,ENOB,SNR,THD,THD + N和SFDR”文档中,它说 信噪比(SINAD,即S /(N + D))是均方根信号幅度与所有其他频谱分量(包括谐波)的均方根(rss)的平均值之比,但不包括直流 查看这些定义,我可以想到SINAD的另一个可能的定义,即 SINAD=10log10⎛⎝⎜pf∑i(p2i)−−−−−−√−p0−pf⎞⎠⎟dBSINAD=10log10⁡(pf∑i(pi2)−p0−pf)dBSINAD = 10 \log_{10} \left( \frac{p_f} { \sqrt{ \sum_i{(p_i^2)} } - p_0 - p_f} \right)dB 它使用FFT结果的噪声和失真区间的RSS(均方根)。但是,那个文档中的“均值”到底是什么意思呢?
11 fft  noise 

4
量化误差如何产生噪声?
我正在自己学习采样和DSP。我很难理解量化误差如何导致噪声。我想我没有一个基本的了解,但不能说出它是什么。那么量化误差如何产生噪声呢?
11 noise  sampling 

2
“降噪”与我们通常所说的消除噪声的滤波方法有什么区别?
一个非常简单的问题-我试图弄清楚对信号进行“去噪”与对信号进行滤波(众所周知)之间的确切区别是什么。这是词汇重叠的情况还是根本不同的东西?为什么称为“降噪”? 编辑:也许至关重要的是,当我们谈到过滤信号以最大化其SNR时,我们通常在口语环境中指的是AWGN。在AWGN中也要在“降噪”中提及“噪声”,如果是,则“降噪”只是一种不同的去除方式,或者是不同类型的噪声(非高斯噪声,有色噪声等)首先?
11 noise 

1
从嘈杂的点集合中恢复曲线
背景:我正在尝试制作一个跟踪视频中大量气泡的系统 我正在使用循环霍夫变换在单图像情况下实现气泡检测。由于遮挡,模糊和其他因素,这种检测永远不会是100%准确的。我正在调整检测程序以提高召回率,可能是以精度为代价的。 完成此操作并将其应用于视频中的一系列帧后,我将获得许多可以表征为4D空间中的点的检测-x位置,y位置,半径和帧索引。 是否有可以从该4D点云恢复曲线的程序?

1
近似中值滤波器的频率响应
中值滤波器是一个非线性且有损的过程,因此它不像LTI系统中的FIR滤波器(例如相同长度的盒式滤波器)那样具有闭合形式的频率响应。 但是,与中值滤波器的频率响应相似的近似值有多接近? 中间滤波器的长度如何缩放? 在什么条件下或对于哪种信号类别,这种近似可能是“接近”的? 对于哪种信号类别,这种近似可能会非常不准确? 中值滤波器会产生哪些类型的频域失真或加性噪声?

2
您如何判断是否有信号(当您的信号看起来很像噪声时)?
这又是我的打detector探测器。 当有任何东西时,我非常擅长检测信号-可以跟踪从墙壁剥落的打ore声到您甚至在录音中都听不到的呼吸声。问题是,我无法确定信号何时降至可检测的水平以下,并且该应用程序只是在“听到声音”。而且,不幸的是,打nor /呼吸经常不规则,以至于简单的自相关或类似的间隔定时方案不太可能有很大帮助。(实际上,在某些情况下,噪音比呼吸更规律。) 那么,当没有信号时,我有什么窍门想不通吗?考虑到“信号”的开始是如此的杂音,似乎我在这里遇到了困难。 (也许这与我遇到的另一个问题有关:奇怪的是,即使声音很大,我也无法准确(甚至近似)测量信号电平。由于我仍然需要使用滚动平均值和比率来检测信号,级别信息会迷路。我正在寻找一些技巧来重新构造它。) 基本技巧 (尤达) 对音频信号进行采样(出于各种原因,通常以8000Hz的频率进行采样),然后以1024个块进行FFT。(在我的实验中,汉明滤镜和重叠块似乎影响不大,尽管稍后可能会重新讨论。) FFT分为“频段”(当前为5个,在大小上稍有偏斜以在低端放置更多细节),并且将每个频段的“频谱差异”和电平相加。峰值限制值的长期平均值用作“阈值”,进一步的偏差调整用于维持大约20%的“超阈值”速率。 每个“超阈值”值的权重均为1(低于阈值的权重为0),但此权重由频段中的表观“可变性”(大约2Hz)进行调整,以赋予频段更大的权重携带更明显的信号。 将频带的权重相加,然后将后续块的权重相加约一秒钟,以产生连续的“得分”。再次将其与运行中的平均阈值(加上几种启发式方法)进行比较,以检测打sn的起伏。 更新资料 我突然想到,如果我的算法有效地保持恒定水平的信号(针对我的信号水平问题),则有效地测量SNR的方法就是在没有信号时测量噪声。 方便地,打sn是断断续续的,中间有很多“死气”。而且我已经在检测打the信封了。因此,在信封外的任何东西(在一个打sn声的结束与下一个打sn声的开始之间)可能是噪音!我可以(以一定程度的准确性/重复性)进行测量。(当然,我们花了三倍的努力才提出了一种中途的算法-现实与理论不符。) 所以我还没有完整的答案,但是我已经取得了进步。 (虽然以上技术为我提供了相当不错的SNR指标,但我仍然无法估计实际的信号水平。我的“相对水平”指示可能会超出刻度,导致几乎听不到呼吸声,对于窗户响尾蛇来说也是如此。我需要某种绝对级别的代理。)
11 noise  snr 

1
平滑信号/检测数据流中的凸起
(编辑:此问题来自从原始WAV提取二进制磁条卡数据) 这是我的信号(顶行)和一个应用的基本IIR滤波器(底行) (编辑:我的任务是将信号分解为二进制0(频率F)和二进制1(频率2F),这就是为什么将其称为F2F。所以我需要以确保没有虚假峰值的方式进行处理。屏幕快照使它看起来微不足道,存在一个潜在的问题,即出现一个双峰,并且在真实峰之间的波谷中也得到假阳性。) 我的问题是,有什么方法可以使信号平滑?IIR是我最好的选择吗? 我至少可以看到三种可能性: IIR y [n] = 0.9 * y [n-1] + 0.1 * x [n]其中,当x <0时y [x] = 0 移动/加窗平均-在周围放置面积为1.0的Bell曲线,说每边w = 10个样本,然后对bellSmooth(x)=积分[xw,x + w] {bell(k).samp(k)} dk进行积分 确定期望的频率和FFT /删除高阶bin /反向FFT 我可能已经回答了自己的问题,但是可能这是不完整的,并且我确定我使用了错误的术语。我也无法真正预测利弊。后一种方法吸引力较小,因为它需要基本信号频率的知识。但是第二种方法也是如此。我需要选择适当的窗口长度。 还有其他方法吗?
11 filters  noise 

1
消除F2F信号中的噪声
(此问题与从原始WAV提取二进制磁条卡数据有关) 我正在从信用卡磁条上提取二进制序列。 如您所见,信号在一处明显下降。在图像的左侧也有轻微的降级。 只是使用IIR(即)平滑,但所得到的信号不被平滑数学; 如果我将信号区分两次,则噪声会以复仇的方式返回:Xout=0.9Xoutlast+0.1XinXout=0.9Xoutlast+0.1XinX_{\rm out} = 0.9X_{\rm out_{last}} + 0.1X_{\rm in} 我的问题是:我可以去除噪声,使导数干净吗? 如果是这样,怎么办? 编辑:这是一些损坏的波浪的特写: EDIT(2): 我正在考虑的几种方法: 首先,我可以对受损扇区两侧的信号进行泰勒近似,然后将近似融合在一起。 其次,我可以进行FFT,去除高频分量并进行反向FFT。我现在将尝试第二种方法...
11 fft  noise 

1
卡尔曼滤波器-了解噪声协方差矩阵
卡尔曼滤波器框架中的噪声协方差矩阵有何意义? 我指的是: 过程噪声协方差矩阵Q和 测量噪声协方差矩阵R 在任何时间t。 如何解释这些矩阵?它们代表什么?他们是否谈论状态向量中一个观测值的噪声相对于另一个观测值的噪声如何变化?

1
语音识别的降噪与应该使人类的语音“更难以理解”的降噪有何不同?
这是一个让我很感兴趣的问题,主要是因为我自己正在为现有的语音识别系统进行降噪工作。 关于降噪技术的大多数论文似乎都集中在如何使语音对人类更易懂,或者如何改善诸如“语音质量”之类的模糊术语上。 我敢肯定,使用这样的标准,您可以识别出可以使嘈杂的语音信号更容易被人类听见的滤波器。但是,我不确定在尝试评估已被去噪以提高语音识别系统准确性的语音信号时,是否可以简单地采用这些标准。 我真的没有找到讨论这种差异的论文。语音清晰度和语音质量是否与语音识别系统的准确性相关?是否有客观的指标可以评估降噪后的语音信号对于语音识别系统的“良好”程度(例如,如果还给出了原始的干净语音)?还是唯一的方法来找出您的降噪技术有多好,在去噪数据上训练语音识别系统并查看准确性? 如果有人可以指出我正确的方向,或者提供一些讨论此问题的论文,我将感到非常高兴。提前致谢!

2
从互相关图得到什么?
假设我们有两个音频信号x(t)和y(t)受噪声影响,如下所示。我们想对这两个信号进行互相关,互相关图如下所示。 在此相关图中,峰值约为-11毫秒。我试图了解我们如何解释此图中的峰值?这是什么意思?也请解释一下我们从相关函数的傅立叶变换中得到什么。 提前致谢!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.