信号处理

为信号,图像和视频处理领域的艺术和科学从业者提供的问答

1
数据分解方法不变于小位移和小规模?
是否存在一种类似于特征值的数据分解方法,该方法可以估计投影矩阵以降低维数,但是如果相同类别的原始数据在比例,移位和旋转方面略有不同(2D),则不会以相似的欧氏距离术语将相似的矢量彼此投影得太远案件)。 ÿ= Ex ;ÿ=ËX;y = E x; 例如ECG分类问题示例。有氧运动的持续时间不同。另外,比例和偏移取决于节拍检测的准确性。因此,由于该变化,属于同一类别的有氧运动可能被投影到很远的地方。

4
音频输出质量
当数字设备(PC,便携式媒体播放器等)播放数字音频文件(ogg,mp3,flac等)时,无论设备类型/品牌如何,音频信号输出总是相同的,对吗?因此,声音质量不应有差异。例如,我有一个播放mp3文件的iPod。如果我在不同品牌的媒体播放器上播放同一文件,则声音质量应该相同,因为它是完全相同的信号(没有均衡器或任何声音改变)。 这是真的?如果这是真的,那么我认为就声音质量而言,只有耳机/扬声器才是最重要的。 PS:所有答案都非常好!希望我能接受所有
10 audio 

2
您如何处理复杂信号功率谱中的负频率?
当我们应用上的实信号的DFT运算获得,然后取的平方量值,,功率谱是对称的。您可以将正频率或负频率作为的频率信息。X [ k ] X [ k ] | X [ k ] | 2 X [ k ]x [ n ]X[ñ]x[n]X[ k ]X[ķ]X[k]X[ k ]X[ķ]X[k]| X[ k ] |2|X[ķ]|2\lvert X[k]\rvert^2X[ k ]X[ķ]X[k] 但是,对于复数值信号而言并非如此。功率谱不对称。 在这种情况下,您将如何确定原始信号中的频率分量? 我们可以不去掉负频率部分吗?

1
自适应霍夫曼编码如何工作?
霍夫曼编码是用于数据压缩的熵编码的一种广泛使用的方法。假定我们对信号的统计信息有完整的了解。但是,有些霍夫曼编码版本与流媒体一起使用,可能无法完全了解信号统计信息。这些自适应霍夫曼编码器如何工作?

3
当混合信号的数量小于源信号的数量时,可以应用ICA吗?
我指的是以下论文:使用视频成像和盲源分离的非接触式自动心脏搏动测量 在以上文章中,作者能够从RGB分量中提取出心脏脉冲信号。我尝试将过程可视化如下。 R' = R + cardiac pulse G' = G + cardiac pulse B' = B + cardiac pulse R',G'和B'是相机观察到的颜色分量。R,G,B是一个人的颜色成分,假设他没有任何心搏。 看来我们将有4个来源(R,G,B,心脏搏动)。现在,我们尝试使用ICA从3种混合信号(R',G',B')中获得4种源(心脏脉冲)中的一种。 是否有意义?我是否缺少一些技巧?还是我对该过程做出了错误的假设?


2
单位步长序列
从教科书中,我们知道的DTFT 由u[n]u[n]u[n] U(ω)=πδ(ω)+11−e−jω,−π≤ω&lt;π(1)(1)U(ω)=πδ(ω)+11−e−jω,−π≤ω&lt;πU(\omega)=\pi\delta(\omega)+\frac{1}{1-e^{-j\omega}},\qquad -\pi\le\omega <\pi\tag{1} 但是,我还没有看到DSP教科书至少假装给出或多或少的声音。(1)(1)(1) Proakis [1] 通过在的 -transform中设置来导出右侧的右半边,并说这是有效的除外(这当然是正确的)。然后他说,在变换的极点,我们必须添加一个面积为的增量冲量,但对我而言,这似乎更像是一个秘方。(1)(1)(1)z=ejωz=ejωz=e^{j\omega}ZZ\mathcal{Z}u[n]u[n]u[n]ω=2πkω=2πk\omega=2\pi kZZ\mathcal{Z}ππ\pi 在这种情况下,Oppenheim和Schafer [2]提到了 尽管显示起来并不完全简单,但是可以通过以下傅立叶变换来表示此序列: 其后是等于的公式。不幸的是,他们没有费力向我们展示“并非完全简单”的证明。(1)(1)(1) 一本书,我竟然不知道,但在寻找的证据时,我发现是介绍数字信号处理和滤波器设计由BA Shenoi。在第138页上,存在的“派生” ,但不幸的是,这是错误的。我问了一个“ DSP难题”问题,让人们展示该证明有什么问题。](1)(1)(1)(1)(1)(1) 所以我的问题是: 任何人都可以提供的证明/推论,该证明是可靠的甚至严谨的,但数学上倾向于工程师可以访问?只是从书中复制并不重要。我认为将它放在此站点上将是很好的。(1)(1)(1) 请注意,即使在math.SE上,也几乎找不到任何相关的问题:这个问题没有答案,一个答案有两个,其中一个是错误的(与Shenoi的说法相同),另一个是使用“累积属性” ,我会很满意,但是接下来需要证明该属性,这使您重新开始(因为这两个证明基本上都证明了同一件事)。 最后一点,我确实提出了类似证明的内容(嗯,我是一名工程师),并且从现在开始几天后我也会将其发布为答案,但是我很乐意收集其他已发布或未发布的证明简单而优雅,最重要的是,DSP工程师可以使用它们。 PS:我毫不怀疑的有效性,我只想看一个或几个相对简单的证明。(1)(1)(1) [1] Proakis,JG和DG Manolakis,《数字信号处理:原理,算法和应用》,第三版,第4.2.8节。 [2] Oppenheim,AV和RW Schafer,《离散时间信号处理》,第二版,第2页。54。 受马库斯·穆勒评论的启发,我想证明方程式E给出的。满足要求U(ω)U(ω)U(\omega)(1)(1)(1) u[n]=u2[n]→U(ω)=12π(U⋆U)(ω)u[n]=u2[n]→U(ω)=12π(U⋆U)(ω)u[n]=u^2[n]\rightarrow U(\omega)=\frac{1}{2\pi}(U\star U)(\omega) 如果是的DTFT ,则U(ω)U(ω)U(\omega)u[n]u[n]u[n] V(ω)=11−e−jωV(ω)=11−e−jωV(\omega)=\frac{1}{1-e^{-j\omega}} 必须是DTFT的 v[n]=12sign[n]v[n]=12sign[n]v[n]=\frac12\text{sign}[n] (我们在其中定义),因为sign[0]=1sign[0]=1\text{sign}[0]=1 V(ω)=U(ω)−πδ(ω)⟺u[n]−12=12sign[n]V(ω)=U(ω)−πδ(ω)⟺u[n]−12=12sign[n]V(\omega)=U(\omega)-\pi\delta(\omega)\Longleftrightarrow u[n]-\frac12=\frac12\text{sign}[n] 所以我们有 12π(V⋆V)(ω)⟺(12sign[n])2=1412π(V⋆V)(ω)⟺(12sign[n])2=14\frac{1}{2\pi}(V\star V)(\omega)\Longleftrightarrow \left(\frac12\text{sign}[n]\right)^2=\frac14 从中得出 12π(V⋆V)(ω)=DTFT{14}=π2δ(ω)12π(V⋆V)(ω)=DTFT{14}=π2δ(ω)\frac{1}{2\pi}(V\star V)(\omega)=\text{DTFT}\left\{\frac14\right\}=\frac{\pi}{2}\delta(\omega) …

1
自适应IIR滤波器对抗FIR有什么优势?
自适应IIR滤波器并不简单,并且可能不稳定。许多人说,自适应IIR滤波器比FIR滤波器使用更少的系数。我很好奇的是,IIR可以保存多少个系数? 我尝试使用自适应IIR滤波器来估计32阶FIR滤波器的传递函数。假设IIR滤波器具有系数:a 1,a 2,...。。。,一个中号,b 0,b 1,。。。b Ñ。我发现只有M + N +M+N+1M+N+1M+N+1a1,a2,...,aM,b0,b1,...bNa1,a2,...,aM,b0,b1,...bNa_1, a_2, ..., a_M, b_0, b_1, ...b_N,即,仅2个系数可被保存。M+N+1≥30M+N+1≥30M+N+1 \ge 30 在实际项目中,例如50 MHz FPGA,32阶FIR将产生大约延迟,因此(32/50 M)/2=0.32 μs(32/50 M)/2=0.32 μs(32 / 50 ~{M}) / 2 = 0.32 ~{\mu s} IIR会发生什么? 自适应IIR滤波器能否真正减少系数数量并减少信号处理时间延迟?

2
基于对数极化DFT的尺度不变图像配准
我正在尝试使用Reddy Chatterji论文中所述的相位相关进行图像配准。就我而言,图像可以相对于彼此缩放和转换。 据我了解,找到相对比例的算法是(请参阅:论文的流程图): F1 = DFT(I1) F2 = DFT(I2) H1 = Highpass(F1) H2 = Highpass(F2) L1 = LogPolar(Magnitude(H1)) L2 = LogPolar(Magnitude(H2)) PC = PhaseCorrelate(L1,L2) PM = norm(PC) R = IDFT(PhaseCorr/PM) P = Peak(R) Scale = LogBase^P[1] 比例给了我看似荒谬的价值(图像之间存在极大的差异,并且永远无法纠正)。 但是忽略规模,相同的相位相关方法可以很好地进行翻译。所以我怀疑我的对数极坐标变换有问题。这是一个示例,其中我已解决翻译问题-左图是原始图像,右图已被裁剪和翻译-该解决方案显示在原始图的顶部: 为对数极坐标变换,我第一变换成极空间 一世^(ρ ,θ )= I( - [R + ρ COS(2 πθñθ),[R-ρ罪(2 πθñθ))一世^(ρ,θ)=一世([R+ρcos⁡(2πθñθ),[R-ρ罪⁡(2πθñθ)) …


3
当信号的两个部分相关时,这到底是什么意思?
我经常偶然发现一个概念,即信号的两个或多个部分相关联,以半正式的形式描述它们属于同一部分。例如,在图像处理中,边缘特征上的两个像素趋于相关,而在粒子模拟中代表水滴的3D结构的两个相邻部分之间的相关性则较低。我的问题是这个概念背后的确切思想是什么。

5
使用双线性变换产生的数学问题
因此,这与《食谱》有关,我大概在20年前尝试解决它,放弃了,并想起了未解决的问题。但这很直截了当,但我仍然陷入困境。 这是一个具有谐振频率和谐振的简单带通滤波器(BPF):Ω0Ω0\Omega_0QQQ H(s)=1QsΩ0(sΩ0)2+1QsΩ0+1H(s)=1QsΩ0(sΩ0)2+1QsΩ0+1 H(s) = \frac{\frac{1}{Q}\frac{s}{\Omega_0}}{\left(\frac{s}{\Omega_0}\right)^2 + \frac{1}{Q}\frac{s}{\Omega_0} + 1} 在共振频率 |H(jΩ)|≤H(jΩ0)=1|H(jΩ)|≤H(jΩ0)=1 |H(j\Omega)| \le H(j\Omega_0) = 1 并定义上下带限,以便 |H(jΩU)|2=∣∣H(jΩ02BW/2)∣∣2=12|H(jΩU)|2=|H(jΩ02BW/2)|2=12 |H(j\Omega_U)|^2 = \left|H\left(j\Omega_0 2^{BW/2} \right)\right|^2 = \tfrac12 |H(jΩL)|2=∣∣H(jΩ02−BW/2)∣∣2=12|H(jΩL)|2=|H(jΩ02−BW/2)|2=12 |H(j\Omega_L)|^2 = \left|H\left(j\Omega_0 2^{-BW/2} \right)\right|^2 = \tfrac12 我们称这些为“半功率带隙”。因为我们是音频,所以我们以八度为单位定义带宽,在模拟世界中,以八度为单位的与有关,如下所示:BWBWBWQQQ 1Q=2BW−12BW−−−−√=2sinh(ln(2)2BW)1Q=2BW−12BW=2sinh⁡(ln⁡(2)2BW) \frac{1}{Q} = \frac{2^{BW} - 1}{\sqrt{2^{BW}}} = 2 \sinh\left( \tfrac{\ln(2)}{2} BW \right) 我们正在使用双线性变换(具有预先扭曲的谐振频率),其映射为: sΩ0jΩΩ0←1tan(ω0/2)1−z−11+z−1←jtan(ω/2)tan(ω0/2)sΩ0←1tan⁡(ω0/2)1−z−11+z−1jΩΩ0←jtan⁡(ω/2)tan⁡(ω0/2)\begin{align} \frac{s}{\Omega_0} …

7
DFT为什么假定变换后的信号是周期性的?
在许多信号处理书中,都声称DFT假定变换后的信号是周期性的(这就是例如可能发生频谱泄漏的原因)。 现在,如果您查看DFT的定义,则根本就没有这种假设。但是,在Wikipedia上有关离散时间傅立叶变换(DTFT)的文章中指出 当输入数据序列x[n]x[n]x[n]为周期时,方程2可通过计算简化为离散傅里叶变换(DFT)NNN 那么,这种假设是否源自DTFT? 实际上,在计算DFT时,实际上我是否在假设信号是周期性的情况下计算DTFT ?

5
什么是线性和圆形卷积?
我对信号和卷积有一些基本的了解。据我所知,它显示了两个信号的相似性。我能用简单的英语得到一些解释: 什么是线性和圆形卷积 为什么它们很重要 使用它们的实际情况

3
拉普拉斯变换的直观解释
所以我要掌握傅里叶变换。现在,我凭直觉明确地理解了它的作用,并将很快参加一些数学课程(因此是实际课程)。但是后来我继续阅读有关拉普拉斯变换的文章,在那里我有点迷失了。发出信号的时刻是什么?为什么傅立叶变换是拉普拉斯变换的特例?我如何掌握Laplace变换? 在问这个问题之前,我已经看过这些资料: 系统的“脉冲响应”和“频率响应”是什么意思? 如何区分不同的频域? 幅度与频率响应 为什么傅立叶变换如此重要? http://en.wikipedia.org/wiki/Laplace_transform

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.