信号处理

为信号,图像和视频处理领域的艺术和科学从业者提供的问答

5
移动平均滤波器(FIR滤波器)的最佳一阶IIR(AR滤波器)近似值是多少?
假定以下一阶IIR滤波器: y[n]=αx[n]+(1−α)y[n−1]y[n]=αx[n]+(1−α)y[n−1] y[n] = \alpha x[n] + (1 - \alpha) y[n - 1] 我如何选择参数 st IIR尽可能接近FIR,FIR是最后样本的算术平均值:αα \alpha kk k z[n]=1kx[n]+1kx[n−1]+…+1kx[n−k+1]z[n]=1kx[n]+1kx[n−1]+…+1kx[n−k+1] z[n] = \frac{1}{k}x[n] + \frac{1}{k}x[n-1] + \ldots + \frac{1}{k}x[n-k+1] 其中,表示IIR的输入可能比,但我想对最后输入的平均值进行最佳近似。n∈[k,∞)n∈[k,∞) n \in [k, \infty) kk k kk k 我知道IIR具有无限的脉冲响应,因此我正在寻找最佳近似值。无论是还是成本函数的分析解决方案,我都很高兴。L2L2 {L}_{2} L1L1 {L}_{1} 仅给出一阶IIR,如何解决此优化问题。 谢谢。

1
适用于Python初学者的低通滤波器和FFT
我对信号处理尤其是FFT还是陌生的,因此不确定在这里是否做正确的事情,我对结果有些困惑。 我有一个离散的实函数(测量数据),并想在其上设置一个低通滤波器。选择的工具是带有numpy软件包的Python。我遵循以下过程: 计算我的函数的英尺 切断高频 执行反函数 这是我正在使用的代码: import numpy as np sampling_length = 15.0*60.0 # measured every 15 minutes Fs = 1.0/sampling_length ls = range(len(data)) # data contains the function freq = np.fft.fftfreq(len(data), d = sampling_length) fft = np.fft.fft(data) x = freq[:len(data)/2] for i in range(len(x)): if x[i] > 0.005: # …

1
哈里斯角点检测的数学
该问题是从Stack Overflow 迁移而来的,因为可以在Signal Processing Stack Exchange上回答。 迁移 7年前。 这是哈里斯角点检测的数学表达式: 但是我有以下疑问: 和v的物理意义是什么?许多参考文献说,这是窗口w移动的幅度。那么窗口移动了多少?一个或两个像素?uuuvvvwww 窗口覆盖的像素位置上的总和是吗? 假设简单地,我(X ,ÿ )是在单个像素的强度(X ,ÿ )或在中心的窗口内的强度的总和(X ,ÿ )?w(x,y)=1w(x,y)=1w(x,y) = 1I(x,y)I(x,y)I(x,y)(x,y)(x,y)(x,y)(x,y)(x,y)(x,y) 根据Wiki,他们说图像是2D,用I表示,然后要求考虑区域,然后使用符号I (x ,y )(x,y)(x,y)(x,y)I(x,y)I(x,y)I(x,y) 我发现难以掌握数学解释。有人有主意吗?

3
如何消除运动模糊?
是否有从图像中去除运动模糊的普遍接受的方法。对于一个简单的情况,我们可以假设运动发生在一条直线上。我假设这是一个由运动估计和反卷积组成的两部分过程,但实际上是如何完成的呢?

2
从原始WAV提取二进制磁条卡数据
我面临着一个棘手的挑战:从iPhone磁条卡读取器中提取二进制数据。卡上的磁化强度如下所示: 资源 这是当您刷卡时iPhone收到的.WAV(不要将希望寄予太大希望,这是奖励会员卡;))。顺便说一下,这是以不同的速度刷了三下。这是我正在使用的滑动的原始SInt16转储。 似乎有人在这里做过, 但是我捕获的实际数据并不是特别容易处理。 读数以不确定的“ 0”开始(并结束)-请注意,只有在收集到2个ZEROS之后,该波才会重复,这表示NS后跟SN: (请注意,三行中的每一行都代表我要刷一张不同的卡;此图像中的底部卡已使用了15年,因此磁场在某些地方明显退化严重,在这张照片中看不到) 这将允许算法确定时钟滴答。 磁场在每个时钟滴答处反转。 同样对于二进制1,磁场恰好在刻度线的中间反转: 该序列始终以1101 + 0(奇偶校验位)开始标记开始。您可以在上图中的所有三个读数中进行选择。我在问题顶部链接的cosmodro文章中更清楚地表明了这一点。 这是一个磁性衰减的示例(在底下的卡片读取中进一步记录): 我试图找出一种明智的方法来将该波形转换为其相应的二进制序列。 我已经找到了一份详细介绍的PDF,但是我无法弄清楚他们使用的算法。 该PDF包含一个有趣的图像: 如果我可以按照该图提取红线和蓝线,则可以使用其中之一来提取数据,但是我无法弄清楚构造背后的逻辑。 所以这是我的问题:如何提取二进制序列? PS。请注意,滑动速度不会保持恒定。因此,一旦确定了时钟,就需要将时钟从一个滴答声一直调整到下一个滴答声。 PPS。自相关会捕捉成对的滴答声吗?(看到滴答声会交替显示NS SN ...) 编辑(12年6月):在这方面我需要很多帮助,但是最后我完成了坚实的阅读器(http://www.magstripedecoder.com/)。感谢大家的帮助!我建议IRC的efnet频道上的#musicdsp给那些有足够的心力去迎接挑战,掌握数学的人-这真的很难!

3
他们如何为旧的黑白电影上色?
这个问题在dsp.SE上,因为我对信号处理部分最感兴趣。 印度电影Mughal-e-Azam于1960年发行,黑白相间,2004年以彩色复制。 他们如何完美地为每个像素着色? 他们使用了什么技术来识别每个像素的颜色位置? 看电影的屏幕截图之一: 我有一张爱因斯坦黑白照片要着色。怎么可能不知道他当时穿的衣服以及衣服,背景等的实际颜色是什么。
22 matlab 

1
如何将信号循环移位一部分采样?
该移位定理说: 将与线性相位乘以某个整数m对应于输出的循环移位:被替换,其中下标被解释取N模(即周期性)。ë 2 π 我XñXñx_n XkXkXk−mË2个π一世ññ 米Ë2π一世ññ米e^{\frac{2\pi i}{N}n m}XķXķX_kXķXķX_kXķ - 米Xķ-米X_{k-m} 好的,这很好: plot a N = 9 k = [0, 1, 2, 3, 4, 5, 6, 7, 8] plot ifft(fft(a)*exp(-1j*2*pi*3*k/N)) 如我所料,它移动了3个样本。 我以为您也可以这样做来移动样本的几分之一,但是当我尝试时,我的信号变得虚构了,根本不像原始信号: plot real(ifft(fft(a)*exp(-1j*2*pi*3.5*k/N))) plot imag(ifft(fft(a)*exp(-1j*2*pi*3.5*k/N))), 'b--' 我完全没想到这一点。这是否不等于与已经被3.5个样本偏移的真实冲积进行卷积?因此,冲动应该仍然是真实的,而结果应该仍然是真实的?并且它应该具有与原始形状大致相同的形状,但是正弦插值吗?

1
各种图像重采样方法之间的实际相关区别是什么?
Mathematica的ImageResize功能支持许多重采样方法。 除了最近的邻居(双线性,双二次和双三次)(从名称中可以明显看出)之外,我对这个领域不熟悉,我迷失了。 您能否指出一些可以解释这些方法之间的基本(数学)差异的资料,特别是指出实际差异(例如,通过显示示例图像,其中方法的选择确实很重要,并引入了明显的差异)? 我没有信号处理背景,所以我希望使用“温和的”简洁的介绍:-) 我将在这里复制ImageResize那些“懒惰” 的方法列表以单击链接: “最近”最近邻居重采样 “双线性”双线性插值 “双二次”双二次样条插值 “双三次”双三次样条插值 “高斯”高斯重采样 “ Lanczos” Lanczos多元插值方法 “余弦”余弦插值 “ Hamming”凸起余弦汉明插值 “ Hann”凸余弦Hann插值 “布莱克曼”三项广义升余弦 “ Bartlett”三角形窗口插值 “康奈斯”平方韦尔奇插值 “ Welch” Welch二次插值 “ Parzen”分段三次插值 “ Kaiser”零阶修正贝塞尔插值

4
如何区分声音与打nor?
背景: 我正在开发一个iPhone应用程序(在 其他几篇 文章中都有介绍),该应用程序在一个人入睡时“听着”打呼//呼吸,并确定是否存在睡眠呼吸暂停的迹象(作为“睡眠实验室”的预屏幕)测试)。该应用程序主要使用“频谱差异”来检测打sn /呼吸,并且在针对睡眠实验室记录(实际上是非常嘈杂的)进行测试时,效果很好(大约为0.85--0.90)。 问题: 我可以通过多种技术过滤掉大多数“卧室”噪音(风扇等),并且经常以人耳无法检测到的S / N级别可靠地检测到呼吸。问题是语音噪音。在后台运行电视或广播(或者只是在远处说话的人)并不罕见,并且声音的节奏与呼吸/打呼closely紧密匹配。实际上,我通过该应用程序记录了已故作者/讲故事者比尔·霍尔姆(Bill Holm)的录音,与打的节奏,水平变化和其他几种测量方法基本上没有区别。(尽管我可以说他显然没有睡眠呼吸暂停,至少在清醒时没有。) 因此,这是一个远景(可能是一系列的论坛规则),但是我正在寻找一些有关如何区分声音的想法。我们不需要以某种方式过滤掉打ore声(这会很好),但是我们只需要一种方法来拒绝被声音过度污染的“太吵”的声音。 有任何想法吗? 发布的文件:我已经在dropbox.com上放置了一些文件: Epica_Storm_the_Noisy_Sorrow_minus_10dB_wav.dat Holm_5db_noisy_wav.dat recordFile20120408010300_first_ten_wav.dat 第一个是相当随机的摇滚(我猜)音乐,第二个是已故的Bill Holm讲话的录音。两者(我将其作为“噪声”样本从打nor中区分出来)都与噪声混合在一起,以使信号模糊。(这使识别它们的任务变得更加困难。)第三档是您的录音的十分钟,真正的三分之一是呼吸,打middle混合,最后三分之一是稳定的打nor。(您咳嗽会得到奖金。) 这三个文件都已从“ .wav”重命名为“ _wav.dat”,因为许多浏览器都使下载wav文件异常困难。下载后,只需将它们重命名为“ .wav”即可。 更新:我以为熵对我来说就是“把戏”,但事实证明,这主要是我所使用的测试用例的特殊性,以及设计得不太好的算法。在一般情况下,熵对我无能为力。 随后,我尝试了一种技术,该技术可以计算每秒采样约8次的整体信号幅度(我尝试过功率,频谱通量和其他多种测量方法)的FFT(使用几种不同的窗口函数)(取自主要FFT周期的统计信息)这是每1024/8000秒)。对于1024个样本,这涵盖了大约两分钟的时间范围。我希望由于打/呼吸与声音/音乐的节奏较慢,我能够看到这种模式(而且它可能也是解决“ 可变性 ”问题的更好方法),但是尽管有提示到处都是模式,没有什么我可以真正锁定的。 (进一步的信息:在某些情况下,信号幅度的FFT会产生一个非常明显的模式,在0.2Hz处有一个很强的峰值,并产生阶跃谐波。可能有某种方法可以计算品质因数的相关值,但似乎需要对约4阶多项式进行曲线拟合,而在手机中每秒进行一次拟合似乎是不切实际的。) 我还尝试对将频谱划分为5个单独的“频段”进行相同的平均幅度FFT。波段是4000-2000、2000-1000、1000-500和500-0。前4个频段的模式通常与总体模式相似(尽管没有真正的“突出”频段,并且在较高频段中的信号通常消失得很小),但500-0频段通常只是随机的。 赏金: 鉴于内森(Nathan)是迄今为止最有成效的建议,尽管纳森(Nathan)没有提供任何新的东西,我还是要给予赏金。但是,如果他们提出了一些好主意,我仍然愿意将其奖励给其他人。

5
离散时间傅立叶变换与离散傅立叶变换之间的差异
我已经阅读了许多有关DTFT和DFT的文章,但是除了一些可见的东西(例如DTFT一直到无穷大而DFT一直到N-1)之外,我无法分辨两者之间的区别。谁能解释其中的区别以及何时使用什么?维基说 DFT与离散时间傅立叶变换(DTFT)的不同之处在于其输入和输出序列都是有限的。因此,它被称为有限域(或周期性)离散时间函数的傅立叶分析。 是唯一的区别吗? 编辑: 这篇文章很好地解释了区别




3
FIR滤波器设计:Window vs Parks McClellan和最小二乘
在低通滤波器的FIR滤波器设计中,使用窗方法相对于Parks-McClellan(此处进一步缩写为PMcC)或最小二乘算法有什么优势吗?以当今的计算能力为前提,算法本身的复杂性不是一个因素。 这个问题不是在将PMcC与最小二乘进行比较,而是特别是是否有任何理由使用任何窗口FIR设计技术来代替那些算法,还是窗口技术来过滤设计而被这些算法所淘汰并被归于教学目的? 下面是一个比较,在该比较中,我使用相同数量的水龙头将汉明窗与我偏爱的最小二乘设计方法进行了比较。我以最小二乘方法加宽了通带,使其与汉明窗的通带紧密匹配,在这种情况下,很明显,最小二乘的性能优于(提供更大的阻带抑制性能)。我还没有在所有窗口上执行此操作,这使我想到了一个问题,即您是否可以胜过PMcC和最小二乘,或者是否还有其他使用FIR低通滤波器的应用,而该方法更适合使用开窗方法?

2
用于视觉跟踪和平面标记的分步相机姿势估计
我从事增强现实和视觉跟踪应用程序的相机姿态估计这一主题已有一段时间了,我认为尽管有很多关于此任务的详细信息,但仍然存在很多困惑和误解。 我认为接下来的问题值得详细的逐步解答。 什么是相机内在特性? 什么是相机外部性? 如何从平面标记计算单应性? 如果我有单应性,该如何获得相机姿势?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.