信号处理

为信号,图像和视频处理领域的艺术和科学从业者提供的问答

4
Radix-4 FFT与Radix-2
radix-4的实现是否比等效编码的radix-2 FFT更快?如果是这样,为什么会更快呢?
10 fft 


3
检测填充的玻璃物体
我是从stackoverflow中的这个问题发送来的,请问如果问题太具体而又不是这里的方式:) 任务是找到其中装有特定液体的玻璃。让我为您展示图片,然后在图片下方的描述中描述我正在尝试实现的目标以及到目前为止我如何尝试实现的目标。 图片:(似乎我至少需要10名信誉才能发布图片和链接,因此链接必须要做:(否则,您可以查看堆栈溢出问题) 详细说明:我正在尝试实现一种算法,该算法将在opencv中检测特定形状的玻璃(玻璃可能会因不同的镜头拍摄角度/距离而发生变形)。也将有其他形状的其他眼镜。我要搜索的玻璃杯中还将填充一些有色液体,这将使其与包含其他颜色的玻璃杯区分开。 到目前为止,我已经尝试使用SIFT特征提取器尝试在玻璃中找到某些特征,然后将它们与装有玻璃的其他照片进行匹配。 这种方法仅在非常特殊的条件下才有效,在这种情况下,我会将玻璃放置在非常特定的位置,并且背景类似于学习图像。问题还在于,玻璃是3D对象,我不知道如何从中提取特征(也许是多张照片以不同的方式链接在一起?)。 现在我不知道我还能使用什么其他方法。我已经找到了一些线索(在这里/programming/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338),但链接似乎已断开。 另一个问题是在这种玻璃杯中检测不同的“空度”,但我什至无法正确找到玻璃杯本身。 您对本任务中的方法有何建议?使用其他方式查找本地3d对象特征会更好吗?还是完全使用其他方法会更好?我听说过算法从一组多张照片中“学习”对象,但实际上我从未见过。 任何建议将不胜感激

3
为什么将数据转换为类别可线性分离的高维特征空间会导致过拟合?
我在关于SVM和线性不可分数据的部分中读了我的书(Webb和Wiley进行的统计模式分类): 在许多现实世界中的实际问题中,将没有线性边界来分隔类别,并且寻找最佳的分隔超平面的问题是没有意义的。即使我们使用复杂的特征向量将数据转换为类别可以线性分离的高维特征空间,也会导致数据过拟合,从而导致泛化能力差。Φ (x )Φ(x)\Phi(x) 为什么将数据转换为类别可以线性分离的高维特征空间会导致过度拟合和较差的泛化能力?



1
超声波扬声器校准和发射校准信号
我正在尝试校准超声波扬声器,以发出可预测的信号,但可惜我一直遇到麻烦,这可能是由于缺乏DSP-fu所致。 一点背景 我希望能够播放尽可能接近我已校准的录音的声音。据我了解的理论,我需要找到扬声器的传递函数,并解卷积我想随其发出的信号。像这样(在频域中): X -> H -> XH 其中X是所发射的信号H是扬声器传递函数和XH是X倍H。./现在除法()应该给我H。 现在,为了发射校准信号,应将其除以H: X/H -> H -> X 做了什么 在三脚架上相隔1 m放置扬声器和已校准的麦克风。 记录了30多次150KHz-20KHz,20ms长的线性扫描,并以500 KS / s的速度记录。 使用下面的Matlab / Octave脚本对齐和平均后的信号,在该脚本下可以看到生成的信号。 files = dir('Mandag*'); rng = [1.5e6, 1.52e6]; [X, fs] = wavread(files(1).name, rng); X = X(:,1); for i=2:length(files) [Y, fs] = wavread(files(i).name, rng); sig = Y(:,1); …

4
移动平均线应如何处理缺失的数据点?
我正在编写一个程序,该程序在不同的日子里平均用户的体重。我打算使用5点移动平均线(当前日期,前两天和后两天)。有时,一个数据点会丢失1-2天。这些案件通常如何处理? (如果我可以使用更好的低通滤波器,我很乐意提出建议)


1
如何自动分类在不同位置测得的信号峰值?
我有麦克风在空间中许多不同位置上随时间测量声音。所记录的声音全部源自空间中的相同位置,但是由于从源点到每个麦克风的路径不同;信号将(时间)偏移和失真。已经使用先验知识来尽可能地补偿时间偏移,但是数据中仍然存在一些时间偏移。测量位置越近,信号越相似。 我对自动分类峰感兴趣。我的意思是说,我正在寻找一种算法,“看”下图中的两个麦克风信号,并从位置和波形“识别”出两个主要声音并报告其时间位置: sound 1: sample 17 upper plot, sample 19 lower plot, sound 2: sample 40 upper plot, sample 38 lower plot 为此,我计划在每个峰周围进行Chebyshev展开,并使用Chebyshev系数的向量作为聚类算法(k均值?)的输入。 作为示例,以下是在两个峰值(蓝色圆圈)附近的9个样本(红色)上的5个切比雪夫序列对两个附近位置(蓝色)测得的时间信号的一部分: 近似值非常好:-)。 然而; 上图的切比雪夫系数为: Clu = -1.1834 85.4318 -39.1155 -33.6420 31.0028 Cru =-43.0547 -22.7024 -143.3113 11.1709 0.5416 下图的切比雪夫系数为: Cll = 13.0926 16.6208 -75.6980 -28.9003 0.0337 Crl =-12.7664 …

3
关于Slepian和广义高斯窗的几个问题
我试图在scipy.signal中添加所有窗口函数的文档,并且卡在Slepian(与DPSS相同?)和General Gaussian窗口中,这是我以前从未听说过的。 有两个变量是某种类型的形状参数,分别p在广义高斯模型和widthSlepian模型中。(sig似乎是sigma,是标准偏差。) 2个问题: 代替我进行逆向工程和猜测,没有人能解释这些变量的名称以及它们的作用吗? 您能解释一下这些窗口的用途或用途吗? def general_gaussian(M, p, sig, sym=True): """Return a window with a generalized Gaussian shape. The Gaussian shape is defined as ``exp(-0.5*(x/sig)**(2*p))``, the half-power point is at ``(2*log(2)))**(1/(2*p)) * sig``. """ if M < 1: return np.array([]) if M == 1: return np.ones(1, 'd') odd = …

1
设计特征向量以区分不同的声音波形
考虑以下四个波形信号: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 171.8134 178.3905 180.8994 172.1375 149.2719 …

1
视频中的车辆计数
免责声明:我在StackOverFlow上发布了此问题,但了解到它更适合此处。 我对图像处理有点陌生,所以我想问您有关为我的问题找到最佳解决方案的方法,而对代码没有帮助。我还没有想到一个好主意,所以想问一下您的建议。 我正在使用OpenCV进行一个项目,该项目用于从视频文件或实时摄像机中计算车辆的数量。从事此类项目的其他人通常会跟踪移动的物体,然后对其进行计数,但与此相反,我想使用不同的观点;要求用户在视频窗口上设置一个ROI(感兴趣的区域),并且仅在该区域内工作(由于某些原因,比如不处理整个帧并提高性能),如下所示。(用户可以设置一个以上的ROI,并要求用户通过比例感来设置ROI的高度大约是普通汽车的两倍。) 到目前为止,我已经取得了一些基本进展,例如背景更新,形态过滤器,阈值化以及将移动对象作为二进制图像获取,如下所示。 完成这些操作后,我尝试对最终的阈值前景帧中的白色像素进行计数,并通过检查总的白色像素数量来估计它是否是汽车(我通过了解ROI的高度通过静态计算设置了下限) 。为了说明,我画了一个示例图形: 如您所见,很容易计算出白色像素并检查它是否按时间绘制曲线并确定是汽车还是类似噪音的东西。 问题 在两辆汽车同时通过我的投资回报率之前,我一直非常成功。我的算法错误地将其视为一辆汽车。我针对此问题尝试了不同的方法,类似于长车,但没有找到令人满意的解决方案。 题 是否可以通过这种像素值计数方法来处理此任务?如果没有,您有什么建议?

1
对音频信号执行以产生有趣声音的基本操作类别是什么?
我不知道这个问题是否有意义,因为我是dsp的新手。 在我对音频dsp的有限尝试中,我遇到了: 调频 调幅 添加剂合成 减法合成 我的问题是:这些是信号处理(特别是音频)的主要基本类别吗? 换句话说,具有全套插件的FL Studio可以完成的所有效果和奇特的事情可以分解为上述4种操作的一系列和组合吗?还是还有一大堆?从理论上讲,带插件的现代DAW可以按这种方式分为任何类别吗?以上四个类别本身是否有意义? 背景知识:基本上,我正在尝试制作一个非常基本(但非常灵活)的音频合成器/编辑器,作为一个学习编程和音频dsp的项目。使用Java时,我首先模仿了现实世界中类似合成器的基本类,调用了Oscillator和LFO之类的东西,但是每次学习新东西时,我发现自己不得不重写所有内容以使新概念适合该程序。 我现在尝试重新开始,并提出程序的基本对象和结构。为了做到这一点,我需要知道如何允许这些对象进行交互等。 谢谢! 编辑* * * 感谢您提供有用的评论和答案。我意识到我可能一直低估了东西的dsp方面,我将无法仅为简单的合成器创建基本的模板和结构,然后对其进行扩展/构建。当我学习新东西和做事的“正确”方法时,我可能不得不一次又一次地进行重建……这将花费更长的时间,但是也许我会学到更多?同样抱歉,我似乎还没有足够的代表来投票支持任何人……我会尽快。 编辑*编辑*** 我应该补充一点,在谷歌搜索中发现了有关“合成类型”的基本指南,我发现它是相关且有趣的。

2
通过简单地缩放数据来增加幅度(可能是FFT质量)是否有效?
我正在使用Mark Borgerding撰写的“ KISS FFT”版本。它接受一个16位定点输入值的数组,并生成一个32位浮点结果数组。 我发现,如果输入幅度较低,则许多浮点结果值都会为零,但是如果我仅对输入进行缩放(例如乘以系数16),则输出值将为零,因此输出似乎包含更多详情。(这对我来说不是很重要,但是为了保持一致性,我然后将结果浮点值除以相同的比例因子。) 无论如何,这似乎很有效,就产生结果而言,以前我只是得到几乎全为零的缓冲区,但是我想知道是否有某些原因可能不是有效的方法。 (请注意,这种方法意味着数据具有更多的“粗度​​” /粒度,尤其是通常不会出现的低级噪声。我几乎想知道注入是否明智?一些低电平噪声来代替输入中的零值。)
10 fft 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.