信号处理

为信号,图像和视频处理领域的艺术和科学从业者提供的问答

3
适用于雷达应用中大型阵列的实用宽带数字波束成形
我确实了解数字波束成形背后的数学原理,但不确定如何实际实施此类系统。例如,在工作于S波段的典型宽带FMCW雷达中,(基带)脉冲带宽可能高达500MHz。为了数字化该信号,您需要高速ADC,通常为1GHz采样频率。据我所知,这些ADC并不便宜。 现在,如果您说有20个天线单元的统一矩形阵列(URA),则需要将RF前端复制20次!该RF前端通常将包括LNA,混频器和高速ADC。 另外,上述系统产生的数据量巨大,需要大的存储器和处理能力。 因此,我的问题是: 以上情况反映了实际的波束成形系统是如何实施的还是过于幼稚?我在这里缺少基本的东西吗? 是否有任何硬件/信号处理技巧可以帮助降低此类系统中的硬件或处理要求? 谢谢

1
测量音频信号的时间延迟
在有人对我大喊之前,我完全意识到这个问题已经被问过无数次了。我向您保证,我已经阅读了现有的问题和答案,但是对于部分问题我仍然感到困惑。 我有一个在封闭环境中播放音乐(A)的声源。我有一个用来录制A的麦克风。我剩下两个共享相同特征和长度(样本数)的wav文件。 我的目标是计算A到达麦克风所需的时间。 我正在尝试使用互相关(numpy)执行计算: # Delay estimation corr = numpy.convolve(original_audio, recorded_audio, 'full') delay = int(len(corr)/2) - numpy.argmax(corr) distance = delay / sample_rate * 343 # sample_rate == 22050, m/s = speed of sound print("Distance full: %.2f cm" % (distance * 100)) 我始终获得300,000厘米范围内的值。扬声器和麦克风之间的距离约为2英尺。 这对我来说都是很新的,所以我确定我缺少明显的东西。 提前致谢。

3
如何检测实时音频输入中的口哨声,爆裂声和其他声音?
我已经阅读了很多关于SO的问题,坦率地说,每个问题都没有描述解决该问题的任何特定方法。有些人说“做FFT”,有些人说“零交叉”等。但是我只了解数字音频输入由一个特定频率的幅度阵列组成。很好。超越它。 现在我知道尼奎斯特定理,频率,振幅,傅立叶级数等,这是从2-3年前的某个学期在我的大学课程中做到的。但是那时候我们真的没有教过傅立叶在现实世界中的使用情况,而且我不花心思去研究更多关于傅立叶的知识,而不仅仅是学习通过该课程。但是现在我将不得不使用所有这些东西。 这是我要检测的声音的快照: 显然,声音具有独特的图表。我只想了解如何为图中的独特尖峰线提取其特定独特特征。像是什么幅度,频率等等,还有多少时间-尽管我猜这很微不足道。 我想要一个简单,循序渐进,不模糊的说明列表-我可以用谷歌搜索我不懂的术语。 像这样吗?- 获取输入音频数据 频谱图 获取您想要在无噪声环境中检测到的声音的频谱图 研究该图-绘制该声音的独特特征 利用(4)中找到的声音特征,做出某种可以检测实时音频馈送中那些特定特征的功能 如果找到匹配项,那么-工作已完成。 完善算法以消除误报。 AAABBBXXXZZZ 我当时想让用户在一个相当好的环境中记录他们想要存储的声音作为手势。并且用户只会在安静的时间间隔之间发出声音; 录制开始和结束时3秒。 可以这么说,在最初的3秒钟内,我的系统将确定当前输入是正常的安静背景声音。然后,图表中的突然变化将开始声音输入。然后,当录制停止时,录制将继续进行3秒钟,随后是安静的时间间隔。这将由用户手动完成。然后,它将仅自动存储图表中突然变化持续的那部分的特征-在填充时间之间的某个地方。 因此,该部分的特性将另存为该声音的手势数据,该数据随后将用于检测实时音频馈送中的特定声音。 问题是,我在用通俗的英语思考所有这些。我需要考虑数学和物理学,以便能够在我的代码中有效地实现它。关于我在代码中写什么和在哪里写,我真是一无所知,即使我有这么多库和关于SO的问题也是如此。 很抱歉,如果这很长。

3
采样狄拉克函数
我想问一个关于狄拉克函数的理论问题。Dirac函数的傅立叶变换是每个频率的值1(DC)。如果考虑采样定理,则必须在信号找到最大频率,以便可以使用进行采样。但是,正如我们从其傅立叶变换中所见,狄拉克函数包含每个频率,因此我们找不到合适的。我的问题是,从理论上讲,能否对狄拉克函数进行采样? F中号一个X F米一个X \ f_{max} Fs≥ 2 ˚F米一X Fs≥ 2F米一个X \ f_s \ge \ 2f_{max}FsFs f_s 编辑:谢谢您的有用答案伙计们!
9 sampling 

1
实现位置,速度,加速度的卡尔曼滤波器
过去,我曾将Kalman过滤器用于各种用途,但现在我对在智能手机应用程序的位置跟踪中使用一个跟踪位置,速度和加速度感兴趣。令我惊讶的是,这应该是一个简单的线性卡尔曼滤波器的教科书示例,但我似乎找不到任何讨论此问题的在线链接。我可以想到各种方法来执行此操作,但是与其从头研究它,不如这里有人可以指出正确的方向:有谁知道设置此系统的最佳方法?例如,鉴于最近的位置观测历史,在卡尔曼滤波器状态空间中预测下一个点的最佳方法是什么?在状态空间中包含加速有哪些优缺点?如果所有测量都是位置,那么如果速度和加速度处于状态空间中,系统会变得不稳定吗?等等...另外,有人知道卡尔曼滤波器的这种应用有很好的参考吗?谢谢

4
使用三角波代替正弦波的类似DFT的变换
我们知道DFT(离散傅里叶变换)将信号分解为多个正弦波频率。是否存在对三角形波执行相同操作的变换? 就我的目的而言,我只是在谈论一维信号(例如电压等)。我正在研究历史股票市场数据,我只想查看某些股票的反转。换句话说,我想使用此变换对股价执行“低通”操作。 编辑:如果是,我该怎么办?
9 fft  dft  transform 

1
计数图像中的车辆
我一直在尝试实现一种算法,以成功对图像中的汽车进行计数。我尝试在交通图像中存在多车遮挡的情况下实现一种车辆计数方法 它从一组各种图像中估计背景。我已经为此目的研究了各种其他技术,所有这些技术都以一种方式或另一种方式使用了一组图像的背景估计或需要视频。作为输入,我几乎看不到背景(可能是大多数论文中的道路)的交通图像。而且,这些图像来自不同的区域,因此它们也不具有相同的背景。在这种情况下我应该如何进行? 我在想,如果我能以某种方式匹配车辆(汽车)的结构,那么也许它们可以匹配。但是我不知道这是否可行,以及如何进行处理,因为该图像还包含多个被遮挡的车辆。 任何提示,甚至研究论文也欢迎。 样本图像如下:



1
车辆细分和跟踪
我从事一个项目已经有一段时间了,以检测和跟踪从无人机捕获的视频中的车辆,目前,我正在使用SVM,该SVM受过从车辆和背景图像中提取的局部特征的特征包表示的训练。然后,我正在使用滑动窗口检测方法来尝试在图像中定位车辆,然后我想对其进行跟踪。问题在于,这种方法远远不够缓慢,而且我的检测器不如我希望的那样可靠,因此我得到了很多误报。 因此,我一直在考虑尝试从背景中分割汽车以找到大概位置,以便在应用分类器之前减少搜索空间,但是我不确定如何进行此操作,希望有人可以提供帮助? 此外,我一直在阅读有关使用图层进行运动分割的信息,使用光流按流模型对帧进行分割,是否有人对此方法有任何经验,如果可以的话,您是否可以提供一些输入,例如您是否认为此方法适用于我的问题。 更新:我也将这个问题发布到堆栈溢出中,并且得到了一个很好的答案,我已经实现了这个想法,并且效果很好,我正在研究除这种技术之外还使用光流技术。 以下是示例视频的两帧 框架0: 框架5:

1
旋转3D图像
我有一个非各向同性体素的3D图像,我正在对其进行一般旋转。如何为旋转后的图像确定合适的体素大小?我需要最大程度地减少信息丢失,但要避免过多的采样以防止图像变得太大。

1
消除边缘的噪音(压缩缺陷)
我有被压缩的卡通图像。这个例子: 它们有这种噪音,很难删除。 即使像素位于灰色背景上,噪声像素也可能具有非常不同的颜色,如果我查看此类图像的(直方图)直方图,我会在主要颜色的色块周围看到很多色块。但是我不能只删除不是主要颜色的有价值的颜色,因为存在删除某些重要特征(例如眼睛)的风险。我也尝试过将图像进行海报化(示例呈现8种颜色),但仍然保留一些像素。 我也尝试过中值滤波器,但是它无法消除如此大的噪音(我使用3 * 3滤波器)。 请提供一些可以在这种情况下有效消除噪音的方法。我将不胜感激!

5
DSP中不稳定系统的确切含义是什么?
在物理系统中,我理解稳定或不稳定的含义是什么。例如,如果运算放大器工作在正反馈状态,则它会饱和或开始振荡(即不会有任何稳定状态)。我很清楚。 但是我无法理解当我们说IIR滤波器(或任何其他数字系统)可能变得非常不稳定时的确切含义。 数字信号处理器内部究竟发生了什么,输出物理上又发生了什么? 在这种情况下,不稳定的系统到底是什么意思?

2
普通英语数字图像时刻
我正在研究OpenCV,在计算机视觉和图像处理中,人们谈论斑点,轮廓,连接区域,有时我会听到“图像时刻”一词。 我知道在Wikipedia上有一篇有关它的文章,但我认为这太技术性了。我真的不想深入了解数学背景,但我想知道我在说什么。 有人可以给我解释一下简单的英语中的图像瞬间吗?

2
如何软解码DQPSK?
通过采用符号和前一个符号的星座位置的点积,我成功地对D-BPSK进行了软解码。如果结果> = 1,则符号相位保持不变,并且该位为零。如果结果<= -1,则相位已偏移,结果为1。在-1和1之间,结果是软0或软1。 我不知道如何使用D-QPSK进行相同的操作。我可以只使用阶段,但这会丢掉很多可以帮助软解码器的信息。 本文解释了如何做到这一点,并给出了公式(10): b1=Re{sns∗n−1},b2=Im{sns∗n−1}b1=Re{snsn−1∗},b2=Im{snsn−1∗}b_1 = \mathrm{Re}\{s_n s^*_{n-1}\}, b_2 = \mathrm{Im}\{s_n s^*_{n-1}\} 但是我不明白这种表示法- *浮动在上面意味着什么?我尝试仅将复数相乘并取实部和虚部,但这没有用。 由于星座可以旋转,因此如何将两个轴分开?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.