设计特征向量以区分不同的声音波形


10

考虑以下四个波形信号:

signal1 = [4.1880   11.5270   55.8612  110.6730  146.2967  145.4113  104.1815   60.1679   14.3949  -53.7558  -72.6384  -88.0250  -98.4607]

signal2 = [ -39.6966   44.8127   95.0896  145.4097  144.5878   95.5007   61.0545   47.2886   28.1277  -40.9720  -53.6246  -63.4821  -72.3029  -74.8313  -77.8124]

signal3 = [-225.5691 -192.8458 -145.6628  151.0867  172.0412  172.5784  164.2109  160.3817  164.5383  171.8134  178.3905  180.8994  172.1375  149.2719  -51.9629 -148.1348 -150.4799 -149.6639]

signal4 = [ -218.5187 -211.5729 -181.9739 -144.8084  127.3846  162.9755  162.6934  150.8078  145.8774  156.9846  175.2362  188.0448  189.4951  175.9540  147.4631  -89.9513 -154.1579 -151.0851]

讯号

我们注意到信号1和2看起来相似,信号3和4看起来相似。

我正在寻找一种算法,将n个信号作为输入并将它们分为m组,每组中的信号相似。

这种算法的第一步通常是为每个信号计算特征向量F一世

例如,我们可以将特征向量定义为:[width,max,max-min]。在这种情况下,我们将获得以下特征向量:

F1个=[13146245]

F2=[15145223]

F3=[18岁181406]

F4=[18岁189408]

决定特征向量时重要的一点是,相似的信号将获得彼此靠近的特征向量,而相异的信号将获得相距较远的特征向量。

在上面的示例中,我们得到:

|F2-F1个|=22.1|F3-F1个|=164.8

因此,我们可以得出结论,信号2比信号3更类似于信号1。

作为特征向量,我可能还会使用信号的离散余弦变换中的项。下图显示了信号以及离散余弦变换的前5个项对信号的近似: 余弦变换

在这种情况下,离散余弦系数为:

F1 = [94.2496  192.7706 -211.4520  -82.8782   11.2105]

F2 = [61.7481  230.3206 -114.1549 -129.2138  -65.9035]

F3 = [182.2051   18.6785 -595.3893  -46.9929 -236.3459]

F4 = [148.6924 -171.0035 -593.7428   16.8965 -223.8754]

在这种情况下,我们得到:

|F2-F1个|=141.5|F3-F1个|=498.0

该比率不如上面的简单特征向量那么大。这是否意味着越简单的特征向量越好?

到目前为止,我只显示了2个波形。下图显示了一些其他波形,这些波形将成为该算法的输入。从该曲线图中的每个峰中提取一个信号,从峰左侧最接近的分钟开始,到峰右侧最接近的分钟停止:跟踪

例如,从样本217和234之间的该图提取信号3。从另一个图提取信号4。

如果您好奇的话;每个这样的曲线图对应于麦克风在空间中不同位置的声音测量。每个麦克风都接收相同的信号,但是信号在时间上略有偏移,并且在麦克风之间失真。

特征向量可以被发送到诸如k均值的聚类算法,该聚类算法将具有彼此接近的特征向量的信号分组在一起。

你们中的任何人在设计特征向量方面有任何经验/建议会很好地区分波形信号吗?

另外,您将使用哪种聚类算法?

预先感谢您的任何回答!


输入信号与M个模板之一的优良点积又如何呢?您将选择误差最小的那个。对我而言,这就是我将要开始的地方。您是否偶然尝试过类似的方法?
Spacey 2012年

嗨,穆罕默德!问题是我事先不知道波形。我对峰周围的所有信号都感兴趣,它们可能具有许多不同的形式,这些都是我事先不知道的。
安迪

与直接将它们直接用作“功能”相比,尝试寻找新特征来表征这些矢量的原因是什么?(尽管它们的长度必须相同)。在k均值聚类的情况下,将首先计算在所采集信号的最小值处提取的那些小向量之间的“距离”,然后算法将尝试找到将它们分组为最小方差的k组的集合,这就是你似乎在追求。
2012年

嗨,A_A!1.减小向量的维数。在信号3从18到5的情况下,使用离散余弦系数。2.正在进行平滑。信号很吵,我对快速波动不感兴趣。
安迪

3
机器学习的人会认为您永远都不应丢掉信息-系统应该学习一切。当然,他们是设计算法的人,这些算法将花费一百万年的时间才能运行,但是重点并非没有优点。从本质上讲,您想扔掉尽可能少的信息并从中学习剩余的信息。这使我感到震惊,因为这是应该在贝叶斯框架中完成的问题(坦率地说,由于当今大多数信号处理都应该如此),尽管这并不意味着确定显着特征并不重要。
Henry Gomersall 2012年

Answers:


2

您只希望使用客观标准来区分信号,或者在有人聆听时它们具有某种相似性是否重要?当然,这将不得不限制您发送更长的信号(超过1000个样本)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.