Answers:
在PlayStation眼摄像机具有4元件线状麦克风阵列。它提供48 KHz的16位样本,SNR为90 dB。它易于使用:它枚举为具有四个独立通道的标准USB音频设备。
有关以这种方式使用它的示例,请参见:Ubuntu Karmic上的PS3 Eye 4通道音频测试
在自适应波束成形方面进行了广泛的工作之后,我真的会回避自己为之破解某些东西,直到有经验为止。(注意:大约60个通道的专业解决方案的成本约为10万欧元。在许多通道中,您的空间分辨率会提高很多,但是您只能通过USB端口获得有限的信息...)
为了获得可靠的波束成形,至关重要的是所有麦克风都使用相同的时基。最简单的方法是使用带有多个输入通道的外部USB声卡。那些并不是很便宜。您是否看过eBay上可以找到的内容?
另一种选择是通过使用多个USB声卡(例如每个具有两个通道)来牺牲公共时基。但是,您将需要校准采集系统。这确实没有听起来那么困难:
要进行校准,您需要设置阵列并在距阵列一定距离处发出短促的声音(例如,裂纹/拍击声等),大约是阵列范围的大小。然后,您可以录制此声音,并使用Matlab或类似方法计算拍手/裂纹/等之间的互相关。在不同的渠道上。这将为您提供一个时间偏移列表,您需要将这些时间偏移应用于通道以将它们对齐,然后再将数据输入到波束成形算法中。
要探索自适应波束成形,除非您可以在多通道声卡上讨价还价,否则这可能是解决之道。
此编辑是为了回答评论中提出的问题。
延迟和求和波束成形的基本思想是将延迟应用于不同的采集通道,以使声音源自空间中的一个点,并在添加来自不同通道的信号时“放大”。从空间的其他区域发出的声音不会对齐,因此不会被“放大”。
使用一组特定的延迟将声音对齐的空间点称为麦克风阵列(或焦点)的焦点。然而,实际上,焦点不是理想的点,而是声音对准的空间很小(取决于阵列)的小区域。该区域的大小称为焦点的大小。
几何形状(大小,形状等)取决于阵列的确切细节:麦克风数量,麦克风间距,感兴趣信号的频率内容。参见例如本文。
有关更多信息,请查找有关在超声中聚焦“相控阵”或“线性阵”的文本。波束成形可用于接收(放大空间中某个特定点的信号)或发射(用于在房间中创建“响亮”点)。原理是相同的:在您的思考中,用“扬声器”代替“麦克风”。
关于校准程序:您是正确的。我概述的过程太简单了。仅当您可以在比您感兴趣的空间区域更长的距离内创建校准拍手时,它才能很好地工作。
如果无法做到这一点,则必须考虑拍手的位置。在这种情况下,最简单的过程是通过如上所述的互相关来校正延迟,然后通过应用“反向波束成形”延迟集(根据延迟的原点位置计算),将波前的曲率加回到信号上。拍。(即,如果在“常规”波束成形算法中使用深度变量+ t0(或+ z0),则需要对反波束成形算法使用-t0(或-z0)。)
校准的目的是什么:它消除了由于不同的声卡在略微不同的时间开始录制而导致的任何错误。这通常会阻止信号正确对齐,即使有正确的延迟也是如此,从而阻止您正在寻找的放大效果。