我正在寻找音频信号处理的良好工具。例如语音和音乐分析,自动语言识别等。
Scipy库是否提供音频处理功能?它是否有用于音频信号处理的好工具?
你能建议一个工具吗?
我正在寻找音频信号处理的良好工具。例如语音和音乐分析,自动语言识别等。
Scipy库是否提供音频处理功能?它是否有用于音频信号处理的好工具?
你能建议一个工具吗?
Answers:
我个人认为Python是目前最好的选择之一,并在音频识别领域做了一些工作。欢迎您检查例如我的软件,该软件可从嘈杂的音频中自动识别鸟类:鸟嘴兽。该程序已被新西兰环境保护部使用,他们对此感到高兴。基于此示例,我想指出使用Python的一些优点:
我的第二个选择是R。尽管没有Python那样丰富的功能,但它具有大量有用的库(例如,请参见seewave的应用程序)。在Windows和Linux上都安装它们很容易,如果您希望其他人使用您的程序,则这很重要。但是,以我的经验,R中的高性能计算更为困难-如果您需要进行大量处理和识别,则需要注意的重要事项。
Python中音乐分类的示例:
使用Python的 Book Building机器学习系统有一章关于音乐分类
其他工具(列表绝不完整):音乐中的Python
似乎Python在这方面是一种流行的语言,它基于以下事实而提供了一些好的工具集:我已经在某些音乐技术专业的部门和公司中看到了它的使用。
在学术界,在Matlab上看到这种类型的工作是很常见的,因为它在易于探测的IDE中汇集了许多强大的工具包(信号处理,并行计算,图形,数据库实用程序,机器学习,AI)。但是,它要花钱并且有一些缺点(就应用程序设计和性能而言,不是最佳的编程语言,因此它主要是一种原型设计工具,但可以编译为C语言)。Octave是免费的替代产品,但是由于我没有使用过它,因此我不能保证信号处理工具或软件本身的质量。
scipy
生态系统具有很多MATLAB功能。
您还可以检查pyAudioAnalysis:它结合了用于模式识别的开放库和几种音频功能实现。在pyAudioAnalysis中实现的一些示例应用程序,您可能会发现很有趣: