在音频文件中搜索模式?


12

我想在某些点拆分非常大的音频文件。在某些时候,广播播音员会说“ deux radio”之类的话,听起来总是一样(这是一个录制的剪辑)。如何在整个MP3中找到重复的音频?如果那时我可以拆分会很好,但是即使它浪费了时间,我也可以用另一个程序拆分它。


1
我有同样的问题,这很烦人。我可以大胆地看到眼前的波形,并且每次都一样。从理论上讲应该有可能,但是我找不到任何工具可以做到这一点。我将调查audiogrep的建议并发回。
arandomlypickedname

Answers:


3

理论上,您必须编写自己的应用程序才能执行此操作,您将需要执行以下操作:

  1. 通过语音识别引擎运行WAV文件Sphinx语音识别是免费的开源引擎。

  2. 让您的语音识别引擎在内存中实时吐出文本,并跟踪样本长度位置。每次找到字符串“ deux radio”时,将示例位置吐出到splitlog.txt文件中。由于这是实时的,因此您可以大致估计出样本位置。

  3. 编写您自己的wav拆分器应用程序:从中收集所有示例位置点,splitlog.txt并相应地拆分WAV。


2

有一个名为audiogrep的程序,该程序使用语音到文本的转换来转录文本,然后根据文本搜索创建音频剪辑。

我没有看到输出时间戳而不是音频剪辑的任何选项,您可能需要对此稍作修改(或与作者联系并询问他)。我也不知道它将如何处理法语(或您的播音员使用的任何语言)。


1

您可以尝试:

  • TAPESTREA:实验软件,其描述为:

    TAPESTREA(或拍打)是用于交互式分析,转换和合成复杂声音的统一框架。给定一个或多个记录,它提供了定义明确的方法来:

    • 识别声音中的兴趣点并将其提取到可重用的模板中
    • 独立于背景和/或其他事件来变换声音分量
    • 不断以令人信服的方式重新合成背景纹理
    • 使用新颖的图形用户界面和/或使用ChucK音频编程语言编写的脚本,可控制地将事件模板放置在背景上
  • 语音转换器:共享软件(29.95美元,没有时间限制的试用版),被描述为一种工具,可以是:

    音高编辑器,共振峰偏移,颤音,草率,呼吸,音高范围缩放,音高平滑,时间拉伸…


0

您可以为此目的尝试Audacity。大胆可以消除静电,嘶嘶声,嗡嗡声或其他恒定的背景噪音。您还可以轻松地在轨道内剪切,复制,粘贴和删除。查看完整功能列表以获取更多信息。


5
可以自动搜索图案吗?我觉得不是。
user13107 2014年

1
我敢肯定有些插件可以。
Synetech

@Synetech这个答案与原始张贴者的要求无关。原始张贴者希望根据音频模式分割文件,而不仅仅是删除该音频模式。
JakeGould

@JakeGould:OP说:“我可以将其与另一个程序分开”。显然,他的主要目的不是分裂。他需要搜索“双人广播”模式,并且至少需要时间值。说“这个答案与OP的要求无关100%”对我来说似乎不公平。
Mehper C. Palavuzlar 2015年

-1

正如Mehper所说,您应该能够使用Audacity。为此,您可以选择要删除的音频并从中创建一个“噪声配置文件”(通过效果区域中的“删除噪声”选项执行此操作),然后选择整个音轨并使用“去除噪声”功能。


当原始海报询问时,“移除噪音”将如何拆分文件?
JakeGould

-1

这有点琐,但是如果由于噪声而去除剪辑会导致一定程度的静音,那么您可以使用静音查找器将录音拆分为不同的音轨。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.