在音频文件中搜索模式？

12

我想在某些点拆分非常大的音频文件。在某些时候，广播播音员会说“ deux radio”之类的话，听起来总是一样（这是一个录制的剪辑）。如何在整个MP3中找到重复的音频？如果那时我可以拆分会很好，但是即使它浪费了时间，我也可以用另一个程序拆分它。

audio search music

— 彭
source

1

我有同样的问题，这很烦人。我可以大胆地看到眼前的波形，并且每次都一样。从理论上讲应该有可能，但是我找不到任何工具可以做到这一点。我将调查audiogrep的建议并发回。

— arandomlypickedname

3

理论上，您必须编写自己的应用程序才能执行此操作，您将需要执行以下操作：

通过语音识别引擎运行WAV文件Sphinx语音识别是免费的开源引擎。
让您的语音识别引擎在内存中实时吐出文本，并跟踪样本长度位置。每次找到字符串“ deux radio”时，将示例位置吐出到splitlog.txt文件中。由于这是实时的，因此您可以大致估计出样本位置。
编写您自己的wav拆分器应用程序：从中收集所有示例位置点，splitlog.txt并相应地拆分WAV。

— Level1Coder
source

2

有一个名为audiogrep的程序，该程序使用语音到文本的转换来转录文本，然后根据文本搜索创建音频剪辑。

我没有看到输出时间戳而不是音频剪辑的任何选项，您可能需要对此稍作修改（或与作者联系并询问他）。我也不知道它将如何处理法语（或您的播音员使用的任何语言）。

— 直接
source

1

您可以尝试：

TAPESTREA：实验软件，其描述为：
TAPESTREA（或拍打）是用于交互式分析，转换和合成复杂声音的统一框架。给定一个或多个记录，它提供了定义明确的方法来：
- 识别声音中的兴趣点并将其提取到可重用的模板中
- 独立于背景和/或其他事件来变换声音分量
- 不断以令人信服的方式重新合成背景纹理
- 使用新颖的图形用户界面和/或使用ChucK音频编程语言编写的脚本，可控制地将事件模板放置在背景上
语音转换器：共享软件（29.95美元，没有时间限制的试用版），被描述为一种工具，可以是：

音高编辑器，共振峰偏移，颤音，草率，呼吸，音高范围缩放，音高平滑，时间拉伸…

— 哈里奇
source

0

您可以为此目的尝试Audacity。大胆可以消除静电，嘶嘶声，嗡嗡声或其他恒定的背景噪音。您还可以轻松地在轨道内剪切，复制，粘贴和删除。查看完整功能列表以获取更多信息。

— 梅珀·帕劳（Mehper C.
source

5

可以自动搜索图案吗？我觉得不是。

— user13107 2014年

1

我敢肯定有些插件可以。

— Synetech

@Synetech这个答案与原始张贴者的要求无关。原始张贴者希望根据音频模式分割文件，而不仅仅是删除该音频模式。

— JakeGould

@JakeGould：OP说：“我可以将其与另一个程序分开”。显然，他的主要目的不是分裂。他需要搜索“双人广播”模式，并且至少需要时间值。说“这个答案与OP的要求无关100％”对我来说似乎不公平。

— Mehper C. Palavuzlar 2015年

-1

正如Mehper所说，您应该能够使用Audacity。为此，您可以选择要删除的音频并从中创建一个“噪声配置文件”（通过效果区域中的“删除噪声”选项执行此操作），然后选择整个音轨并使用“去除噪声”功能。

— 用户名
source

当原始海报询问时，“移除噪音”将如何拆分文件？

— JakeGould

-1

这有点琐，但是如果由于噪声而去除剪辑会导致一定程度的静音，那么您可以使用静音查找器将录音拆分为不同的音轨。

— 克里斯·G65
source