信号处理技术(梅尔频率倒谱)通常用于从音乐作品中提取信息,以用于机器学习任务。该方法给出了短期功率谱,并且将系数用作输入。
在设计音乐检索系统时,这些系数被认为是乐曲的特征(显然不一定是唯一的,而是有区别的)。有没有更适合通过网络学习的特征?诸如Elman网络之类的乐器所使用的随时间变化的特征(例如低音效果)会更有效吗?
哪些特征将构成可以进行何种分类的足够广泛的集合?
您正在寻找特定音频剪辑的独特品质的检索工作吗?还是要确定类似的音乐?
—
安德鲁·罗森伯格
@AndrewRosenberg在识别相似音乐方面更多。
—
jonsca '02
(几年后),有很多方法可以修改MFCC。Kinunnen等人,“ 频率扭曲和健壮的说话者验证:替代梅尔音阶表示的比较”, 2013年,第5页,使用60个系数。并且,优化什么?在什么非开放式数据库上?所以我想(非专家)说这个问题太广泛了,无法回答。
—
denis 2014年
@denis感谢您提供信息。这是来自命运多Machine的机器学习测试版(第一次出现)。我知道这有点含糊。
—
jonsca 2014年