音乐应制定哪些技术规范?


11

我正在为电子游戏创作音乐。在某个时候,我将需要与程序员合作,以确定我将要移交给他们的音频文件的技术规范。我们需要谈论哪些细节?

例如,我认为我们可能需要解决的一些问题是:

  • 音频文件应采用哪种格式?
    • 未压缩?无损?压缩了吗?
    • 高质量音频和小文件大小之间有什么平衡?
  • 音乐应该多大声?
    • 每个曲目的平均音量应该是多少?
    • 最高音量应该是多少?
  • 频率分布应该是多少?
    • 例如,我是否应该写一点低音的音乐,以便可以轻松听到低调的foley?

我认为重要的问题要问吗?还有其他问题要讨论吗?


这似乎非常广泛...

5
我认为这是一个很好的问题,因为它将为他人提供有用的资源。
工程师

2
我想到的一点是声音的优先级。这在暗黑破坏神(Diablo)这样的游戏中非常明显,在该游戏中,您会同时产生许多轰炸扬声器的效果。为了避免在进行大量动作时变得嘈杂,您需要调低一些不太重要的声音,例如脚步声和环境声,以使重要的声音(例如按键法术)变得响亮,玩家必须对明显的声音做出反应,然后提高他们的战斗量一旦下降。它还取决于硬件功能,可以使用多少个通道。
ScrambledRK

Answers:


6

如果我理解正确,那么您在这里有两个不同的问题:

  1. 应该提出什么样的技术(如在编程中)注意事项?

  2. 应该提出什么样的技术(如音频工程)注意事项?

对于这两个问题,最好的办法是问负责人。对于第一个,它可能是首席音频程序员,而对于第二个,它可能是音频导演。

现在,我想是因为您在这里问这个问题,所以您所在的团队很小,没有这样的角色,您的程序员可能不知道您在说什么,所以我将以一些通用的方式回答适用于大多数项目的准则。但是无论如何,我都不建议自己做决定。与您的其他团队成员讨论以得出结论。

就是说,让我们首先讨论一些技术(编程)方面的考虑。

  • 通常,音频文件的分发格式已经由您使用的平台或游戏引擎确定。如果要使用多平台,则每个平台都有可能具有完全独立的资源目录,并且每个平台的音频文件的特性可能会有所不同。

    例如,您可能需要上交Android的Ogg Vorbis文件,iOS的MP3或AAC以及Windows的WMA。

    有时,甚至格式也取决于每个文件的目的。虽然iOS可以很好地用于MP3和AAC文件的播放,但PlayStation Mobile要求MP3用于BGM,但仅支持未压缩的PCM或Microsoft ADPCM。

    请问您的程序员文件必须采用哪种格式。

  • 在大多数情况下,文件的基本规范已经被定义,因此请确保您向程序员询问。例如,BGM文件通常以立体声分发,而SFX和语音文件通常以单声道分发(因此可以轻松地将它们放置在游戏中)

  • 再次,对于比特率和其他参数,它们通常取决于引擎或平台。如果您在这里有一定的自由度,请考虑声音数据通常是游戏的最大组成部分,并且如果要通过数字下载分发游戏,则如果您将文件制作得很小,那么您的程序员(和您的客户)将感谢您尽可能。

    如果要在物理媒体上分发,则最大分发大小是预先确定的,并且您将必须与内容创建团队的其他成员进行认真的协商。

  • 有些游戏要求您的声音(大多是BGM)是可循环播放的。其他游戏(例如节奏游戏)要求您的声音具有严格的时间限制。大多数有损压缩方案都会在磁道的开头和结尾添加填充静音,这可能会破坏循环和严格的定时。与您的程序员讨论这些问题。

压缩音频的方法太多,所以我建议您以44.1KHz 16位立体声的未压缩PCM输出每个声音文件的主版本,然后使用该文件为每个平台创建实际文件。(理想情况下,您可以创建一个转换脚本,该脚本可以应用于每个文件,因此不必在每次对主文件进行较小更改时都重新转换每个文件)。

现在,就技术(如音频工程)方面而言,您的程序员很可能不在乎,因此您在此领域将拥有更多自由。您可以采取一些措施来简化程序员的生活:

  • 游戏中的所有声音应具有正常的响度。至少,所有BGM文件之间的响度应相同,所有SFX文件之间的响度应相同。不必让程序员不得不调整代码中的卷。

  • 播放代码非常有限,通常只能进行线性放大。因此,在高和低响度之间,最好选择高音量,因为在播放过程中减小音量通常会比放大音量更好。很难说出确切的响度,但是根据经验,总的峰峰值幅度越大,您使用的采样范围就越好。

    您可能需要加载其他游戏并以其最大音量设置播放其声音,然后将其声音与它们进行比较。

  • 在均衡方面,我不得不说,这实际上取决于您的游戏将具有其他声音。除了与声音导演讨论这件事外,您可能还需要考虑将要使用的播放硬件:台式计算机可能具有各种各样的播放硬件,而手持设备通常只有很小的扬声器,并且您可能想要弥补这一点。街机通常也有很多不同的要求。


需要指出的一件事是,对于SFX,我讨厌立体声文件。我需要将它们组合成引擎中的单声道,以便可以将它们正确地放入3D声音引擎中。结果,所有原始SFX可能都是原始的SFX,例如,foley声音是单声道。
rioki 2014年

2

我区分两种情况,即开发期间和以后(存储)期间要保存的内容以及最终交付时要保存的内容。

为了存储,我使用了可能的最高质量,即对于某种无损格式的音频。只要压缩是无损的,就没有关系。WAV或FLAC都可以。对于44.1 kHz / 16位的录音,我基本上没问题,而且音量应尽可能“自然”,因此基本上可以根据需要以最小的增益进行原始录音。(如果确实需要,则可以进行96 kHz或192 kHz的录音。)大小并不重要,硬盘也不是那么贵,并且您总是可以在此问题上投入更多。主要原理是,您始终可以从无损格式压缩为有损格式,但是一旦您只有有损文件,就永远无法获得更高的质量。

对于交付,情况完全不同。在这里,您需要对质量,空间与速度做出一些艰难的选择。对于小型SFX,我使用WAV文件,因为它们加载速度最快。另一方面,音乐的大小确实很重要,因此我通常使用比特率可变的MP3。您可以摆脱64 kbps文件的限制,但这只是个问题。声音应该基本处于其自然音量,尽管彼此之间保持平衡。然后,游戏引擎将根据需要进行任何调整,尤其是当您正在执行3D声音之类的操作时。


您知道44.1KHz 16位立体声的未压缩PCM大约为1300kbps,对吗?320kbps的未压缩音频听起来很可怕。
熊猫睡衣2014年

没错,我主要是指压缩音频。128kbps FLAC声音还不错。
rioki 2014年

对于FLAC或其他无损编码器,“ kbps”作为编码器设置没有意义。大小与(声音)质量仅在有损压缩时才有意义。您确定这就是FLAC吗?
2014年

您是对的,那是程序员的谈话。“比特率”基于原始记录。我通常会做44 kHz,这很好。您可能会得到肛门并进行96kHz或192kHz的录音。我会改变我的真实意思……
rioki 2014年

1
44KHz,96KHz和192KHz是“采样率”,而不是“比特率”。混合它们不是一个好主意,因为sampling rate * sample size * channel count = bitrate。这就是为什么44.1KHz 16位立体声的比特率精确为1411200 bit / s的原因。必须以10KHz采样320kbps的16位立体声,因此我的话“听起来很丑”。
熊猫睡衣2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.