我正在为电子游戏创作音乐。在某个时候,我将需要与程序员合作,以确定我将要移交给他们的音频文件的技术规范。我们需要谈论哪些细节?
例如,我认为我们可能需要解决的一些问题是:
- 音频文件应采用哪种格式?
- 未压缩?无损?压缩了吗?
- 高质量音频和小文件大小之间有什么平衡?
- 音乐应该多大声?
- 每个曲目的平均音量应该是多少?
- 最高音量应该是多少?
- 频率分布应该是多少?
- 例如,我是否应该写一点低音的音乐,以便可以轻松听到低调的foley?
我认为重要的问题要问吗?还有其他问题要讨论吗?
我正在为电子游戏创作音乐。在某个时候,我将需要与程序员合作,以确定我将要移交给他们的音频文件的技术规范。我们需要谈论哪些细节?
例如,我认为我们可能需要解决的一些问题是:
我认为重要的问题要问吗?还有其他问题要讨论吗?
Answers:
如果我理解正确,那么您在这里有两个不同的问题:
应该提出什么样的技术(如在编程中)注意事项?
应该提出什么样的技术(如音频工程)注意事项?
对于这两个问题,最好的办法是问负责人。对于第一个,它可能是首席音频程序员,而对于第二个,它可能是音频导演。
现在,我想是因为您在这里问这个问题,所以您所在的团队很小,没有这样的角色,您的程序员可能不知道您在说什么,所以我将以一些通用的方式回答适用于大多数项目的准则。但是无论如何,我都不建议自己做决定。与您的其他团队成员讨论以得出结论。
就是说,让我们首先讨论一些技术(编程)方面的考虑。
通常,音频文件的分发格式已经由您使用的平台或游戏引擎确定。如果要使用多平台,则每个平台都有可能具有完全独立的资源目录,并且每个平台的音频文件的特性可能会有所不同。
例如,您可能需要上交Android的Ogg Vorbis文件,iOS的MP3或AAC以及Windows的WMA。
有时,甚至格式也取决于每个文件的目的。虽然iOS可以很好地用于MP3和AAC文件的播放,但PlayStation Mobile要求MP3用于BGM,但仅支持未压缩的PCM或Microsoft ADPCM。
请问您的程序员文件必须采用哪种格式。
在大多数情况下,文件的基本规范已经被定义,因此请确保您向程序员询问。例如,BGM文件通常以立体声分发,而SFX和语音文件通常以单声道分发(因此可以轻松地将它们放置在游戏中)
再次,对于比特率和其他参数,它们通常取决于引擎或平台。如果您在这里有一定的自由度,请考虑声音数据通常是游戏的最大组成部分,并且如果要通过数字下载分发游戏,则如果您将文件制作得很小,那么您的程序员(和您的客户)将感谢您尽可能。
如果要在物理媒体上分发,则最大分发大小是预先确定的,并且您将必须与内容创建团队的其他成员进行认真的协商。
有些游戏要求您的声音(大多是BGM)是可循环播放的。其他游戏(例如节奏游戏)要求您的声音具有严格的时间限制。大多数有损压缩方案都会在磁道的开头和结尾添加填充静音,这可能会破坏循环和严格的定时。与您的程序员讨论这些问题。
压缩音频的方法太多,所以我建议您以44.1KHz 16位立体声的未压缩PCM输出每个声音文件的主版本,然后使用该文件为每个平台创建实际文件。(理想情况下,您可以创建一个转换脚本,该脚本可以应用于每个文件,因此不必在每次对主文件进行较小更改时都重新转换每个文件)。
现在,就技术(如音频工程)方面而言,您的程序员很可能不在乎,因此您在此领域将拥有更多自由。您可以采取一些措施来简化程序员的生活:
游戏中的所有声音应具有正常的响度。至少,所有BGM文件之间的响度应相同,所有SFX文件之间的响度应相同。不必让程序员不得不调整代码中的卷。
播放代码非常有限,通常只能进行线性放大。因此,在高和低响度之间,最好选择高音量,因为在播放过程中减小音量通常会比放大音量更好。很难说出确切的响度,但是根据经验,总的峰峰值幅度越大,您使用的采样范围就越好。
您可能需要加载其他游戏并以其最大音量设置播放其声音,然后将其声音与它们进行比较。
在均衡方面,我不得不说,这实际上取决于您的游戏将具有其他声音。除了与声音导演讨论这件事外,您可能还需要考虑将要使用的播放硬件:台式计算机可能具有各种各样的播放硬件,而手持设备通常只有很小的扬声器,并且您可能想要弥补这一点。街机通常也有很多不同的要求。
我区分两种情况,即开发期间和以后(存储)期间要保存的内容以及最终交付时要保存的内容。
为了存储,我使用了可能的最高质量,即对于某种无损格式的音频。只要压缩是无损的,就没有关系。WAV或FLAC都可以。对于44.1 kHz / 16位的录音,我基本上没问题,而且音量应尽可能“自然”,因此基本上可以根据需要以最小的增益进行原始录音。(如果确实需要,则可以进行96 kHz或192 kHz的录音。)大小并不重要,硬盘也不是那么贵,并且您总是可以在此问题上投入更多。主要原理是,您始终可以从无损格式压缩为有损格式,但是一旦您只有有损文件,就永远无法获得更高的质量。
对于交付,情况完全不同。在这里,您需要对质量,空间与速度做出一些艰难的选择。对于小型SFX,我使用WAV文件,因为它们加载速度最快。另一方面,音乐的大小确实很重要,因此我通常使用比特率可变的MP3。您可以摆脱64 kbps文件的限制,但这只是个问题。声音应该基本处于其自然音量,尽管彼此之间保持平衡。然后,游戏引擎将根据需要进行任何调整,尤其是当您正在执行3D声音之类的操作时。
sampling rate * sample size * channel count = bitrate
。这就是为什么44.1KHz 16位立体声的比特率精确为1411200 bit / s的原因。必须以10KHz采样320kbps的16位立体声,因此我的话“听起来很丑”。