游戏语音后期处理细节若干（续）

发表于2017-08-22

原文作者：dmkjyang

今早在自己网站上居然发现一篇续文...好吧...转帖一下

哎，有些事情不说倒也轻闲，说了反而问题更多。似乎有些兄弟对这文章的细节有点疑惑或者好奇。确实，如果你从来没有处理过大量语音，那些细节说了反而让人心烦。

Soundforge Normalizer

疑惑最多的是Peak和RMS数值怎么获得，或者说怎么可以知道这段样本的Peak和RMS。说实话，做这个事情我最喜欢的还是Soundforge，而不是PT之类的。Soundforge自带有一个插件叫做Normalizer。这是个放大器，有Peak和RMS两种工作模式，不过这不是重点。重点是这东西可以扫描显示出一段波形的最大PEAK值和平均RMS值。

如图，这是一段语音在未处理前的波形。从波形上看，这段语音的Peak显然没有达到我们一般的标准，并且Peak间的动态差一则不稳定，二则整体动态偏小，三则波形很不好看。实际上，经过合适的后期处理之后，当PEAK和RMS达到我上一篇中说的参考指标的话，整段语音的动态会比现在大，并且PEAK之间的差是相对比较稳定的。如果说足够大的RMS是确保语音音量够大的前提，那么稳定的PEAK差就是确保语音的一些细节不会被别的声音轻易掩盖的要点。

用Soundforge Normalizer（只能在Soundforge内使用的），切换到RMS模式，然后点一下红圈里的Scan Levels，就可以得到下面两个值：

这段波形的最大Peak= -5.1dB

这段声音的平均RMS= -24.4dB

从数值上看，这个离之前提到的参考标准差距还是蛮大的。首先，PEAK还不算太大，只差个3dB左右；其次，RMS就要相差8dB，这个有点大。要知道10dB的差距就相当于一倍的听觉响度。

*** 当然啊，如果你只选中这段波形里的某一段，而不是整段波形，得到的检测结果一定会和现在的结果不一样。

咱继续，说说我干了什么。在用了Waves RVox Mono之后，整个波形动态会被拉大，Peak超过-3dB，于是乎，拿出Normalizer切换到Peak模式，直接把Peak强行压下去。随后，用那个老掉牙的Steinberg Magneto。啥也别动，完全是默认设置，执行一下就得到一下结果。

【你也可以在Rvox之后，先用那个老掉牙的Magneto压一下，然后再用Normalizer把Peak压到-3dB。这两种做法在这例子中差异不大，但在别的例子里就难保了。所以你最好两个都试试，看那个方便、哪个音质更好一些，随后再做决定。】

现在我们可以看到波形的PEAK值之间相对比较稳定，整个波形看起来比较有规律，色彩最深的地方看起来也比较稳定。通常，你看到这样波形，就意味着这段波形的动态是比较稳定的。但是RMS和PEAK究竟多大，还是看下检测结果比较好。还是用Noramlizer，结果如下：

这段波形的最大Peak= -3dB

这段声音的平均RMS= -14.7dB

有些人会问：你不是说要RMS等于-16dB么？我只能说，多读书是好事，但读傻了就不好玩了。再次强调，这些数值都是参考值。是一个参照基准，如此你才有足够的依据来处理。不然你说多大才好？多小才好？RMS的根本是在判断频响和景深方面提供一个整体、或者基准的依据。

*** Steinberg Magneto是其实是一个软压限，它的默认设置，一般情况下会把RMS提升3dB。Peak当前也会被提升，但是一般都不会很多，如果过多了，再用Normalizer把Peak压到-3左右接口。这东西一般是不会出现Peak过载的，但并不意味着被它压过的声音不会失真。无论如何，Magneto这样的东西是有明显染色的，如果不喜欢，不要勉强。

*** 无论是语音还是音效、音乐，如果你要把一段声音的整体音量提升上却没有CLIP，最好的办法是把PEAK先压下来，然后把RMS推上去。这个过程和使用压缩是一样的。所以，如果你对压缩器够熟悉，也大可直接用压缩。如果你要安全，纠结这些数值，那么就自己动手分步做。当然，再次向那些以钻牛角尖为荣的兄弟们劝一句，如果Peak本来就比较小了，比如说-9dB，那在推上去之前就没必要再压了，直接推吧。

如果没有Soundforge

如果没有Soundforge，这事情会完全是另一个方案。你有几个不错的选择：

1）Wavelab

Wavelab一直像是Steinberg的小三所生，而且总有那么一点像近亲结合的产物，你懂的。其实这东西用来做最终的母带混音和后期处理还是不错的，尤其适合做那种需要挂效果插件链的动作。不知道别人怎么干的，反正我是喜欢把这步骤在wavelab里做，因为保存插件链很方便，而且结果也可以即时看到听到。并且wavelab里面也是可以有多个简便方式获得Peak和RMS值的统计的。

但是，Wavelab的LE版本只保留了一些最基本的功能，比如插件链啥的，对于Peak和RMS值的统计分析，只保留了一个3D频谱视图，基本帮不上你忙。要看到PEAK和RMS，你只能借助第三方插件来。

2）ProTools

ProTools其实应该是很适合做批量的语音后期处理的，可惜它的工作流程设计并不是为这事情，所以你硬上弓也不是不可以。比如说，录音样本的剪切和基本的滤噪啥的，完全可以在PT里面做。但是要看到某段样本的Peak和RMS值，你只好借助第三方插件了。

做这个事情的第三方插件，其实就是电平表啦。非常可惜，我们已经在数字世界了，但是要找一些个使用准确的电平表，比咱预料的要难很多…很多…。不是我感性，事实如此。要能满足我对后期处理需求的电平表插件，单一个插件就比现在PT还贵，比如说TC的！硬件么就不提了。便宜的也有，但基本全部都是残疾货，而且是花里胡哨的残疾货。有时候我很想抽这些厂商。但客观想想呢，也不能怪人家。绝大部分插件，是为音乐和影视制作设计的，而不是为了游戏这种需求设计的。对于音乐和影视，基本没有人会在制作时候需要或许统计后的PEAK和RMS值，而是以观察这些参数的即时变化状况即可。介绍几个我个人觉得还凑合的：NuGen VL-M, NuGen VL-H, Blue Cat Digital Peak Pro。

这里有一点要说明的。现代的影视制作，尤其是电视剧制作，对于语音部分的处理要求已经和游戏里对每句样本的要求很像。我看过一些欧洲最近两年的电视剧分轨，其中的语音轨道里，波形被压得过于好看，不见PEAK但见矬。做游戏，是完全可以借用他们的手法来处理语音的，比如说在PT的语音轨道里，直接加载插件即可。唯一区别是，给游戏用的语音，最后一定要切成一句一句的样本。

3）使用管理工具

是否存在一种软件，它可以同时观察到这堆样本的PEAK和RMS值，如果还能加载一些插件，如果还能做批处理和批转换，并且还能即时看到波形，并且还能做一些简单的剪切啥的，....

答案是肯定的，这种工具是样本管理软件，可惜能够选择的很少，常用的有这么几个：

SoundMiner, Sample Manger, Audio Finder。

这三个软件的性能各有不同。SoundMiner是最贵的，完整版本在900美元上下。但是最近已经推出了SoundMiner HD版本，是简化了的版本，省去了一些大型工作室才会需要的功能，价格也在300美元以内。

Sample Manger和Audio Finder都是比较廉价的工具。就功能设计来说，确实比SoundMiner差得有点远。比如说这两个工具都没有像样的搜索功能，而SoundMiner在搜索和管理上相当强悍。但它们两个对于一般的应用来说，这些功能可能也是够的。

这三个软件现在都可以支持AU或者RTAS插件，也可以直接把样本“飞拽”到PT之类的软件轨道里去，而不需要传统的做法，这是非常方便的。

如社区发表内容存在侵权行为，您可以点击这里查看侵权投诉指引

标签：

景深录音游戏音频

首页

出海助力

开发者社区

大奖赛

同行

合作案例

关于我们

游戏语音后期处理细节若干（续）