游戏语音后期处理细节若干(续)

发表于2017-08-22
评论2 2.9k浏览

原文作者:dmkjyang

前文:游戏语音后期处理细节若干

今早在自己网站上居然发现一篇续文...好吧...转帖一下

哎,有些事情不说倒也轻闲,说了反而问题更多。似乎有些兄弟对这文章的细节有点疑惑或者好奇。确实,如果你从来没有处理过大量语音,那些细节说了反而让人心烦。

Soundforge Normalizer

疑惑最多的是Peak和RMS数值怎么获得,或者说怎么可以知道这段样本的Peak和RMS。说实话,做这个事情我最喜欢的还是Soundforge,而不是PT之类的。Soundforge自带有一个插件叫做Normalizer。这是个放大器,有Peak和RMS两种工作模式,不过这不是重点。重点是这东西可以扫描显示出一段波形的最大PEAK值和平均RMS值。

如图,这是一段语音在未处理前的波形。从波形上看,这段语音的Peak显然没有达到我们一般的标准,并且Peak间的动态差一则不稳定,二则整体动态偏小,三则波形很不好看。实际上,经过合适的后期处理之后,当PEAK和RMS达到我上一篇中说的参考指标的话,整段语音的动态会比现在大,并且PEAK之间的差是相对比较稳定的。如果说足够大的RMS是确保语音音量够大的前提,那么稳定的PEAK差就是确保语音的一些细节不会被别的声音轻易掩盖的要点。

Soundforge Normalizer(只能在Soundforge内使用的),切换到RMS模式,然后点一下红圈里的Scan Levels,就可以得到下面两个值:

这段波形的最大Peak= -5.1dB

这段声音的平均RMS= -24.4dB

 

从数值上看,这个离之前提到的参考标准差距还是蛮大的。首先,PEAK还不算太大,只差个3dB左右;其次,RMS就要相差8dB,这个有点大。要知道10dB的差距就相当于一倍的听觉响度。

*** 当然啊,如果你只选中这段波形里的某一段,而不是整段波形,得到的检测结果一定会和现在的结果不一样。

咱继续,说说我干了什么。在用了Waves RVox Mono之后,整个波形动态会被拉大,Peak超过-3dB,于是乎,拿出Normalizer切换到Peak模式,直接把Peak强行压下去。随后,用那个老掉牙的Steinberg Magneto。啥也别动,完全是默认设置,执行一下就得到一下结果。

【你也可以在Rvox之后,先用那个老掉牙的Magneto压一下,然后再用Normalizer把Peak压到-3dB。这两种做法在这例子中差异不大,但在别的例子里就难保了。所以你最好两个都试试,看那个方便、哪个音质更好一些,随后再做决定。】

现在我们可以看到波形的PEAK值之间相对比较稳定,整个波形看起来比较有规律,色彩最深的地方看起来也比较稳定。通常,你看到这样波形,就意味着这段波形的动态是比较稳定的。但是RMS和PEAK究竟多大,还是看下检测结果比较好。还是用Noramlizer,结果如下:

这段波形的最大Peak= -3dB

这段声音的平均RMS= -14.7dB

有些人会问:你不是说要RMS等于-16dB么?我只能说,多读书是好事,但读傻了就不好玩了。再次强调,这些数值都是参考值。是一个参照基准,如此你才有足够的依据来处理。不然你说多大才好?多小才好?RMS的根本是在判断频响和景深方面提供一个整体、或者基准的依据。

*** Steinberg Magneto是其实是一个软压限,它的默认设置,一般情况下会把RMS提升3dB。Peak当前也会被提升,但是一般都不会很多,如果过多了,再用Normalizer把Peak压到-3左右接口。这东西一般是不会出现Peak过载的,但并不意味着被它压过的声音不会失真。无论如何,Magneto这样的东西是有明显染色的,如果不喜欢,不要勉强。

*** 无论是语音还是音效、音乐,如果你要把一段声音的整体音量提升上却没有CLIP,最好的办法是把PEAK先压下来,然后把RMS推上去。这个过程和使用压缩是一样的。所以,如果你对压缩器够熟悉,也大可直接用压缩。如果你要安全,纠结这些数值,那么就自己动手分步做。当然,再次向那些以钻牛角尖为荣的兄弟们劝一句,如果Peak本来就比较小了,比如说-9dB,那在推上去之前就没必要再压了,直接推吧。

如果没有Soundforge

如果没有Soundforge,这事情会完全是另一个方案。你有几个不错的选择:

1)Wavelab

Wavelab一直像是Steinberg的小三所生,而且总有那么一点像近亲结合的产物,你懂的。其实这东西用来做最终的母带混音和后期处理还是不错的,尤其适合做那种需要挂效果插件链的动作。不知道别人怎么干的,反正我是喜欢把这步骤在wavelab里做,因为保存插件链很方便,而且结果也可以即时看到听到。并且wavelab里面也是可以有多个简便方式获得Peak和RMS值的统计的。

但是,Wavelab的LE版本只保留了一些最基本的功能,比如插件链啥的,对于Peak和RMS值的统计分析,只保留了一个3D频谱视图,基本帮不上你忙。要看到PEAK和RMS,你只能借助第三方插件来。

2)ProTools

ProTools其实应该是很适合做批量的语音后期处理的,可惜它的工作流程设计并不是为这事情,所以你硬上弓也不是不可以。比如说,录音样本的剪切和基本的滤噪啥的,完全可以在PT里面做。但是要看到某段样本的Peak和RMS值,你只好借助第三方插件了。

做这个事情的第三方插件,其实就是电平表啦。非常可惜,我们已经在数字世界了,但是要找一些个使用准确的电平表,比咱预料的要难很多…很多…。不是我感性,事实如此。要能满足我对后期处理需求的电平表插件,单一个插件就比现在PT还贵,比如说TC的!硬件么就不提了。便宜的也有,但基本全部都是残疾货,而且是花里胡哨的残疾货。有时候我很想抽这些厂商。但客观想想呢,也不能怪人家。绝大部分插件,是为音乐和影视制作设计的,而不是为了游戏这种需求设计的。对于音乐和影视,基本没有人会在制作时候需要或许统计后的PEAK和RMS值,而是以观察这些参数的即时变化状况即可。介绍几个我个人觉得还凑合的:NuGen VL-M, NuGen VL-H, Blue Cat Digital Peak Pro。

这里有一点要说明的。现代的影视制作,尤其是电视剧制作,对于语音部分的处理要求已经和游戏里对每句样本的要求很像。我看过一些欧洲最近两年的电视剧分轨,其中的语音轨道里,波形被压得过于好看,不见PEAK但见矬。做游戏,是完全可以借用他们的手法来处理语音的,比如说在PT的语音轨道里,直接加载插件即可。唯一区别是,给游戏用的语音,最后一定要切成一句一句的样本。

3)使用管理工具

是否存在一种软件,它可以同时观察到这堆样本的PEAK和RMS值,如果还能加载一些插件,如果还能做批处理和批转换,并且还能即时看到波形,并且还能做一些简单的剪切啥的,....

答案是肯定的,这种工具是样本管理软件,可惜能够选择的很少,常用的有这么几个:

SoundMiner, Sample Manger, Audio Finder。


这三个软件的性能各有不同。SoundMiner是最贵的,完整版本在900美元上下。但是最近已经推出了SoundMiner HD版本,是简化了的版本,省去了一些大型工作室才会需要的功能,价格也在300美元以内。

Sample Manger和Audio Finder都是比较廉价的工具。就功能设计来说,确实比SoundMiner差得有点远。比如说这两个工具都没有像样的搜索功能,而SoundMiner在搜索和管理上相当强悍。但它们两个对于一般的应用来说,这些功能可能也是够的。

这三个软件现在都可以支持AU或者RTAS插件,也可以直接把样本“飞拽”到PT之类的软件轨道里去,而不需要传统的做法,这是非常方便的。

如社区发表内容存在侵权行为,您可以点击这里查看侵权投诉指引