採样的位数
採样位数可以理解为採集卡处理声音的解析度。这个数值越大,解析度就越高,录製和回放的声音就越真实。我们首先要知道:电脑中的声音档案是用数位0和1来表示的。连续的模拟信号按一定的採样频率经数码脉沖取样后,每一个离散的脉沖信号被以一定的量化精度量化成一串二进位编码流,这串编码流的位数即为採样位数,也称为量化精度。从码率的计算公式中可以清楚的看出码率和採样位数的关系:码率=取样频率×量化精度×声道数。
在电脑上录音的本质就是把模拟声音信号转换成数位信号。反之,在播放时则是把数位信号还原成模拟声音信号输出。採集卡的位是指採集卡在採集和播放声音档案时所使用数位声音信号的二进位位数。採集卡的位客观地反映了数位声音信号对输入声音信号描述的準确程度。8位代表2的8次方--256,16位则代表2的16次方--64K。比较一下,一段相同的音乐信息,16位音效卡能把它分为64K个精度单位进行处理,而8位音效卡只能处理256个精度单位。8位採样的差别在于动态範围的宽窄,动态範围宽广,音量起伏的大小变化就能够更精细的被记录下来,如此一来不论是细微的声音或是强烈的动感震撼,都可以表现的淋漓尽致,而CD音质的採样规格正式16位採样的规格。
16位二进位数的最小值是0000000000000000,最大值是1111111111111111,对应的十进位数就是0和65535,也就是最大和最小值之间的差值是65535,也就是说,它量化的模拟量的动态範围可以差65535,也就是96.32分贝,所以,量化精度只和动态範围有关,和频率回响没关系。动态範围定在96分贝也是有道理的,人耳的无痛苦极限声压是90分贝,96分贝的动态範围在普通套用中足够使用,所以96分贝动态範围内的模拟波,经量化后,不会产生削波失真的。
声音的位数就相当于画面的颜色数,表示每个取样的资料量,当然资料量越大,回放的声音越準确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和準确,不至于把血和西红柿酱混淆。不过受人的器官的机能限製,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。
如今市面上所有的主流产品都是16位的採集卡,而并非有些无知商家所鼓吹的64位乃至128位,他们将採集卡的复音概念与採样位数概念混淆在了一起。如今功能最为强大的採集卡系列採用的EMU10K1晶片虽然号称可以达到32位,但是它只是建立在Direct Sound加速基础上的一种多音频流技术,其本质还是一块16位的音效卡。应该说16位的採样精度对于电脑多媒体音频而言已经绰绰有余了。 很多人都说,就算从原版CD抓轨,再刻录成CD,重放的音质也是不一样的,这个也是有道理的,那麽,既然0101这样的二进数是完全克隆的,重放怎麽会不一样呢?那是因为,时基问题造成的数模互换时的差别,并非是克隆过来的二进位数变了,二进位数一个也没变,时基误差不一样,数模转换后的模拟波的频率和源相比就会有不一样。
採样的频率
採样频率是指录音设备在一秒锺内对声音信号的採样次数,採样频率越高声音的还原就越真实越自然。在当今的主流採集卡上,採样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级,22.05 KHz只能达到FM广播的声音品质,44.1KHz则是理论上的CD音质界限,48KHz则更加精确一些。对于高于48KHz的採样频率人耳已无法辨别出来了,所以在电脑上没有多少使用价值。
5kHz的採样率仅能达到人们讲话的声音质量。
11kHz的採样率是播放小段声音的最低标準,是CD音质的四分之一。
22kHz採样率的声音可以达到CD音质的一半,目前大多数网站都选用这样的採样率。
44kHz的採样率是标準的CD音质,可以达到很好的听觉效果。
採样率类似于动态影像的帧数,比如电影的採样率是24赫兹,PAL製式的採样率是25赫兹,NTSC製式的採样率是30赫兹。当我们把採样到的一个个静止画面再以採样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ採样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个採样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的採样率是有限的。对同一段声音,用20kHz和44.1kHz来採样,重放时,可能可以听出其中的差别,而基本上高于44.1kHZ採样的声音,比如说96kHz採样,绝大部分人已经觉察不到两种採样出来的声音的分别了。之所以使用44.1kHZ这个数值是因为经过了反复实验,人们发现这个採样精度最合适,低于这个值就会有较明显的损失,而高于这个值人的耳朵已经很难分辨,而且增大了数位音频所佔用的空间。一般为了达到"万分精确",我们还会使用48k甚至96k的採样精度,实际上,96k採样精度和44.1k採样精度的区别绝对不会象44.1k和22k那样区别如此之大,我们所使用的CD的採样标準就是44.1k。
位速
位速是指在一个资料流中每秒锺能通过的信息量。您可能看到过音频档案用 "128–Kbps MP3" 或 "64–Kbps WMA" 进行描述的情形。Kbps 表示 "每秒千位数",因此数值越大表示资料越多:128–Kbps MP3 音频档案包含的资料量是 64–Kbps WMA 档案的两倍,并佔用两倍的空间。(不过在这种情况下,这两种档案听起来没什麽两样。原因是什麽呢?有些档案格式比其他档案能够更有效地利用资料, 64–Kbps WMA 档案的音质与 128–Kbps MP3 的音质相同。)需要了解的重要一点是,位速越高,信息量越大,对这些信息进行解码的处理量就越大,档案需要佔用的空间也就越多。
为项目选择适当的位速取决于播放目标:如果您想把製作的 VCD 放在 DVD 播放器上播放,那麽影片必须是 1150 Kbps,音频必须是 224 Kbps。典型的 206 MHz Pocket PC 支持的 MPEG 影片可达到 400 Kbps-超过这个限度播放时就会出现异常。
VBR
VBR(Variable Bitrate)动态比特率。也就是没有固定的比特率,压缩软体在压缩时根据音频资料即时确定使用什麽比特率。这是Xing发展的演算法,他们将一首歌的复杂部分用高Bitrate编码,简单部分用低Bitrate编码。主意虽然不错,可惜Xing编码器的VBR演算法很差,音质与CBR相去甚远。幸运的是, Lame完美地最佳化了VBR演算法,使之成为MP3的最佳编码模式。这是以质量为前提兼顾档案大小的方式,推荐编码模式。
ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。Lame针对CBR不佳的档案体积比和VBR生成档案大小不定的特点独创了这种编码模式。ABR也被称为"Safe VBR",它是在指定的平均Bitrate内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量。举例来说,当指定用192kbps ABR对一段wav档案进行编码时,Lame会将该档案的85%用192kbps固定编码,然后对剩余15%进行动态最佳化:复杂部分用高于192kbps 来编码、简单部分用低于192kbps来编码。与192kbps CBR相比,192kbps ABR在档案大小上相差不多,音质却提高不少。ABR编码在速度上是VBR编码的2到3倍,在128-256kbps範围内质量要好于CBR。可以做为 VBR和CBR的一种折衷选择。
CBR(Constant Bitrate),常数比特率,指档案从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的档案体积很大,但音质却不会有明显的提高。
对MP3来说Bitrate是最重要的因素,它用来表示每秒锺的音频资料佔用了多少个bit(bit per second,简称bps)。这个值越高,音质就越好。
MP3
MP3的全称应为MPEG1 Layer-3音频档案,MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组,特指活动影音压缩标準,MPEG音频档案是MPEG1标準中的声音部分,也叫MPEG音频层,它根据压缩质量和编码复杂程度划分为三层,即Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3这三种声音档案,并根据不同的用途,使用不同层次的编码。MPEG音频编码的层次越高,编码器越复杂,压缩率也越高,MP1和MP2的压缩率分别为4:1和6:1-8:1,而MP3的压缩率则高达 10:1-12:1,也就是说,一分锺CD音质的音乐,未经压缩需要10MB的存储空间,而经过MP3压缩编码后只有1MB左右。不过MP3对音频信号採用的是有损压缩方式,为了降低声音失真度,MP3採取了"感官编码技术",即编码时先对音频档案进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3档案,并使压缩后的档案在回放时能够达到比较接近原音源的声音效果。(另MP3PRO: mp3PRO编码器将音频的录音分成两个部分:mp3部分和PRO部分。mp3部分分析低频段(Low Frequency Band)信息,并将其编码成通常的mp3档案资料流。这就使得编码器能够集中编码更少的有用信息,获得更佳品质的编码效果。同时,这也保证了 mp3PRO档案同老的mp3播放器的兼容性。PRO部分分析的则是高频段(High Frequency Band)信息,并将其编码成mp3资料流的一部分,而这些通常在老的mp3解码器裏是被忽略的。新的mp3PRO解码器会有效地利用这部分资料流,将两段(高频段和低频段)合并起来产生完全的音频带,达到增强音质的效果。


















