物理 CD那些事~其之一:CD的原理

很多人认为音乐CD(也就是cdda或者说买的cd)和刻录CD(CD-R/Rw)是一回事,的确,二者在物理层面上几乎一致,但是逻辑上二者完全不同。cdda是没有文件系统的,cdda上数据是螺旋状的不间断轨道,而不是数据文件。cdda是以物理的方式保存经过调制后的数字音频的二进制信号(44.1khz,16bit,PCM调制)。而音频文件例如wave格式(.wav)是一个封装好的容器,里面可以存放任意编码和规格的二进制数据。cdda是信号,cd-r/rw是数据。但是如果你将cdda放入电脑读取,你仍会看到后缀名为cda的文件,大小只有几十个字节,这是为了能让电脑正常读取而创建的虚拟文件而已,文件并不真实存在于cd。
无论是cdda还是cd-r/rw,盘片都划分了几个区域。最内圈是leadin area和toc即内圈条形码往外2mm宽度的区域,这个区域用于保存一些基本信息,例如分曲目录时间吗。中间是数据区,用于存储音频数据。最外圈有保留区,cdtext就保存在那里。
很多科普说数据是记录在金属反光层上的。实际上,数据是以凹凸(pit and land)通过压印的方式记录在树脂基盘上(cdda)。那层金属放光层顾名思义只是反光而已。而cd-r/rw虽然不是记录在基盘上,但也不是记录在反光层上,而是记录于有变相材料的数据层上。从这里可以看出,cdda光盘可以保存三十年以上,保存时间短的只是劣质的cdr光盘而已。
需要解释的一个误区在于,pit和land并不对应二进制的0和1,在cd光盘上,每次凹凸切换代表1,而凹槽和凸起的长度代表1后面跟着多少个0。这种记录数据的方式也被称为非归零倒置信道脉冲编码(NRZ-i)。由于这种存储方式仅需检测高低电平是否发生了反转,即可读出正确数据,因此它也具有极强的抗干扰能力。需要注意的是,无论是cd-r/rw还是cdda又或cd-rom,都有一系列的时钟同步和数据校验机制来保证数据读取正确性和完整性。另外,cd光盘里每一个数据帧里都有8字节CIRC校验帧(简称F2),Circ是一种交错式编码,纠错能力强。这也是为什么cd抓鬼软件提供c1c2纠错码选项的来源。
实际上,cd标准时间是74min并不是因为某个人一拍脑门想出来的,是科学计算出来的。无数实验证明,人无法直接的听到21khz以上的超声波。但是为了给低通滤波器留够余量,cd的高切频率最终定在22khz。而根据奈奎斯特采样定律,能完美采样22khz的采样率必须大于22khz的两倍(等于都不行),因此pcm采样率最终选择了44.1khz。人耳不能长时间处在90db以上的环境中,而人耳对于不同频率声音的声压级感知不同,如果此时1khz测试音刚好能被人耳分辨,那么20hz的声压级就要给到75db-psl左右听起来的响度才能与1khz的响度相同。而为了能让音乐声听起来比噪声大,在1khz音频为30db-spl左右时,低频声音的声压级需要大概95db-spl。对于数字音频而言,动态范围=20log10(2n) dB计算后约等于6.02db。也就是说,1bit采样位深约等于6db动态范围。而16bit采样时动态范围大约是96db。所以最终cd参数被确定为44.1khz采样 16bit位深 PCM调制。而当时索尼飞利浦两家只有在光盘尺寸小于等于12cm时才能保证良品率和质量,因此cd被最大直径确认为12cm。而另一方面,受限于当时的激光头镜片精度限制,cd光头最小能分辨2.1微米,为了保证极限情况下光头不会同时读取两条轨道,因此明确规定了轨道宽度为0.5微米,轨道间距1.6微米,两者相加正好是2.1微米。并且规定最内圈2mm是lead in和toc区域,最外圈保留区,有了这些限制后,cd此时只能容纳74分钟的内容了。不过后来人们又发现,光头因为聚焦等问题,激光边缘不存在同时读取两条轨道的问题,因此后期轨道间距从1.6降低到1.5微米,并优化了纠错编码,此时cd总时长增加到了80分钟。
以及cd全称compact disc,也称压缩碟。cd-r全程compact disc record,cdrw全称compact disc rewritable