主办单位:全国创争活动指导协调小组 中华职工学习网首页 情景站 联系电话:010-68232149
科学研究人员 | 工程技术人员 | 购销人员 | 仓储人员 | 运输服务人员 | 体育工作人员 | 教学人员 | 购销人员

电视广播中的音频嵌入技术

http://www.51xue.org.cn  2007/5/29 源自:互联网 【字体: 字体颜色

  同亮度信号量化一样,表示“004~039”量化电平的第“4~63”60个字保留给负电平过冲,而不同的是,只将表示“3CI~3FC”量化电平的第“961~1019”59个字保留给正电平过冲,比亮度信号的白电平过冲少保留20个量化电平。这样色差信号的“-350~+350mV”电平的量化字为897个(第64~960),比亮度信号的“0~700mV”电平的量化多了20个字。
  在色差信号的量化中,零电平在表示量化电平“200”的第512字上,峰负电平在表示量化电平“040”的第64字上,峰正电平在表示量化电平“3CO”的第960字上。
  同样,根据4∶2∶2的取样方式,在有效行的720个象素上,Cb、Cr各有360个取样字。
  (1)并行分量数字标准—SMPTE125M/EBUTech3267
  CCIR601(ITU-RBT.601-2)阐述了信号的取样。SMPTE和EBU分别制定了适合于取样的数据电气接口规定。SMPTE制定了525/59.94并行接口规定,称为SMPTE标准125M(早期的RP125标准),而EBUTech 3267则规定了625/50接口(早期的EBUTech 3246标准)。两者都为CCIR所接受,并收入推荐书656。同样现称ITUR BT.656。
  并行接口使用11股绞线,25芯D型连接器。(早期文件规定连接器采用滑扣锁定方式。后来,文件修改为使用4/40固定方式)。这种接口按照Cb、Y、Cr、Y、Cb的顺序,将多路数据字连续发送出去。传送数据率是27M字/秒。在每行上都叠加定时时序SAV和EAV,以表示有效视频的起始点和终点。有效数字行内含720个亮度取样。在有效行中包含了表示行消隐的区间。
  由于EAV和SAV代表了定时信息,因此,没有必要传送通常的同步信号。行消隐区(也包含场消隐区中的行正程)可以用于传送辅助数据。在这个数据空间是可以用来携带数字音频信息的。SMPTE也制定了相应的文件,对音频数据包的格式和分配标准作了规定。
  (2)串行分量数字信号
  数字设备的并行接口连接方式有线缆和特征的局限,通常只能适合于相当小型的设备。很明显,在大型设备和电视系统中,需要采用一种能通过一条同轴电缆串行传送的方式。因为传送数据率很高,所以,实现起来并不简单。如果信号不经过处理就串行传送,要可靠地恢复原信号就很困难,因此在传送前,串行信号必须经过修正,以保证足够的边沿。
  一种新型的,采用扰频和变换到NRZI的接口,现在已被SMPTE(SMPTE259M)和EBU(TECH326)采纳为标准。这种接口接受修正并行接口送来的10比特信号,传送比特率为270Mb/S的数字分量串行信号(SDI)。分量信号不需要进一步处理。这是因为并行接口中的SAV和EAV信号,提供了统一的时序。它能够识别串行区域,以便形成字帧信号。如果辅助数据(例如伴音信号)已插入并行信号,则该数据可以被串行接口传送。这种串行接口可以使用普通的视频同轴电缆。
  (3)分量数字视频信号的水平行
  图6所示,表明了分量数字视频信号水平行取样字的位置。我们知道,在有效行中有720个Y取样字,分别有360个Cb和Cr取样字,总共有1440个取样字(0~1439)。行消隐期间,525/60可安排276个取样字,625/50可安排288个取样字。这样,对于一个水平行,525/60有1716个取样字,625/50有1728个取样字。
  在行消隐期间表示“SAV”和“EAV”的4个码字,前3个字相同,都是3FF/000/000,不同的是称作“XYZ”的第4个字。在“XYZ”字中其第8比特(F比特)的状态表征所取样的行在奇数场或偶数场,第7比特(V比特)的状态表征所取样的行在场消隐期间或正程期间,第6比特(H比特)的状态表征是“SAV”还是“EAV”。另有6个比特用于比特纠错。
  (4)NRZ码对NRZI码的转换
  分量数字视频信号(D1格式)的半行方式输出时,产生的270Mb/s码流为不归零码(NRZ码)。NRZ码的逻辑“0”并非真正的“0”电平(如0mV),而仅指输出低电平,同样,逻辑“1”也并非真正的“1”电平(如700mV等),而仅指输出的高电平。这意味着NRZ码对极性很敏感,传送中的噪声电平都会产生错误的“0”和“1”。另外,NRZ码对接收机和D/A转换器的常“0”和常“1”码的运行也束手无策。码流中当出现常“0”和常“1”码的运行时,意味着码流中低频成分很丰富,即常“0”和常“1”运行期间不发生取样时钟的跳变,这时接收机和D/A转换器的锁相环的本振,由于得不到时钟信息的修正而漂移,进而造成锁相环失锁,从而产生严重的接收误码。通过对NRZ码进行加扰,能去除NRZ码的这两个缺陷。加扰的数字方程式为G1(x)=x9+x4+1和G2(x)=x+1(G1为扰频输出,G2为NRZI编码器输出)。加扰后的NRZ码变为NRZ1码,称之为倒相不归零码。NRZ1码的特点是,不把输出的高、低电平分别看作“1”和“0”,而仅把高、低电平之间的变化认作“1”和“0”,对高、低电平的极性不再敏感。NRZ1码的另一个优点是,通过NRZ码的加扰,打破常“0”和常“1”的运行,使“1”和“0”的比值非常接近1,为接收机和D/A转换器产生了最多的过零点(即提供了丰富的时钟信息),使接收机和D/A转换器锁相环与取样时钟紧紧相锁,保证工作正常。扰频是适用于串行数据传输的一项技术,是在取样并行数据转为串行码流的过程中实现的。
  图7表示模拟信号取样的并行数据是怎样产生半行数据流信号的过程。并行时钟用于把取样数据输入移相寄存器,以十倍于并行时钟的速率,将比特位传递下去。在每十位数据字中,首先传递LSB(最低有效位),如果输入端的可用数据只有8位,则串行编码器在最后两位置零,以产生完整的十位字(在图7中,MSB表示最高有效位。)
  2、 复合数字视频信号
  数字技术初始实验阶段,都是基于对复合模拟信号(NTSC或PAL)进行取样,在实际操作中确认,为了取得最高的质量,还必须采用分量方式处理。于是产生的第一个数字标准,就是分量标准。直至宣告推出称之为D2格式的复合数字录像机系统后,复合数字格式又重新引起界内人士进一步研讨实验的兴趣。最初设计这种机器的目的,是作为模拟信号(NTSC或PAL)系统中的输入输出设备使用。采用数字式的输入输出设备进行机对机的多代复制,可收到很好的效果。因此,逐渐地出现了一系列的各种类型的制作设备。
  复合数字视频信号以4倍副载波频率进行取样。NTSC制标称取样频率14.3MHz,而PAL制为17.7MHz。与分量接口一样,复合数字信号的有效行中足以表示模拟信号的有效行和消隐信号。与分量接口不同的是,复合接口发送的数字信号表示行消隐期间的普通同步和色同步信号。在复合接口上还传递表示场同步和均衡脉冲的数字信息。
  复合数字设备具有数字处理和接口的各种优点,尤其是数字录像的多代复制性能。但也存在一些局限性,由于是对复合模拟信号直接取样,就保留了NTSC制和PAL制编码方式的烙印,其固有的缺陷,也是无法解决的。
  (1) 并行复合数字信号
  与分量数字方式一样,并行复合接口使用多芯电缆和25芯“D”型连接器。实践证明,对于小型和中型规模的设备还能适应,但对大型设备而言,还是需要串行接口。NTSC制的复合数字并行接口标准是SMPTE 244M,EBU也有关于PAL制的接口标准。两种接口标准都规定为10比特的精度。
  (2) 串行复合数字信号
  SMPTE 259M阐述的扰频NRZI串行接口,也可用来传送复合数字信号。从10比特并行接口来的数据,经过串接,按分量接口使用用同样算法经过扰频处理,变换为NRZI信号。最终的数据率为:NTSC是143Mb/s,PAL是177Mb/s。
  与分量信号相比,复合信号从并行到串行的变换稍微复杂一些。在并行分量接口中的SAV和EAV信号提供了独特的序列,能够在串行信号流中被识别出来,而并行复合接口并不具备这样的信号,因此,必须在串接前,在并行信号中插入适当的定时基准信号(TRS)于同步顶位置,用3个字表示TRS信号,以保证在串行接收机中实现成帧,然后在接收机中再去掉TRS信号。
  复合并行接口不具备发送附加数据的能力,由于发送同步和色同步信息占据了较多的数据空间,相对插入数据空间变小了。从并行转到串行的过程中,辅助数据可以插在同步顶位置。该数据空间足够发送4个通道的AES/EBU数字音频信号(两组立体声信号)。诸如音频信号之类的附加信号,可以预先在信号串接时加入,这个过程通常是利用插入TRS信号的同一个公用处理器实现的。
  3、 数字音频
  在分析了数字视频信号的基础上,让我们再看一看被嵌入的音频信号的具体表征。
  1992年,美国音频工程师协会(AES)和欧洲广播联盟(EBU)共同制定了数字音频的接口标准,即AES/EBU数字音频格式。在这个基础上,国际电信联盟将其归纳为ITU-R BS647-2号建议书《广播演播室数字音频信号的接口》(A DIGITAL AUDIO INTERFACE FOR BROADCASTING STUDIOS)。
  AES/EBU音频被广泛地使用在演播室的各种数字音频设备间,数字域内的相互联接之中。就是我们谈及的嵌入音频,具体的音频格式,将在音频嵌入部分中详细表述。
  当讨论数字音频时,最重要的考虑问题之一,就是每个取样的二进制数的个数,当视频按每个取样为8位或10位二进制数时,音频设备的位数范围应该是16~20位,以提高所需要的动态范围和信杂比(SNR)。确定数字音频信杂比SNR的基本公式是:
  SNR=(6.02×n)+1.76(dB)
  式中“n”是每个取样二进制数的位数
  对于16位系统,最高理论SNR应为(6.02×16)+1.76=98.08dB,18位系统SNR为110.2dB,20位系统SNR为122.16dB。不难看出,一个设计优良的音频设备系统,若能取得100~110 dB的信杂比,按公式计算,SNR为110 dB时,该系统具有的等效分解力为18.3比特(位).

[1][2]

  相关链接
  相关评论