电视广播中的音频嵌入技术

http://www.51xue.org.cn 2007/5/29 源自:互联网　【字体：

】

　　同亮度信号量化一样，表示“004～039”量化电平的第“4～63”60个字保留给负电平过冲，而不同的是，只将表示“3CI～3FC”量化电平的第“961～1019”59个字保留给正电平过冲，比亮度信号的白电平过冲少保留20个量化电平。这样色差信号的“-350～+350mV”电平的量化字为897个（第64～960），比亮度信号的“0～700mV”电平的量化多了20个字。
　　在色差信号的量化中，零电平在表示量化电平“200”的第512字上，峰负电平在表示量化电平“040”的第64字上，峰正电平在表示量化电平“3CO”的第960字上。
　　同样，根据4∶2∶2的取样方式，在有效行的720个象素上，Cb、Cr各有360个取样字。
　　（1）并行分量数字标准—SMPTE125M/EBUTech3267
　　CCIR601（ITU-RBT.601-2）阐述了信号的取样。SMPTE和EBU分别制定了适合于取样的数据电气接口规定。SMPTE制定了525/59.94并行接口规定，称为SMPTE标准125M（早期的RP125标准），而EBUTech 3267则规定了625/50接口（早期的EBUTech 3246标准）。两者都为CCIR所接受，并收入推荐书656。同样现称ITUR BT.656。
　　并行接口使用11股绞线，25芯D型连接器。（早期文件规定连接器采用滑扣锁定方式。后来，文件修改为使用4/40固定方式）。这种接口按照Cb、Y、Cr、Y、Cb的顺序，将多路数据字连续发送出去。传送数据率是27M字/秒。在每行上都叠加定时时序SAV和EAV，以表示有效视频的起始点和终点。有效数字行内含720个亮度取样。在有效行中包含了表示行消隐的区间。
　　由于EAV和SAV代表了定时信息，因此，没有必要传送通常的同步信号。行消隐区（也包含场消隐区中的行正程）可以用于传送辅助数据。在这个数据空间是可以用来携带数字音频信息的。SMPTE也制定了相应的文件，对音频数据包的格式和分配标准作了规定。
　　（2）串行分量数字信号
　　数字设备的并行接口连接方式有线缆和特征的局限，通常只能适合于相当小型的设备。很明显，在大型设备和电视系统中，需要采用一种能通过一条同轴电缆串行传送的方式。因为传送数据率很高，所以，实现起来并不简单。如果信号不经过处理就串行传送，要可靠地恢复原信号就很困难，因此在传送前，串行信号必须经过修正，以保证足够的边沿。
　　一种新型的，采用扰频和变换到NRZI的接口，现在已被SMPTE（SMPTE259M）和EBU（TECH326）采纳为标准。这种接口接受修正并行接口送来的10比特信号，传送比特率为270Mb/S的数字分量串行信号（SDI）。分量信号不需要进一步处理。这是因为并行接口中的SAV和EAV信号，提供了统一的时序。它能够识别串行区域，以便形成字帧信号。如果辅助数据（例如伴音信号）已插入并行信号，则该数据可以被串行接口传送。这种串行接口可以使用普通的视频同轴电缆。
　　（3）分量数字视频信号的水平行
　　图6所示，表明了分量数字视频信号水平行取样字的位置。我们知道，在有效行中有720个Y取样字，分别有360个Cb和Cr取样字，总共有1440个取样字（0～1439）。行消隐期间，525/60可安排276个取样字，625/50可安排288个取样字。这样，对于一个水平行，525/60有1716个取样字，625/50有1728个取样字。
　　在行消隐期间表示“SAV”和“EAV”的4个码字，前3个字相同，都是3FF/000/000，不同的是称作“XYZ”的第4个字。在“XYZ”字中其第8比特（F比特）的状态表征所取样的行在奇数场或偶数场，第7比特（V比特）的状态表征所取样的行在场消隐期间或正程期间，第6比特（H比特）的状态表征是“SAV”还是“EAV”。另有6个比特用于比特纠错。
　　（4）NRZ码对NRZI码的转换
　　分量数字视频信号（D1格式）的半行方式输出时，产生的270Mb/s码流为不归零码（NRZ码）。NRZ码的逻辑“0”并非真正的“0”电平（如0mV），而仅指输出低电平，同样，逻辑“1”也并非真正的“1”电平（如700mV等），而仅指输出的高电平。这意味着NRZ码对极性很敏感，传送中的噪声电平都会产生错误的“0”和“1”。另外，NRZ码对接收机和D/A转换器的常“0”和常“1”码的运行也束手无策。码流中当出现常“0”和常“1”码的运行时，意味着码流中低频成分很丰富，即常“0”和常“1”运行期间不发生取样时钟的跳变，这时接收机和D/A转换器的锁相环的本振，由于得不到时钟信息的修正而漂移，进而造成锁相环失锁，从而产生严重的接收误码。通过对NRZ码进行加扰，能去除NRZ码的这两个缺陷。加扰的数字方程式为G1（x）=x9+x4+1和G2(x)=x+1(G1为扰频输出，G2为NRZI编码器输出)。加扰后的NRZ码变为NRZ1码，称之为倒相不归零码。NRZ1码的特点是，不把输出的高、低电平分别看作“1”和“0”，而仅把高、低电平之间的变化认作“1”和“0”，对高、低电平的极性不再敏感。NRZ1码的另一个优点是，通过NRZ码的加扰，打破常“0”和常“1”的运行，使“1”和“0”的比值非常接近1，为接收机和D/A转换器产生了最多的过零点（即提供了丰富的时钟信息），使接收机和D/A转换器锁相环与取样时钟紧紧相锁，保证工作正常。扰频是适用于串行数据传输的一项技术，是在取样并行数据转为串行码流的过程中实现的。
　　图7表示模拟信号取样的并行数据是怎样产生半行数据流信号的过程。并行时钟用于把取样数据输入移相寄存器，以十倍于并行时钟的速率，将比特位传递下去。在每十位数据字中，首先传递LSB（最低有效位），如果输入端的可用数据只有8位，则串行编码器在最后两位置零，以产生完整的十位字（在图7中，MSB表示最高有效位。）
　　2、复合数字视频信号
　　数字技术初始实验阶段，都是基于对复合模拟信号（NTSC或PAL）进行取样，在实际操作中确认，为了取得最高的质量，还必须采用分量方式处理。于是产生的第一个数字标准，就是分量标准。直至宣告推出称之为D2格式的复合数字录像机系统后，复合数字格式又重新引起界内人士进一步研讨实验的兴趣。最初设计这种机器的目的，是作为模拟信号（NTSC或PAL）系统中的输入输出设备使用。采用数字式的输入输出设备进行机对机的多代复制，可收到很好的效果。因此，逐渐地出现了一系列的各种类型的制作设备。
　　复合数字视频信号以4倍副载波频率进行取样。NTSC制标称取样频率14.3MHz，而PAL制为17.7MHz。与分量接口一样，复合数字信号的有效行中足以表示模拟信号的有效行和消隐信号。与分量接口不同的是，复合接口发送的数字信号表示行消隐期间的普通同步和色同步信号。在复合接口上还传递表示场同步和均衡脉冲的数字信息。
　　复合数字设备具有数字处理和接口的各种优点，尤其是数字录像的多代复制性能。但也存在一些局限性，由于是对复合模拟信号直接取样，就保留了NTSC制和PAL制编码方式的烙印，其固有的缺陷，也是无法解决的。
　　（1）并行复合数字信号
　　与分量数字方式一样，并行复合接口使用多芯电缆和25芯“D”型连接器。实践证明，对于小型和中型规模的设备还能适应，但对大型设备而言，还是需要串行接口。NTSC制的复合数字并行接口标准是SMPTE 244M，EBU也有关于PAL制的接口标准。两种接口标准都规定为10比特的精度。
　　（2）串行复合数字信号
　　SMPTE 259M阐述的扰频NRZI串行接口，也可用来传送复合数字信号。从10比特并行接口来的数据，经过串接，按分量接口使用用同样算法经过扰频处理，变换为NRZI信号。最终的数据率为：NTSC是143Mb/s，PAL是177Mb/s。
　　与分量信号相比，复合信号从并行到串行的变换稍微复杂一些。在并行分量接口中的SAV和EAV信号提供了独特的序列，能够在串行信号流中被识别出来，而并行复合接口并不具备这样的信号，因此，必须在串接前，在并行信号中插入适当的定时基准信号（TRS）于同步顶位置，用3个字表示TRS信号，以保证在串行接收机中实现成帧，然后在接收机中再去掉TRS信号。
　　复合并行接口不具备发送附加数据的能力，由于发送同步和色同步信息占据了较多的数据空间，相对插入数据空间变小了。从并行转到串行的过程中，辅助数据可以插在同步顶位置。该数据空间足够发送4个通道的AES/EBU数字音频信号（两组立体声信号）。诸如音频信号之类的附加信号，可以预先在信号串接时加入，这个过程通常是利用插入TRS信号的同一个公用处理器实现的。
　　3、数字音频
　　在分析了数字视频信号的基础上，让我们再看一看被嵌入的音频信号的具体表征。
　　1992年，美国音频工程师协会（AES）和欧洲广播联盟（EBU）共同制定了数字音频的接口标准，即AES/EBU数字音频格式。在这个基础上，国际电信联盟将其归纳为ITU-R BS647-2号建议书《广播演播室数字音频信号的接口》（A DIGITAL AUDIO INTERFACE FOR BROADCASTING STUDIOS）。
　　AES/EBU音频被广泛地使用在演播室的各种数字音频设备间，数字域内的相互联接之中。就是我们谈及的嵌入音频，具体的音频格式，将在音频嵌入部分中详细表述。
　　当讨论数字音频时，最重要的考虑问题之一，就是每个取样的二进制数的个数，当视频按每个取样为8位或10位二进制数时，音频设备的位数范围应该是16～20位，以提高所需要的动态范围和信杂比（SNR）。确定数字音频信杂比SNR的基本公式是：
　　SNR=（6.02×n）+1.76(dB)
　　式中“n”是每个取样二进制数的位数
　　对于16位系统，最高理论SNR应为（6.02×16）+1.76=98.08dB，18位系统SNR为110.2dB，20位系统SNR为122.16dB。不难看出，一个设计优良的音频设备系统，若能取得100～110 dB的信杂比，按公式计算，SNR为110 dB时，该系统具有的等效分解力为18.3比特（位）.

[1]

[2]

上一篇文章：非线性编辑网络的管理维护心得
下一篇文章：浅谈新闻播音员布光

[发表评论] [打印此文] [关闭窗口] [返回顶部]

推荐新闻

热门文章

电视广播中的音频嵌入技术