Switchbox 中国

【技术文章】

深入理解MPEG-2
李永葆
本文作者李永葆先生，北京中科大洋科技发展股份有限公司硬件部经理
从MPEG-2技术标准出台以来，基于MPEG-2技术的电视台应用方案和新设备不断推出，吸引了业界的众多目光。为了便于电视台选择设备，我们客观地介绍MPEG-2技术的特点和发展现状，期望对大家有所帮助。一 MPEG-2是什么　　1. MPEG-2的起源　　MPEG组织是在ISO的召集下，为数字视/音频制定压缩标准的专家组。该组织在1992年制定了MPEG-1标准。为满足广电行业的需求，又在1994年推出了MPEG-2压缩标准，以实现视/音频服务与应用互操作的可能性。　　MPEG-2使用了DCT、运动补偿和Huffman编码三种技术。DCT降低了图像的空间冗余度，运动补偿降低了图像的时间冗余度，而Huffman编码则降低了图像的信息冗余度。　　MPEG-2标准分四个文件，即系统层(ISO13818-1)、视频压缩层(ISO13818-2)、音频压缩层(ISO13818-3)和一致性(ISO13818-4)。MPEG-2标准的适应性很强，可用于广播电视链路的所有环节。　　2. MPEG-2的类和级　　MPEG-2在设计时被定义为一个通用的视/音频压缩标准，要求能兼顾不同的应用需求，能对输出码率和图像质量进行控制。为此，MPEG-2压缩算法分成不同的类别(Profile)和级别(Level)。目前在广播界的视频应用中，一般有MP@ML(取样为4:2:0)和4:2:2P@ML (取样为4:2:2)两种。二者输出码率分别在5～15Mb/s和15～50Mb/s。节目制作一般使用4:2:2 P，因为这个类设置了50Mb/s的码率上限，能保证图像信号的质量。　　3. MPEG-2的视频码流结构　　为更好地表示编码数据，MPEG-2用句法规定了一个层次性结构。它分为六层，自上到下分别是：图像序列层、图像组(GOP)、图像、宏块条、宏块、块。　　图像序列由图像组构成，是随机存取段落。图像组是为方便随机存取而加的，其结构和长度均可变，是随机存取的视频单位。图像是独立的显示单位，也是基本的编码单位。宏块条包含若干个连续的宏块，是重新同步单位，其设置目的是防止误码的扩散。图像以亮度阵列被分成16×16宏块，宏块是进行运动补偿的基本单位，一个宏块包含4个8×8亮度块，4:2:0取样时一个宏块包含2个8×8色度块；4:2:2取样时一个宏块4个8×8色度块。块是进行DCT运算的单位，仅包含亮度或色度。　　4. MPEG的图像类型及码流组成　 MPEG-2在压缩方面有帧内压缩和帧间压缩两种方式，使用三种类型的图像，即I帧、P帧和B帧。　　I帧使用帧内压缩，不使用运动补偿，提供中等压缩比。由于I帧不依赖其它帧，所以是随机存取的入点，同时是解码的基准帧。　　P帧根据前面的I帧或P帧进行预测，使用运动补偿算法进行压缩，压缩比要比I帧高。P帧是对B帧和后继P帧进行解码的基准帧。它本身有误差，会造成误差传播。　　B帧是基于内插重建的帧，它基于前后两个IP帧或PP帧，不传播误差。它使用双向预测进行压缩，提供更高的压缩比。　　一个GOP由I帧作为起始，其长度可变。长GOP可以提供高的压缩比，但是会造成随机存取的延迟和误差的积累。一般每秒内有两个I帧，用作随机存取的入口。　　MPEG-2标准中没有规定GOP的结构，帧重复方式可以是IP、IB、IBP、IBBP甚至纯I帧。帧重复频率影响输出码率，也影响存取延迟。　　5. MPEG-2的音频　　MPEG-2标准的第一个文件(系统部分)中，规定了如何组合视频和音频数据的复接结构，以及代表时间信息的方法。但是在压缩编码时，视频和音频相互独立。本文着重讨论MPEG-2的视频应用。二 MPEG-2带来了什么　　新的技术会带来很大的好处，但由于其存在局限性，总是有一些折衷，MPEG-2也不例外。　　1. 压缩标准的比较　　目前，广电行业一般使用MPEG-2、DV和M-JPEG图像压缩格式。这三种压缩算法在硬件支持下，可以在正常视频帧率下提供相当好的图像质量。　　在同样的视频质量下，压缩算法输出码率决定其性能的优劣，或者说，在输出码率相同的条件下，图像质量的优劣反映了压缩算法的性能。M-JPEG和DV均采用帧内压缩方式，压缩效率要比MPEG-2低。当然，在低码率的时候，MPEG-2可以提供比M-JPEG高的压缩比而保持较好的图像质量；在要求高图像质量的时候(比如节目编辑和后期制作)，MPEG-2与M-JPEG、DV的输出码率差别要小得多。　　电视台业务的多样性要求压缩标准能提供多种码率。可变码率(VBR)特性对电视台有效利用资源非常重要。MPEG-2可以通过改变GOP结构和DCT及Huffman编码的参数来调整输出码率；M-JPEG可以通过改变DCT及Huffman编码参数调节压缩比；DV格式因其应用特点，没有提供VBR。M-JPEG发展较早，在非线性视频编辑方面应用多年，软、硬件技术成熟，成本低廉，以目前硬件平台而言，平均比MPEG-2平台便宜5000美元左右。目前的电视台业务中，还不能脱离磁带机。DV的优势是与磁带机结合紧密，能实现倍速上下载。另外，M-JPEG和DV均采用帧内压缩方式，可以提供精确到帧的随机存取访问，而无任何延迟。纯I帧的MPEG-2基本和M-JPEG相同，能以帧精度存取。二者的区别是：I帧的MPEG-2有码率上限，而M-JPEG没有，因而能应付对图像质量要求苛刻的情况。　　大家在讨论MPEG-2标准的好处时，最强调的是其压缩效率高。但是有一点必须澄清，就是这个事实只发生在不太强调图像质量的情况下。一个典型的例子是演播室节目编辑和后期制作。在演播室进行节目编辑时，对图像质量要求都很高，如果采用MPEG-2，必须采用低压缩比、4:2:2取样的码流才能满足要求。这时，输出码率甚至会达到50Mb/s码率上限。在这么高的码率上，MPEG-2相对于另外两种标准，优势并不明显。　　目前，M-JPEG、DV和MPEG-2三个标准各有长处，设备都获得了广泛使用，没有任何迹象表现出某个标准会一统天下。日本和北美大多用DV格式进行后期制作；EBU在1999年的D84、D85技术声明中推荐电视台在演播室使用50Mb/s的纯I帧4:2:2P MPEG-2；而中国在广泛使用M-JPEG的同时热烈讨论IBP格式的编辑。　　电视台在是否选择MPEG-2设备上，担心这样一些问题：投资MPEG-2设备到底能带来多大的收益？MPEG-2标准能不能成为一种贯穿电视台全部业务的纽带，从而更加提高效率呢？　　2. MPEG-2带来的好处　　我们认为，MPEG-2标准带来的好处体现在它的适应性。它有两大特点：一个是运动补偿带来的高压缩比；另一个是码率可变。在MPEG-2标准的文件中，详细定义了压缩数据在存储和传输中的句法结构，并且只定义了对MPEG-2压缩数据的解码过程，因此MPEG-2针对性最强的应用是存储和传输。目前MPEG-2技术在电视业务的某些应用上具有不可比拟的优势。　　a. 数字化片库　　压缩比的提高，使得节目存储所需资源大大降低。电视台保存的节目带数量惊人，磁带保存带来的问题是图像质量下降、不便于管理、难以共享使用。采用基于MPEG-2的数字化节目库，可以较好地解决这些问题。　　b. 节目传播　　由于在低至1.5Mb/s的码率下MPEG-2数据流仍然能提供相当的图像质量，在地面、有线电视和卫星广播上都极具吸引力，这意味着在传送相同节目量的情况下，可以大大节省成本。由于MPEG-2输出码率可变，可以根据节目类型选择不同的压缩比，以达到更好的资源利用率。正是基于这些原因，MPEG-2已经被作为数字电视广播的压缩标准。　　c. 高清晰度电视　　由于高清晰度电视节目传输需要很高的带宽，必须用高压缩比才能完成传送。在这一点上，目前只有MPEG-2技术能够胜任。　　此外，在数字化视频磁带、激光视盘、电视会议及数字照相机等方面，MPEG-2也具有相当广的应用前景。　　3. MPEG-2带来的问题　　M-JPEG、DV都能提供精确到帧的随机访问，但不是纯I帧的MPEG-2却难做到这一点，这在不同应用上带来不同的后果。比如，电视观众在切换节目频道时，对数字视频解码盒等待新频道的I帧到来的时间不很在意，因为每秒至少有两个I帧，但这在电视台业务上却会带来很大的问题。比如，广告插播中很难控制插入的起始点和长度，非线性编辑时素材搜索迟缓和帧精度控制等。目前解码通道冗余技术可以解决这个问题，但这又会带来另外的问题。三 MPEG-2还要解决什么　　MPEG-2作为一种新技术，由于发展时间短，还存在一些问题。我们认为，首先需要探讨如何改进MPEG-2编码硬件平台。如上所述，MPEG-2标准只定义了压缩数据码流的结构和解码端的结构，因此设备供应商可以开发各自不同的编码器，只要输出的码流符合MPEG-2的标准定义即可。这为编码器的压缩算法提供了很大的性能改善空间，同时也导致了不同公司开发的编码器的性能差异。　　运动矢量估计算法的精度会明显改变输出码率和图像质量，就是一个很好的例子。要进行运动矢量估计，先要确定运动矢量，这就需要一个搜索窗口，其大小会显著改变输出的码率。搜索算法的处理速度和压缩质量是一对矛盾。硬件处理速度快的平台，可以选用压缩比高和图像质量好的算法；而对于处理速度慢的硬件平台，只能牺牲压缩比和图像质量。　　另一个例子是码率控制的过程。图像压缩比和图像质量也是一对矛盾。在一定的码率下，希望得到最好的图像质量。这个控制过程包含预测与反馈，实现方法有很多，其性能也不一样。码率控制不完善的后果，要么浪费了码流，要么导致接收端解码器的溢出。简单的码率控制方法可以通过编码器中的缓冲器充盈程度为参考，控制量化步长，从而产生相对恒定的码率。　　其次需要探讨的是，MPEG-2要成为贯穿电视台业务的纽带，以MPEG-2作为数字视频的主要格式，须解决哪些问题。然而目前，MPEG-2在电视台应用中碰到的最大问题是数据流的随机访问，在编辑和切换中尤其如此。在MPEG-2码流中，只有I帧才可以作为入点，如果想直接对码流进行切换，必须等到I帧的到来，这就有延迟，其时间完全取决于GOP的长度。如果采用转码的方式，则不可避免地会带来图像的劣化。　　如果现在建立一个类似于图1的电视台运作模式，这看上去是很完美的。但是，我们必须联系目前的实际条件，探讨它是不是一个好方案。在传统演播室里，尽管输入的视频可以大部分都是MPEG-2格式，但是为了进行分配、切换、编辑和混合，还是要进行解码后再处理，以适应现存多种视频格式(复合、模拟分量、数字分量等)。节目选择和切换环节对一个播出频道来讲是必需的。鉴于节目来源广泛，在这个环节上，使用解码后的视频流作为操作对象最合适。在完成选择和切换后，再转换成MPEG-2压缩码流。播出内容在传送给电视观众时，由于传输方式的不同(卫星、有线和地面广播)，其能接受的码率也不一样，为此，还需要转码以进行码率的变换。目前，以MPEG-2作为电视台的主要视频格式，不可避免地存在多次转码的过程。而MPEG-2压缩方式的特点，导致了转码过程中可能出现严重的图像劣化。　　在转码过程中，即使用相同的GOP结构，也会存在这样的问题，就是GOP的相位被改变。也就是说，在重新编码的码流中，每帧的帧类型(I、B、P帧)与原码流不同。如果GOP结构改变，帧类型便会变化，这就要求在编码中使用新的运动矢量、编码方式和量化因子，从而会引起图像的明显劣化。　　ATLANTIC项目组(从事研发一个欧洲的合作项目)做了相关的实验，证明这种没有任何约束的转码过程会带来图像劣化。他们用三种类型的节目做实验。实验的内容是多版复制，一个是GOP相位没有改变的情况，另一个是GOP相位移动一帧的情况。结果如图2。　　实验结果表明，GOP相位改变时，图像在多版复制中会持续劣化且没有停止的迹象，尤其是运动信息多的节目内容；在保持GOP相位不变时，图像的劣化会有一个极限，这和M-JPEG或基于I帧的MPEG-2的多版复制类似。　　在进行IBP格式的编辑或切换时，同样存在这样的问题。因为素材的来源多样化，要想做到GOP的结构和相位没有任何变化很难。ATLANTIC项目组的研究者正在寻求这个问题的解决途径。　　应该承认，在MPEG-2技术成熟地应用于电视台之前，我们要做的工作还有很多。四应该为MPEG-2做什么　　MPEG-2技术走到今天，我们应该做些什么呢？这要从两个方面来看。　　第一，针对电视台。目前许多厂商在开发MPEG-2视频设备，大洋公司也一直在跟踪MPEG-2压缩技术的发展。目前厂商提供的某些应用的MPEG-2产品，具备了在电视台业务中实用的条件，电视台可以根据自己的情况选用。　　第二，针对视频设备供应商。负责任的设备供应商应该在努力改进应用方案、积极推广新技术的同时，把新技术的优点和缺点展示给用户，使用户对新技术有一个全面的认识。　　在MPEG-2应用方面，大洋进行了一系列存储、传输、素材编辑、播出的实验。综合实验结果和其它研究机构或厂商的资料，我们认为，MPEG-2在视频领域各个方面的应用方式还无法达成统一。但我们相信，随着技术水平的不断提高，视频设备供应商必将为电视广播行业提供完整而成熟的MPEG-2应用方案。

	来源：《世界广播电视》