【技术文章】
深入理解MPEG-2 | |
李永葆 | |
本文作者李永葆先生,北京中科大洋科技发展股份有限公司硬件部经理 | |
从MPEG-2技术标准出台以来,基于MPEG-2技术的电视台应用方案和新设备不断推出,吸引了业界的众多目光。为了便于电视台选择设备,我们客观地介绍MPEG-2技术的特点和发展现状,期望对大家有所帮助。 一 MPEG-2是什么 1. MPEG-2的起源 MPEG组织是在ISO的召集下,为数字视/音频制定压缩标准的专家组。该组织在1992年制定了MPEG-1标准。为满足广电行业的需求,又在1994年推出了MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。 MPEG-2使用了DCT、运动补偿和Huffman编码三种技术。DCT降低了图像的空间冗余度,运动补偿降低了图像的时间冗余度,而Huffman编码则降低了图像的信息冗余度。 MPEG-2标准分四个文件,即系统层(ISO13818-1)、视频压缩层(ISO13818-2)、音频压缩层(ISO13818-3)和一致性(ISO13818-4)。MPEG-2标准的适应性很强,可用于广播电视链路的所有环节。 2. MPEG-2的类和级 MPEG-2在设计时被定义为一个通用的视/音频压缩标准,要求能兼顾不同的应用需求,能对输出码率和图像质量进行控制。为此,MPEG-2压缩算法分成不同的类别(Profile)和级别(Level)。目前在广播界的视频应用中,一般有MP@ML(取样为4:2:0)和4:2:2P@ML (取样为4:2:2)两种。二者输出码率分别在5~15Mb/s和15~50Mb/s。节目制作一般使用4:2:2 P,因为这个类设置了50Mb/s的码率上限,能保证图像信号的质量。 3. MPEG-2的视频码流结构 为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。它分为六层,自上到下分别是:图像序列层、图像组(GOP)、图像、宏块条、宏块、块。 图像序列由图像组构成,是随机存取段落。图像组是为方便随机存取而加的,其结构和长度均可变,是随机存取的视频单位。图像是独立的显示单位,也是基本的编码单位。宏块条包含若干个连续的宏块,是重新同步单位,其设置目的是防止误码的扩散。图像以亮度阵列被分成16×16宏块,宏块是进行运动补偿的基本单位,一个宏块包含4个8×8亮度块,4:2:0取样时一个宏块包含2个8×8色度块;4:2:2取样时一个宏块4个8×8色度块。块是进行DCT运算的单位,仅包含亮度或色度。 4. MPEG的图像类型及码流组成 MPEG-2在压缩方面有帧内压缩和帧间压缩两种方式,使用三种类型的图像,即I帧、P帧和B帧。 I帧使用帧内压缩,不使用运动补偿,提供中等压缩比。由于I帧不依赖其它帧,所以是随机存取的入点,同时是解码的基准帧。 P帧根据前面的I帧或P帧进行预测,使用运动补偿算法进行压缩,压缩比要比I帧高。P帧是对B帧和后继P帧进行解码的基准帧。它本身有误差,会造成误差传播。 B帧是基于内插重建的帧,它基于前后两个IP帧或PP帧,不传播误差。它使用双向预测进行压缩,提供更高的压缩比。 一个GOP由I帧作为起始,其长度可变。长GOP可以提供高的压缩比,但是会造成随机存取的延迟和误差的积累。一般每秒内有两个I帧,用作随机存取的入口。 MPEG-2标准中没有规定GOP的结构,帧重复方式可以是IP、IB、IBP、IBBP甚至纯I帧。帧重复频率影响输出码率,也影响存取延迟。 5. MPEG-2的音频 MPEG-2标准的第一个文件(系统部分)中,规定了如何组合视频和音频数据的复接结构,以及代表时间信息的方法。但是在压缩编码时,视频和音频相互独立。本文着重讨论MPEG-2的视频应用。 二 MPEG-2带来了什么 新的技术会带来很大的好处,但由于其存在局限性,总是有一些折衷,MPEG-2也不例外。 1. 压缩标准的比较 目前,广电行业一般使用MPEG-2、DV和M-JPEG图像压缩格式。这三种压缩算法在硬件支持下,可以在正常视频帧率下提供相当好的图像质量。 在同样的视频质量下,压缩算法输出码率决定其性能的优劣,或者说,在输出码率相同的条件下,图像质量的优劣反映了压缩算法的性能。M-JPEG和DV均采用帧内压缩方式,压缩效率要比MPEG-2低。当然,在低码率的时候,MPEG-2可以提供比M-JPEG高的压缩比而保持较好的图像质量;在要求高图像质量的时候(比如节目编辑和后期制作),MPEG-2与M-JPEG、DV的输出码率差别要小得多。 电视台业务的多样性要求压缩标准能提供多种码率。可变码率(VBR)特性对电视台有效利用资源非常重要。MPEG-2可以通过改变GOP结构和DCT及Huffman编码的参数来调整输出码率;M-JPEG可以通过改变DCT及Huffman编码参数调节压缩比;DV格式因其应用特点,没有提供VBR。M-JPEG发展较早,在非线性视频编辑方面应用多年,软、硬件技术成熟,成本低廉,以目前硬件平台而言,平均比MPEG-2平台便宜5000美元左右。目前的电视台业务中,还不能脱离磁带机。DV的优势是与磁带机结合紧密,能实现倍速上下载。另外,M-JPEG和DV均采用帧内压缩方式,可以提供精确到帧的随机存取访问,而无任何延迟。纯I帧的MPEG-2基本和M-JPEG相同,能以帧精度存取。二者的区别是:I帧的MPEG-2有码率上限,而M-JPEG没有,因而能应付对图像质量要求苛刻的情况。 大家在讨论MPEG-2标准的好处时,最强调的是其压缩效率高。但是有一点必须澄清,就是这个事实只发生在不太强调图像质量的情况下。一个典型的例子是演播室节目编辑和后期制作。在演播室进行节目编辑时,对图像质量要求都很高,如果采用MPEG-2,必须采用低压缩比、4:2:2取样的码流才能满足要求。这时,输出码率甚至会达到50Mb/s码率上限。在这么高的码率上,MPEG-2相对于另外两种标准,优势并不明显。 目前,M-JPEG、DV和MPEG-2三个标准各有长处,设备都获得了广泛使用,没有任何迹象表现出某个标准会一统天下。日本和北美大多用DV格式进行后期制作;EBU在1999年的D84、D85技术声明中推荐电视台在演播室使用50Mb/s的纯I帧4:2:2P MPEG-2;而中国在广泛使用M-JPEG的同时热烈讨论IBP格式的编辑。 电视台在是否选择MPEG-2设备上,担心这样一些问题:投资MPEG-2设备到底能带来多大的收益?MPEG-2标准能不能成为一种贯穿电视台全部业务的纽带,从而更加提高效率呢? 2. MPEG-2带来的好处 我们认为,MPEG-2标准带来的好处体现在它的适应性。它有两大特点:一个是运动补偿带来的高压缩比;另一个是码率可变。在MPEG-2标准的文件中,详细定义了压缩数据在存储和传输中的句法结构,并且只定义了对MPEG-2压缩数据的解码过程,因此MPEG-2针对性最强的应用是存储和传输。目前MPEG-2技术在电视业务的某些应用上具有不可比拟的优势。 a. 数字化片库 压缩比的提高,使得节目存储所需资源大大降低。电视台保存的节目带数量惊人,磁带保存带来的问题是图像质量下降、不便于管理、难以共享使用。采用基于MPEG-2的数字化节目库,可以较好地解决这些问题。 b. 节目传播 由于在低至1.5Mb/s的码率下MPEG-2数据流仍然能提供相当的图像质量,在地面、有线电视和卫星广播上都极具吸引力,这意味着在传送相同节目量的情况下,可以大大节省成本。由于MPEG-2输出码率可变,可以根据节目类型选择不同的压缩比,以达到更好的资源利用率。正是基于这些原因,MPEG-2已经被作为数字电视广播的压缩标准。 c. 高清晰度电视 由于高清晰度电视节目传输需要很高的带宽,必须用高压缩比才能完成传送。在这一点上,目前只有MPEG-2技术能够胜任。 此外,在数字化视频磁带、激光视盘、电视会议及数字照相机等方面,MPEG-2也具有相当广的应用前景。 3. MPEG-2带来的问题 M-JPEG、DV都能提供精确到帧的随机访问,但不是纯I帧的MPEG-2却难做到这一点,这在不同应用上带来不同的后果。比如,电视观众在切换节目频道时,对数字视频解码盒等待新频道的I帧到来的时间不很在意,因为每秒至少有两个I帧,但这在电视台业务上却会带来很大的问题。比如,广告插播中很难控制插入的起始点和长度,非线性编辑时素材搜索迟缓和帧精度控制等。目前解码通道冗余技术可以解决这个问题,但这又会带来另外的问题。 三 MPEG-2还要解决什么 MPEG-2作为一种新技术,由于发展时间短,还存在一些问题。我们认为,首先需要探讨如何改进MPEG-2编码硬件平台。如上所述,MPEG-2标准只定义了压缩数据码流的结构和解码端的结构,因此设备供应商可以开发各自不同的编码器,只要输出的码流符合MPEG-2的标准定义即可。这为编码器的压缩算法提供了很大的性能改善空间,同时也导致了不同公司开发的编码器的性能差异。 运动矢量估计算法的精度会明显改变输出码率和图像质量,就是一个很好的例子。要进行运动矢量估计,先要确定运动矢量,这就需要一个搜索窗口,其大小会显著改变输出的码率。搜索算法的处理速度和压缩质量是一对矛盾。硬件处理速度快的平台,可以选用压缩比高和图像质量好的算法;而对于处理速度慢的硬件平台,只能牺牲压缩比和图像质量。 另一个例子是码率控制的过程。图像压缩比和图像质量也是一对矛盾。在一定的码率下,希望得到最好的图像质量。这个控制过程包含预测与反馈,实现方法有很多,其性能也不一样。码率控制不完善的后果,要么浪费了码流,要么导致接收端解码器的溢出。简单的码率控制方法可以通过编码器中的缓冲器充盈程度为参考,控制量化步长,从而产生相对恒定的码率。 其次需要探讨的是,MPEG-2要成为贯穿电视台业务的纽带,以MPEG-2作为数字视频的主要格式,须解决哪些问题。然而目前,MPEG-2在电视台应用中碰到的最大问题是数据流的随机访问,在编辑和切换中尤其如此。在MPEG-2码流中,只有I帧才可以作为入点,如果想直接对码流进行切换,必须等到I帧的到来,这就有延迟,其时间完全取决于GOP的长度。如果采用转码的方式,则不可避免地会带来图像的劣化。 如果现在建立一个类似于图1的电视台运作模式,这看上去是很完美的。但是,我们必须联系目前的实际条件,探讨它是不是一个好方案。在传统演播室里,尽管输入的视频可以大部分都是MPEG-2格式,但是为了进行分配、切换、编辑和混合,还是要进行解码后再处理,以适应现存多种视频格式(复合、模拟分量、数字分量等)。节目选择和切换环节对一个播出频道来讲是必需的。鉴于节目来源广泛,在这个环节上,使用解码后的视频流作为操作对象最合适。在完成选择和切换后,再转换成MPEG-2压缩码流。播出内容在传送给电视观众时,由于传输方式的不同(卫星、有线和地面广播),其能接受的码率也不一样,为此,还需要转码以进行码率的变换。目前,以MPEG-2作为电视台的主要视频格式,不可避免地存在多次转码的过程。而MPEG-2压缩方式的特点,导致了转码过程中可能出现严重的图像劣化。 在转码过程中,即使用相同的GOP结构,也会存在这样的问题,就是GOP的相位被改变。也就是说,在重新编码的码流中,每帧的帧类型(I、B、P帧)与原码流不同。如果GOP结构改变,帧类型便会变化,这就要求在编码中使用新的运动矢量、编码方式和量化因子,从而会引起图像的明显劣化。 ATLANTIC项目组(从事研发一个欧洲的合作项目)做了相关的实验,证明这种没有任何约束的转码过程会带来图像劣化。他们用三种类型的节目做实验。实验的内容是多版复制,一个是GOP相位没有改变的情况,另一个是GOP相位移动一帧的情况。结果如图2。 实验结果表明,GOP相位改变时,图像在多版复制中会持续劣化且没有停止的迹象,尤其是运动信息多的节目内容;在保持GOP相位不变时,图像的劣化会有一个极限,这和M-JPEG或基于I帧的MPEG-2的多版复制类似。 在进行IBP格式的编辑或切换时,同样存在这样的问题。因为素材的来源多样化,要想做到GOP的结构和相位没有任何变化很难。ATLANTIC项目组的研究者正在寻求这个问题的解决途径。 应该承认,在MPEG-2技术成熟地应用于电视台之前,我们要做的工作还有很多。 四 应该为MPEG-2做什么 MPEG-2技术走到今天,我们应该做些什么呢?这要从两个方面来看。 第一,针对电视台。目前许多厂商在开发MPEG-2视频设备,大洋公司也一直在跟踪MPEG-2压缩技术的发展。目前厂商提供的某些应用的MPEG-2产品,具备了在电视台业务中实用的条件,电视台可以根据自己的情况选用。 第二,针对视频设备供应商。负责任的设备供应商应该在努力改进应用方案、积极推广新技术的同时,把新技术的优点和缺点展示给用户,使用户对新技术有一个全面的认识。 在MPEG-2应用方面,大洋进行了一系列存储、传输、素材编辑、播出的实验。综合实验结果和其它研究机构或厂商的资料,我们认为,MPEG-2在视频领域各个方面的应用方式还无法达成统一。但我们相信,随着技术水平的不断提高,视频设备供应商必将为电视广播行业提供完整而成熟的MPEG-2应用方案。 |
|
来源:《世界广播电视》 |