【技术文章】

媒体资产管理的若干重大问题及对策
宋宜纯
报告人宋宜纯先生,中央电视台副总工程师。本文根据会议录音整理而成。
关键词:媒体资产管理 对策
  编者按:关于媒体资产管理这个问题,近年业界讨论很热烈,已有电视台如上海文广集团下属的电视台在有条不紊的系统实施中。围绕实际中遇到的一些具体问题,资深专家宋宜纯教授提出自己独到的见解,探索了解决思路,并借DDMN 2002之机与大家分享。他着重从以下几方面进行探讨,首先是存储介质,他率先提出磁带的缺损问题……
数据流磁带的缺损
  磁带的缺损包括磁粉脱落、磁化和退磁、带机变形等。在视频磁带中,磁带缺损所造成的影响是局部的。然而对于数据流磁带,如果磁带有任何缺损,整个文件将无法读出,其影响是全局性的。应对这个问题有以下几种办法。
   (1)备份。技术简单、成熟,IT领域都采用备份的办法来抵御可能造成的不可挽回的损失。但对于广电应用,由于数据量极其庞大,比如几十万盘磁带,如果采用备份方法,其成本用户将难以承受。
   (2)检测磁带的误码。采用ECC、FEC纠错,在磁带机读过数据之后,如果能报告它的误码情况,尽管它是在可纠正的范围内,当误码接近临近值的时候,即起动复制操作,把该盘磁带再复制一盘,这样就可以避免把所有的磁带都备份而带来开支过大、工作量过大的窘境。这种方法只适合于渐变化的磁带缺损的情形。
  (3)减小文件,但这不是一种根本的解决办法。
  (4)跳过缺损的部分,重新构造图像序列。应该说这是一个技巧性非常高、更有意义的一种方法。对于数据流磁带,它的基本应用是数据和程序的备份,无论是数据、还是程序,只要有一个比特错误,它就不能用了。对于视频,它带来的影响太大,必须修改磁带机底层控制的接口,当发生读取错误的时候,不是简单地扔掉,而是强行读取下一数据块,通过一定的处理,使得损失减到最小。实际上处理过程要复杂和困难得多,而损失的大小取决于数据块的大小及GOP的长度。
  (5)采用类似于RAID冗余方式的磁带冗余阵列。磁盘阵列采用RAID3或RAID5,可以把坏盘的损失给补救过来,因为它有冗余的记录。采用磁带冗余阵列方式,也有可能付出较小的代价,比如增加20%或者30%的存储量。
资源的共享
  资源的共享,即减小信息的冗余、节省设备、提高效率等。如何实现这种共享?单一厂家设备之间的资源共享是同构的,难度特别低。对于一个长的建设周期,一个大型、复杂的系统,可能引入多家厂商的软件和设备,其资源共享就是异构的,难度较大。
  首先,根据结构上的分类,有不同系统之间、不同厂家设备之间资源的共享,这做起来很难。其次,根据共享资源分类,有底层或素材类资源的共享,它涉及高低码率的图像文件、音频文件、字幕文件等,这些文件都是素材的组成部分。
  至于业务类型的,属高层的共享,比如EDL表,在某个系统中做成的EDL能不能为另一个系统中的非线性编辑系统所接受?再比如元数据(Metadata)或者编目数据,能不能在更广泛的范围为多个用户所共享?这些在设计上涉及的问题相当多,大致有如下对策:
  (1)采用统一文件格式。
  (2)采用标准文件格式。
  (3)采用转换和映射方式。通过一个转换器或者产生一种映射关系,把文件格式A转换成文件格式B。这种方式要求厂商开放其格式;至于产生直接的映射关系,则比较复杂,涉及知识产权等问题。可以产生中间文件,以之进行交换;而采用映射,则不产生中间文件。采用中间文件格式方式,原则上是不产生文件格式A到文件格式B的直接映射转换,而只产生中间文件即交换文件格式,它不涉及向对方开放自己内部的技术细节,实现也相对容易一些。
  (4)设计保持相对的灵活性。比如数据结构引入XML等说明性结构,以便能够灵活地转到新的系统上去。当然实际做起来可能有麻烦,就应用数据而言,对应用层、业务层的还好一些,底层则比较难。
  就共享而言,采用统一文件格式,协调起来将非常困难;而且,如果选择的是非标准的统一文件格式,将来可能还要转换,这有可能带来很多问题。采用标准文件格式,其问题是这个标准是否已经成熟。比较而言,采用中间文件方式比较好,它简化了相互之间的对话,只是与中间文件进行转换,厂商无需开放技术细节。
存储对象
  存储对象涉及两个问题:一个是存什么;另一个是怎么存。要存的数据可说是各种各样,比如节目、成品、素材、音频、视频、文稿、字幕、EDL、元数据等,它们分门别类存放在不同的地点,怎么存呢?另一方面,要到不同的存储地点去取,分门别类地放到不同的位置上,才能为现有网络制作系统所使用。这是它的问题所在。
  在现代化网络直播环境中,这个问题更严重。访问、存储和管理都变得非常困难,因为不同数据存放的方式和备份的方式各不相同,在恢复的时候也有问题。比如高码率数据可能备份到一盘磁带上,而低码率数据有可能备份到另一盘磁带上;而编目数据是在数据库里,它并不直接以文件方式表现出来,要做备份,就得对整个库进行备份;等等。这就造成了备份各不相同。所以在考虑MAM时,首先要明确媒体资产应该是多种媒体,而不仅仅是节目带。
  其对策是采用面向对象的方式进行存储。一个对象,就是把所有相关的信息作为一个整体,比如一个节目或者一条新闻,它包含高/低码率数据、元数据、文稿、EDL等。这样,从应用系统来讲,它仍然是存在不同的地点,例如直播系统中,高码率数据还是在大硬盘上,低码率数据可能在文件服务器上,编目的条目可能在数据库里。通过面向对象的存储管理,可以把它们作为一个整体倒到一盘磁带上,在必要的时候再从一盘磁带上分别装到各自的地点上,从而实现整体化管理。
  预计将来以节目为主的存储会转变为以素材为主的存储,因为节目可以被视为素材加上EDL,拿到了素材和EDL表,就可以在任何时候重新生成这个节目。这样的好处在于,可以针对其中某一个层或者某一个轨道,利用EDL重新生成节目,而不至于影响其它,从而可以最大程度地实现资源的共享,充分利用已有资产的价值。它在质量上没有任何损失,这将带来更大的自由度,同时确保资产的价值。
系统数据的标准
  标准化是永恒的主题。只有按标准化走,才能使媒体资产管理系统长时间地运行。在媒体资产管理系统中涉及很多标准,包括交换标准、编目标准等。
  首先要考虑的应该是一个开放的标准,而不是一个私有的。标准的开放性保证了更多厂家的参与,同时有利于维护和更新。如文件交换标准MXF、AAF,就得到了很多视频厂家和电视台的支持。从现在来看,也不是一下子都能建立到标准上。各标准的制定,在时间进度上有可能不一致,从私有的转换到标准,并非一步就能到位,但一定要留下走向标准的通道。
编目与检索
  编目和检索涉及再利用问题,是MAM系统的两大核心问题之一。检索是再利用的关键,而检索的基础是编目,编目是一个大问题。目前有几种编目方式:一种是一次性编目,一次就完成所有细节的编目;另一种是多次编目,先由记者或者编辑做初始化,取得一个初步的编目,而细节留待专业人员做二次甚至多次编目,然后完成总体的编目。若一开始就做深度编目,可能会有问题。
  在检索方面,现在可以提供基于特征(像面部、声音、图像等特征)的检索。此外还有分步式检索等,这在图书馆系统中非常普及,它采用统一的检索入口,搜索一个分步式的库,有些标准已经发布。
系统的配置
  它涉及系统配置的比例与侧重问题。这里当然有在线、近线和离线存储配置的比例,还包括高/低码率数据及其它配置的比例问题。其次是配置的侧重,也即系统在功能上侧重哪方面。如果是资料馆,是否可以考虑其功能侧重于存储?如果是一个一个制作网络,是否可以令其功能侧重于共享和制作?而在结构上,又可以分为分布式和集中式等。这些都是我们所面临的一些选择。
  在线系统的价格很高,一般在流量和容量要求高的时候,会使得系统异常复杂。近线系统包括数据流磁带、光盘等,它的价格是中等偏高,需要配备不同数量的驱动器以满足其流量要求,在容量上它涉及自动化带库的槽位,这是我们考虑的因素之一。离线系统价格很低,最为简单,但需要人工干预。
  实际中应以功能为基本分类的出发点,比如编辑制作,它侧重的是共享方式下的制作环境;而存档,比如资料馆,它侧重于存储和再利用,对时间的要求不很强,应以大容量为特征;对于编辑制作类的应用,应以高流量为特征。由此可见,应用决定侧重,性能决定在线系统,自动化程度决定近线系统,实际中必须予以考虑。另外,面向编播的系统,应该有较大的磁盘缓冲区和很高的数据吞吐速度;近线系统可以适当甚至可以没有,离线系统可以没有。对于面向资料存储的系统,可以重点考虑以离线系统为主,而不需要很高的硬盘容量和数据吞吐量;近线系统可以根据需要和经济能力进行配置。
  来源:《世界广播电视》