QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3352|回复: 6
打印 上一主题 下一主题

面向广播行业和后期制作工程师MPEG-2基本问题------视频和网络部分白皮书

[复制链接]
字体大小: 正常 放大
loveyuan        

21

主题

2

听众

104

积分

该用户从未签到

国际赛参赛者

元老勋章

跳转到指定楼层
1#
发表于 2004-4-29 10:48 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<FONT color=#000000 size=2>本文将探讨MPEG-2标准规定的数字化视频表达方式,并将研究关于新近采纳的主级中4:2:2 类的一些关键性问题。特别的,我们将研究这一新类的基本原理,以及它为广播行业和后期 制作部门带来的益处。
: F1 R4 H7 U' H6 h    本文的目的是要明确不同的MPEG类和级的适当应用场合,展示新的4:2:2类的必要性。我 们也将谈及标准所要求的编/解码器兼容性问题,对于4:2:2视频表现能力日益增强的需求, 以及主级中4:2:2类是如何使MPEG-2高效率地发挥其优势的。 主级中新的4:2:2类最近己成为MPEG标推的一个正式组成部分。广播和后期制作行业的人士无法接受以前的MPEG-2主级中各类所提供的低色度带宽选择,而主级中的4:2:2类,对于 提供高质量的MPEG压缩视频,将被证明是个等待己久的解决方案。 Tektronic的观点是50年仪器,广播和视额设备设计历史的结晶,也是我们在成功帮助MPEG-2 标准朝着提供新的,高效率的广播质量视频节目发展的过程中的产物。在接下来的文章中, 我们将分享这些观点和经验:在这一过程中,我们希望对于各位成功的将这一令人激动的新 科技用于未来的采集,存储,传输及后期制作系统能够有所帮助。</FONT>% T6 [8 @9 `0 y5 R/ I
< align=center style="LINE-HEIGHT: 150%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><b><FONT color=#0000ff size=2>视频压缩基本概念</FONT></b></P>5 s8 h6 {) w+ F% T) e. K" L* s
< ><b><FONT color=#800080 size=2>背景知识</FONT></b></P>
2 D; e0 z; I* }% V( _< ><FONT size=2>   在过去的几年里,关于视颇压缩的争论己成为—个极其热门的话题,但有趣的是,视频信号 的压缩并不是一个新问题。许多人并没有意识到,伴随着1950年代彩色电视的引入,视频 压缩第一次商品化了。三幅分别显示红,蓝,绿的最高分辨串的图象,共占用15MHZ的总带 宽;但被压缩成一路仅占5MHZ的复合信号——3:1的带宽压缩率被引入了。这种方式虽然 简单,但毕竞是压缩了。 当然,这种早期的压缩方式是通过模拟技术实现的。今天,更稳定连续的图象质量,更高的 压缩串可以通过把模拟信号转换为数字信号,利用一些高度复杂的技术来完成的。这些技术 最终带来了更高的压缩效串和更精细的压缩图象处理方法。这些数字技术需要极为强大的计 算能力,直到最近在经济上仍然是不可行的。然而,今天,情况有了变化</FONT><FONT size=2><FONT color=#000000>。 0 m$ r& f6 d# S# s( C
    </FONT>压缩基本上是这样一个过程:通过梢除存在于视频信号里的冗余成分,来减少图象或图 象组的内容信息。 <FONT color=#000000>
- V. t9 d$ u$ Y: V& P( U# R# B   一般地讲,数字视频压缩是从分量视频表达开始的,此时信号是以一个亮度分量,两个色度 分量来表达的。最广为接受的数字分量视频格式就是Rccommendation601,该建议使用了“共 结点”模型的4:2:2采样结构。所谓“共结点”,是指每个彩色象素点由3个采样来 描述:一个亮度采样,两个色差形成的色度采样。因为这三个采样在时间上是重合的,所以 称作“共结点”。在525行的系统中,每帧有483个有效行,每行有720个象素点;在625 行的系统中,每帧有576个有效行.</FONT></FONT></P>
' C  Y: `. o4 o: t% }/ i< ><FONT size=2>   通过色度--亮度采样的结合,在不损害图象质量的同时,减少所需带宽得以实现。4:2:2中 的“4”是指4倍于分量数字系统中采用的副载波采样频率。有趣的是,亮度采样频率实际 上是13.5MHZ:数字“4”的使用只是在考虑14.3MHZ NTSC采样频率是遗留下来的历史问题。13.5MH2的采样频率是——个折衷的选择,只是因为它相对525和625线的系统都有整数关系。 采样方式中的“2”是指色差信号Cb,Cr其采样频率刚好是亮度采样频率的一半(6.75mhz)。 人限亮度分辨能力的特点使得这种对分采样频率的方法能够使用:大范围的心理视觉测试己 证实,对于诸如色键等要求苛刻的后期制作类应用环境,6.75MHz的采样频率所能达到的色 度已经足够了。</FONT><FONT color=#000000 size=2>
% e( U, U# h$ G+ s1 y/ F   压缩基本上是这样一个过程:通过消除存在于视频信号里的冗余成分,来减少图象或图象组 的内容信息。这可以通过分析视频信号的统计预知性来实现。信号的主要部分是有一定的可 预知性的。一个极端的例子是正弦波信号,它有高度的可预知性,因为每个周期都是相同的, 且只有一个颠率,这样就不需占用带宽。另一个极端的例子是,噪声信号完全不可预测。当 然,实际上所有的信号都界于这两者之间。压缩技术总的来说就是要识别并去除这些冗余, 从而减少存储量和所需带宽.</FONT></P>
, K+ p" ~! X& c( ~8 b9 T8 U< ><FONT size=2>   视额应用中对压缩,减少数据量或者数据传输率的要求可以归纳为以下两种基本要求:</FONT></P>5 N/ M" D8 D2 h7 n! _
< ><FONT size=2>    1),在已存在的基础中加入新的功能。彩色电视就是一个好例宁。它面临的挑战就是将附加 信息(色彩)整合进已存在的黑白信号中.
' L% O& v) d( p" y. B2 q; r7 M% S   2),经济利益。在通信领域,数据链接的花费通常是与数据传输串成正比的。因此,压缩系 数越高,花费就越低。同时,减少的存储花费构成了压缩技术经济上的另一个优势。
- Q. Q8 y5 f$ w! ?</FONT><FONT size=2><FONT color=#000000>
! v2 e# k) @8 T  </FONT><b><FONT color=#800080>色度亚采样的进一步知识</FONT></b><FONT color=#000000>5 _. d  i; R4 ~+ p
     对表示色度的色差信号进行亚采样经常用于减少数据密度,4:2:2是—个明显的例子.它充分利用了人眼对于亮度变化的敏感程度要强于色度变化这一特点。在减少带宽的努力中这已 经不是新核念了。它最初的应用要回顾到1950年代早期的NTSC和PAl复合信号标标准。在这 些复合信号标准体系中,两个色差倍号的分辨串带宽被减少到大约1MHz。类似的带宽降低 方法也被皮用到一些早期的数字效果单元上。这些设备使用4:1:1的采样格式,其中采样仍 是共结点的,但色差信号的采样频串只是亮度信号的四分之一。 垂直亚采样可以达到与4:1:1相同的降低色度数据密度的效果,这时的目标就是沿水平和垂 直方向把色度分辨串降低相同的数量。在4:2:0的采样中,来自一场中相临两条扫描线的色 度采样经内插处理,生成一个单独的色度采样,它在空间上位于原始采样之一和相反场中对 应扫描线上相应位置的正中。所谓对应扫描线是指,相反场中,在空间上位于当前场 中被采样的两条扫描线之间的那条扫细线。图3中的实心箭头搀出扫描线n和n+2的采样经 过内插处理生成了位于扫描线0和n+1之间的新采样。 ’ 4:2:0采样有许多的缺点。首先,由于使用隔行扫描已经损失了垂直分辨率,其次,色度采 样的垂直内插很复杂,还要求自适应滤波,达经常导致图象质量没有4:1:1的令人满意,多 代(multi-generation)性能不佳,最后,利用垂直亚采样在水乎和垂直两个方向上同等程 度地降低色度分辨串这一想法本身就有其根本性的缺陷:它并未考虑在水平和垂直两个方向 上采样密度的差异。表1总结了这些针对不同视频格式的采样密度,包括NTSC和PAL.</FONT>如果目的是最终使用诸如NTSC和PAL的复合信号标淮来传送信号,那么4:2:0是最糟 糕的可能选项。<FONT color=#000000>+ j) c4 f8 D0 d/ i* A
     显而易见,4:2:O并没有在两个方向上同等程度地降低色度分辨率.注意到水乎分辨率和垂 直分辨率3:1的比例就很容易得出这个结论。即使在引入4:3的长宽比之后,水平垂直分 辨串的比值仍是2.25:1。显然,4:1:1的采样结构更能够在两个方向上提供平衡的分辨率. 如果目的是最终使用诸如NTSC或PAL的复合信号标准来传送信号,那么4:2:0是最糟糕的 可能选项。它提供比NTSC或PAL都要高的水平分辨率,因此它提供的垂直色度分辨率比这 些复合信号标准所提供的要差得多。4:2:0的使用对水平和垂直色度分辨率都将造成损伤.
; N$ \8 x2 D2 U
9 K% n9 v, |/ F/ D </FONT><b><FONT color=#800080>压缩过程</FONT></b><FONT color=#000000>9 u7 A+ G* O7 f1 _0 V8 m& }
     压缩基本上是这样一个过程:通过消除存在于视频信号里的冗余成分,来减少图象或图象组 的内容信息。概括地说,压缩技术就是试图识别冗余内容,再从比特流中除去大量的此类成分.
# g/ D2 L& i5 Q) U# o" B
8 ^( h9 W7 y; o8 y   </FONT><b><FONT color=#800080>用DCT识别冗余</FONT></b><FONT color=#000000>0 x3 M4 X& [. d4 j; v0 G
    对于许多压缩系统,第一步工作就是识别存在于视频信号的每帧每场中的空间冗余,这是通 过对整幅图象做DCT(离散余弦变换)来完成的。DCT是一个无损的,可逆的数学过程,它把 空间幅度数据转化为空间频率数据。在用于视频压缩时,这一运算过程是以亮度采样和相应 的色差采样构成的8*8点的块为单位进行的。(图4)左上角的DCT系数反映块的DC(直 流)分量,位于既分量下方的系数代表着逐渐增高的垂直空间领率,位于DC分量右侧的系 数代表看逐渐增高的水平空间频率,其他系数则代表垂直水平空间频串的不同组合。 由于视频图象的自然属性,DCT变换经常使代表较高空间频率的DCT系数的值很小。类似的, 由于人类视觉分辨串的特点,许多非零,代表较高空间频率的可以很粗糙地定义(也就是用 较少的比特来表达)或完全弃之不用,也不会引起明显的图象劣化。DCT变换并不能减少数 据量,事实上,为了达到可逆和无损,必须使用更多的有效比特(有效数字)来确保计算过 程中没有进位错误。. K  s; A( P/ ]

" d# H$ g# v, X# t8 c- w) P( e   </FONT><b><FONT color=#800080>帧内压缩</FONT></b><FONT color=#800080> </FONT><FONT color=#000000>
: y. r8 f1 O3 ^, e% W, |    实际的压缩是从减少空间冗余开始的,通过帧内压缩来实现。帧内压缩使用有损和无损过程 的组合来减少一幅图象的数据量。它并不使用来自过去或未来图象的任何信息。谓注意,这 里是故意使用“图象(picture)”这个词的。一些压缩技术,比如MPEG,允许把一场或一帧 作为基本图象。对于以场为单位的例子,场内编码将使每帧生成两幅“图象”。这就是在讨 论视频压缩时,为什么用“图象”而不用“帧”这个词的原因。
' z8 O- F0 P* [( |8 ~</FONT><FONT color=#800080><b>量化</b>.</FONT><FONT color=#008000>
+ Q, Q4 w; g  @, g7 @% f   </FONT>MPEG比同等图象质量的Motion JPEG(运动JPEG)的压缩效率高出10-20%.
8 ^( k, |& D; v    除了在4:2:2到4:2:0的转化过程中丢失了有限数量的信息以外,MPEG的压缩能力来自对DCT 系数灵活的量化过程。简单地讲,量化就是减少描述各系数的比特数的过程。 量化中可能会用多达11个比特来表示DC分量的系数,但用少得多的比特来表示较高阶的系 数.对于每个宏块(macroblock 16点*16点)或更大的宏块组,可以指定不同的量化间隔。 这种能够针对每个宏块使用不同量化因子的能力,使得只进行帧内处理的MPEG比同等图象 质量的Motion JPEG(运动JPEG)的压缩效率高出10-20%。一殷地讲,与传输原始的DCT 系数相比,传输表格或深度量化的系数只有少很多的数据量.<b>
4 n# D0 B6 W, u+ T) {: v- r3 b* a
<FONT color=#800080>无损压缩</FONT></b>9 w! P3 W! v3 s  a4 c
   量化完成后,无损地减少数据量是通过VLC(可变长编码)RLC(游程编码)实现的。传送系 数的濒序优化了编码过程的效率:以锯齿状路线处理8点*8点的块中的64个系数,形成了 最大长度的连续零值,提高了压缩效率。可变长编码是这样一个过程,识别出数据中常见的 模式(或字),用较少的比特来描述较额繁出现的数值,用较多的字描述不常出现的数值。 摩尔斯码(MorseCode)就是一种形式的VLC,它用根短的序列表示常出现的字母,例如“e”(用一个点表示)。VLC的另一个例于是根流行的PC程序PKZIP,它使用了Lempel—ZiV— Welch(LZW)算法来压缩数据文件。象量化一样,VLC生成图形模式的码表,这种码表与拟定 的码字结合后的数据量,要比原始数据模式的少许多。RLC游程编码过程是用一个单独的码 字表示一种重复模式(例如连续的零值)。举例来说,一个由25个连续“0”构成的字串, 可以表示成:以字符“ESC”开始,然后是数值“25”(计数器),最后是值“0,,。这样,25bytes 的数据被压缩成3bytes。请注意,Vlc和RLC都是无损的编码过程。<b><FONT color=#000000>7 `- C4 K) ^4 \6 T4 j

1 l: M: C8 q9 b& x2 t) b+ u</FONT><FONT color=#800080>可变比特率</FONT></b><FONT color=#000000>  C' b4 f7 T# E/ ~: c! ^8 i. f
  码率控制决定了DCT系数量化过程的粗糙程度。输出缓冲器平滑了数据流的输出,提供了对 量化器的控制,来限制数据速率或将其保持在一定水平。尽管标准允许可变比特率,但仍有一些MPEG编码器提供一个恒定的比特串。在把压缩数据记录到视频磁带机里时就需要恒定 的比特率,因为录象机是利用机械部件如旋转磁头等以恒定速度工作的。另一方面,可变的 比特率对于在粹发情况下工作良好的磁盘记录介质是很理想的。一般说来,可变比特率对于 提供稳定的图象质量是个更好的选择。任何情况下,固定的数据速率都只是个概念而己一一 —一在过程中给定的扫描线之间,在给定的帧与顿之间,数据是变化的,DCT系数在变化,熵 编码也在变化。+ R4 L+ B, F* f) }+ Z2 \" C
</FONT><b><FONT color=#000000>
8 M! n% D1 k, i# h* \. L' J" |</FONT><FONT color=#800080>消除时城冗余</FONT></b><FONT color=#000000>
5 U  w* `* w, E" L% p7 d   视频信号的另一个届性是时域冗余,它是指对于一个给定的图象序列,图象内容在帧与帧之 间变化很小。对帧间相关图象内容的位置变化(或称运动)的计算是帧问压缩的主要组成部 分。(图6)运动颈测由两个过程:先把图象划分为若干16点*l6点的宏块(4个8点*8点 的块),然后搜索判定它在下一帧中的位置。虽然宏块的采样在一定程度上己发生变化,但 相关技术的应用使得位置匹配可以精确到半个象素点。成功的按索将为该宏块生成一个运动矢量。<b>
& _" J# I$ L" H# t* x; z2 U7 n& o8 o4 x3 T8 {3 I
</b></FONT><b><FONT color=#800080>帧间压缩和运动补偿</FONT><FONT color=#000000>6 ~0 _6 f; W7 _* i: H
   </FONT></b>帧间压缩基于末压缩的图象进行工作,基本上是无损的。在图7中,基淮帧堆栈中保存着满 分辨率的前一帧图象,拥有全部视频数据。而运动矢量从运动补偿块中被计算出来,用来预 溯当前帧图象.由于各帧图象可能有着不同种类的差异,而预测只能提供宏块的运动矢量, 所以预溯可能不是十分的精确。(后面将谈到预测的这点缺陷是无关紧要的) 预测帧堆栈存储着被预测的当前帧,这些内容是通过前一帧和运动矢量的信息来构造的。然 后从实际的当前帧中减去被预测的当前帧,其差异作为输出。如果没有运动和其他变化(考 虑一种权端情况,一帧图象重复出现),当前帧可以很精确地预测出来,并且差值输出应为 零(很容易压缩)。当两帧不完全相同时,帧问差异只包含很少的信息,容易被压缩。 请注意,图7展示了如何生成前向预测帧(P帧)和双向预测帧(B帧),后面将有更为详尽 的定义。重要的是,这种帧内压缩,帧问压缩方式的组合,已构成了基本的MPEG—2视频压 缩系统。(图8)预铡帧是从经过DCT量化,解码的图象得来的,这样能够得到更好的整体效果, 因为编码器重复了解码器的工作过程,这样就减弱了数学运算导致的负效应,例如舍位, 进位错误。<b>
# [$ X7 H. E: I4 X# H4 Z8 n$ E6 g. e2 _% M6 _
<FONT color=#800080>基准图象堆栈如何影响预测能力</FONT>
, v7 X$ t1 f) T) f3 E </b>只能处理P帧的编码器和对P帧B帧都能处理的编码器主要的差异就在于基准帧堆栈。前向 预测只要求存储最后一个基准帧,而双向预测要求存储最后一个基准帧和一个将来的基准帧。<b>
6 D5 j- {4 }$ b7 H1 ^I-,B-,P-帧
" l8 @7 G8 ~" Q- K- l  </b>基于对帧问压缩的控制,开发了三类帧(图象)(图9): I—帧,只用于帧内编码: P—帧,从I—帧或其他P—帧经前向预测得来: B—帧,从I—帧与/或P—帧经双向预测得来o .图9展示了对l号帧(B—帧)做的双向预测。2号帧(B—帧)是从与1号帧相同的I—帧P—帧 得来的。4号帧(B—帧)是从3号帧(P—帧)和下一个0号帧(I—帧)得来的。 图象组(GOP) 一个GOP从一个I帧开始,延续到下一个I—帧出现前的最后—帧。图9所展示的GOP是一 个开环GOP—这个GOP的最后—帧使用下一个GOP的第一帧为其基准帧。另一类GOP是 闭环GOP,它与下一个GOP在预测方面没有关联,并且以一个P-帧结束。<FONT color=#008000>8 a3 K6 L; b1 W  Q4 N6 P% n5 t
</FONT>必须要了解一个很关键的问题:MPEG标淮只定义了解码器的标准结构。<FONT color=#008000>$ N& V7 E, e$ y2 k. P, N3 S+ [0 f
</FONT>图9是按照视频输入的顾序展示的帧序列.但是,为了预测B—帧,必须有两个基准帧(I—帧和 或/B帧)。因此,各帧离开解码器的颁序就应为0,3,1,2,0,4,5,其中第二个0帧是 下—个GOP的I帧。此时只有时间基准被加进了披压缩的视频数据,帮助解码器工作的进一 步的时间信息是在生成传输流(TS)时加入的(即PTS,显示时间标志)。这就是MPEG压缩 技MPEG-2标准是由ISO制订的。早期的MPEG-1标准着眼于较窄的带宽(因此分辨率较低),视 频流大约是1.5Mbp.MPEG-2利用了许多相同的技术,但着眼于4Mbps以上的比特串(通常 情况下上限是15bps,但有潜力达到更高).</FONT></P>
7 K/ k* a, d% d< ><b><FONT color=#800080 size=2>基本流和传输流(ES&amp;TS)</FONT></b></P>
% h6 q' B3 v# E' N3 l< ><FONT size=2> 音视频信号都被压缩成基本流(ES)的形式,然后用ES生成PES,再进一步打包生成TS。 图10展示了这一过程。 解码器标准化 必须要了解一个很关键的问题:MPEG标准只定义了解码器的标准结构。这样,伴随着未来的 编码器计算能力的提高,为图象质量的提高和数据速率的降低提供了发展余地. 类和级 MPEG规范被设计成在其服务的众多应用中是通用的。高达400Gb/s的比特率和16000点*16000 点的图象都可以被定义。为了给实际应用中的许多参数没定可行的界限,制定了一个由“类” 和“级”构成的体系.(表2)所谓的类,是整个比特流语法体系的一个子集。比如说,语法 体系允许按SNR(信噪比)或者空问分辨率进行分级操作,而主类和简单类不使用这部分语 法,所以不提供这个特性。所谓的级,包含了语法许可范围内的各项参数。比如说,主类主 级(MP·ML)允许最高15Mbps的码率,两主类高级(MP·HL)允许最高80Mbps的码率。</FONT></P>! z! B: a$ }; q" q6 z! m- f
< ><b><FONT color=#800080 size=2>分级能力</FONT></b></P>) n8 w3 t- K. A3 y+ q! T
< ><FONT size=2>  MPEG的编解码器一起工作并不需要具有可比的图象质量,这是因为规范令解码器具有分级能 力。凭借分级这一方法,简单廉价的解码器可以只对完整比特流中的一部分进行解码,生成 低于完整比特流解码器输出质量的图象。标准允许按SNR或空间分辨率进行分级。 SNR分级是指牺牲SNR性能,对图象质量作出权衡。低比特率的解码器可以提供满分辨率的 图象,但SNR性能要比高比特率的解码器低。 空间分级是指牺牲空间分辨率,对图象质量作出权衡。低比特率接收机的图象输出质量要比 高比特率的低。 为了与标准保持兼容,以11种规定的类/级组合中任意一方式工作的解码器,必须能够处理 在表格中位于其左侧或下方的工作模式的信号。这就是所谓的MPEG-2全兼容性。今天,许 多的产品开发是面向主类主级(MP·ML),也有一些是面向主类高级(MP·HL)的</FONT></P>  f# y0 f; C7 X, \- c  Q
< ><b><FONT color=#800080 size=2>MPEG-2 4:2:2类@主级</FONT></b></P>: O0 t; U/ D: z
< ><FONT size=2>  MPEG-2标准最初被设计用于视频传输,能提供家庭观众可以接受的图象质量。然而,主要是 由于有限的数据率(上限15Mbps)和4:2:0的采样方式,这种图象质量很明显无法用于专业 场合及后期制作等应用领域。由于色度数据的内插,4:2:0的采样方式无法满足工作间在多 代性能方面的要求。即使采用小的GOP(获得可编辑能力)和高达15Mb/s的数据宰仍达不到 要求的图象质量。而大的GOP在各种工作问的帧扫描切换环境中难于处理。</FONT></P>. K% F7 j6 I' V0 P- Z
< ><FONT color=#008000><FONT size=2> </FONT></FONT><FONT size=2>4:2:2@ML将比特率的上限扩展到了50Mb/s,并且对4:2:0和4:2:2的色度采样格式都提 供支持。就象MP·ML一样,它并没有因为支持更高级的类和级而带来复杂性方面的负担。</FONT></P>
; |4 B+ L! T" a! Y; T< ><FONT size=2>  1994年,一些厂商和用户要求MPEG委员会一个4:2:2类,允许在525和625线的系统上以 50Mbps的速率进行采样,为专业应用提供更高的图象质量。那时,TEKTRONIX公司组织发起 了一个由若干厂商组成的特别论坛,建议MPEG-2标准增加一个新类。甚至在4:2:2类的建 议提出之前,TEKTRONIX公司就已经在MPEG-2标准领域内积极工作,确保诸如11 bits的DC系 数,独立的亮度色度量化表格等特性被包含在MPEG标推内,为将来添加提供更高图象质量 的类作好准备。</FONT></P>6 Q1 ^/ D' e2 @' `
< ><b><FONT color=#800080 size=2>对于4:2:2类的需求</FONT></b></P>
9 {% C+ u6 |# A3 z5 X/ A< ><FONT size=2>  在分析表2的时候,对于新的4:2:2类的需求可能并不直观。毕竟,高达100Mbps的码率己 被HP@HL所覆盖,而且4:2:2的视频显示可以由高级中任何一个高于主类的类实现。那 么,为什么还需要一个额外的类呢?这个问题的答案在于实现的经济性。换言之,也就是构 造一个全兼容的解码器所需的花费。记住,要做到全兼容,解码器必须能处理表格中其左例, 下方所有的类朋组合。这就意味着,为了实现兼容性,工作于HP@HL的解码器就需要处理 ML,LL上的SNR可分级类。但是分级能力非常复杂,通常不为厂商所追求。其中的一个原因, 用简单的话讲就是:这种编解码过程将使编解码电路加倍,基本上可分级解码器的成本也将 加倍。而且,HP@HL采用短GOP结构可以达到20Mbps的最高码率,但并不能提供专业应用 所需要的图象质量,这样,HP@ML就要求在更高级别上的实现,继而还要求空间分级能力。 无论那种情况,专业应用都会背负上额外的成本开销;而在主级中增加一个4:2:2类(MPEG-2 4:2:2@ML),可以很容易地避免这些情况。 1996年1月,MPEG批准了主级中的4:2:2类,并将其定为国际标难。正如在图13所看到的, MPEG-2 4:2:2·ML从几方面扩展了MP·ML的功能。它把码率上限扩展到50Mbps,对4:2:0 和4:2:2的采样格式都提供支持。象MP@ML一样,为了支持更高级的类/级分级能力模型, 他并没有带来复杂性方面的负担。</FONT></P>  ~6 R+ i% _6 Q6 D; }* E4 `5 i
< ><FONT size=2>  表3中被显著标出的类和级都可以被兼容的4:2:2解码器处理。全兼容的MPEG-2 4:2:2@ML 设备,不仅可以对码率高达50Mbps及任意I,B,P组合的图象进行解码,也可以对MP@ML 高至15Mbps的任意I,B,P组合,MP@ML的任意I,B,P组合,SP@ML的任意I,P组合 进行解码。任何被限制在一个固定码率(比如18Mb/s),或者受限于图象类型的一个子集(比 如只能处理I,B),或者没有能力处理4:2:0的4:2:2解码器,都不是完全兼容的4:2:2·ML 解码器。同时要注意,兼容SNR·ML的解码器,无须为了证明兼容性去对4:2:2类进行解 码。</FONT></P>; V2 l9 G. F4 {( L# J
< ><FONT size=2>  MPEG-2 4:2:2·ML为具有以下要求的应用提供了高效率比的压缩技术:
) x" d" J  ~. l3 W! x' i" @" a/ W+ m高度的互操作性和灵活性。9 M- v( e# v+ K0 Y
比MP@ML高的图象质量。
# |4 T# s# c5 }$ u比MP@ML高的色度分辨率。
2 S9 ?! x3 @/ ]0 h- Q/ I压缩解压缩的后期制作能力。" B+ N/ z8 _' ~" v6 e5 a) p$ s
压缩解压缩的多代性能。& H0 R( ^4 c  Z3 g; O5 f
为获得可编辑能力而采用短的GOP。4 j9 e" r; S- W  _
再现视频信号中所有有效行的能力。
+ E! l$ x5 I2 H$ P# v* c3 U3 ~+ o再现帧消隐期信息的能力。</FONT></P>7 A: G, ?0 d$ ^' P7 _
< ><b><FONT size=2>MPEG-2 4:2:2·ML到底好不好?</FONT></b></P>
5 X8 ~& ~" \. S5 `5 b< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2>  1995年2月,TEKTRONIX帮助SMPTE进行了码率在20Mb/s到50Mb/s之间的MPEG-2 4:2:2@ML 专家审看测试。这些测试表明,MPEG-2 4:2:2@ML达到了专业应用领域的要求。通过提供一 些测试序列,协助进行压缩仿真,编辑525/625的测试录象带以及与SMPTE一起组织主观评 价,TEKTRONIX又一次扮演了关键角色.实验结果见表4。 由专家和非专家组成的观看员对525/60和625/50的系统分别进行了主观评价。525/60的测 试研究了大范围的码率和GOP结构:625/50的测试包括了更多种类的测试材料,但码率,GOP 结构,子代数量的组合比较少。测试涵盖了从第一代到第八代的压缩解压缩过程。(这里的 一代是指一个压缩解压缩循环)空间和时间的移位都被引入,以分析图象的重定位效果(可 能在DVE中发生)和多代处理后的图象排列定位。空间移位是指在一二代之间,图象沿水平 方向被移动两个象素点,沿垂直方向移动两个空间扫描行,在五六代之间再移回来。 节目材料包括典型序列,也包括难于压缩的测试材料。测试人员被要求对原始序列和被压缩 序列的图象质量进行分级评分:评分标推从0到100,0表示无劣化,100表示可能的最糟糕 的劣化情况。</FONT></P>$ b' j4 ?1 ~! l% \( o( v; P
< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2>  从这些测试可以看出同样的趋势:正如所预料的,专家的评价与非专家相比,要求更为苛刻。 在50Mb/s的码率下,可以使用短的GOP结构,比如只有I或IB,经过多代后,仍能保持优 异的图象质量;在30Mb/s的码率下,为了经过多代后仍能保持图象质量,就必须采用IB的 GOP结构;在20Mb/s的码率下,只有使用较长的GOP结构,如IBBP,才可能在有限的几代之 内保持图象质量。这说明,象20Mb/s这样较低的码率可以用于采集,但繁重的多代工作就 应该在较高的30Mb/s或50Mb/s的码率下进行。 对于在每个应用环境中获取效一费的最佳乎衡,码率和GOP结构的灵活性是非常关键的。这 种平衡类似于获得VHS或Beta的成本收益,取得D1的图象质量,同时又没有支持多种磁带 格式的恶梦。</FONT></P>5 B0 F# @' y3 }5 ]
< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><b><FONT color=#800080 size=2>MPEG-2对于广播行业和后期制作的重要意义</FONT></b></P>' Q% N# c4 Q' q
< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2>  对于广播和后期制作行业来说,MPEG-2有潜力解决年代久远的多种制式难题。为了挖掘这一 潜力,我们必须时刻注意应用的要求和特点。考虑以下图14中的应用示例吧。</FONT></P>2 x) H5 s. Q: m/ a8 ^4 e* F& _
< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><b><FONT color=#800080 size=2>新闻与采集</FONT></b></P>
4 t" f' e( t7 {" N% d< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2>  这一应用要求高画质的场视频采集和有限数量的多代性能(新闻应用)。更可能是用于有以 下特性的摄录象机:便于携带,重量轻,以电池为电源(有合理的电池寿命),合理的价格 (由于掉进河里或摔在卡车上,我们可能要定期更换)。所有这些特性可以通过低码率(带 来低功耗,低价线路)和简单的GOP结构(低价线路,易于编辑)。</FONT></P>
) i# S( }& i; |! s# B( `< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><b><FONT color=#800080 size=2>归档</FONT></b></P>% L/ c5 N/ s' j2 H8 ~
< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2>  这种应用要求高质量,或至少相对于原材料没有质量损失。可以通过使用较高的码率和IB 的GOP结构来获取优异的图象质量。</FONT></P>
+ ]) a, \/ Q" W1 @1 @< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><b><FONT color=#800080 size=2>后期处理</FONT></b></P>/ i. J3 G( t6 w2 P/ S1 b" O& ]
< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2> 这种应用要求优异的图象质量和高的可编辑能力。50Mb/s的码率和只有I帧的GOP结构是合 理的选择。</FONT></P>
6 \, j" q: e: k; l2 g< align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><b><FONT color=#800080 size=2>传输</FONT></b></P>
# P4 I) o% |, N5 j; T9 f4 g- a# m<P align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2>  这种应用要求高的存储效率和广播级的图象质量。这里,20Mb/s的码率(或以15Mb/s的码 串送入NTSC或PAL的发射机,或者更低的如DBS)与长的GOP结构相结合,就可以获得高 效存储和优异画质。 这种针对不同的应用采用不同的码串和GOP结构的概念,类似于用BetacmSP录象,用D1 记录,用VHS或U-Matic传输,用BetacamSP存档。任何在任何时候,都有可能以一种应 用获取材料,用另一种应用来处理,这时全兼容的MPEG-2 4:2:2@ML就可以帮助解决多格式 的难题。基本上,全兼容的解码器有能力取代集中不同的VTR格式,并且可以使一台单独的 硬件设备应用于任何一种谈到的应用环境中。弥不再需要选择格式了。</FONT></P>% {: f. f4 E3 j. z( s
<P align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><b><FONT color=#800080 size=2>总结</FONT></b></P>2 ?" O4 Z) P. v( N# S
<P align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2>  Tektronix在原始的MPEG标准和4:2:2类的发展过程中扮演了至关重要的角色,Tektronix 建议并努力投身于4:2:2类需求的签定工作中去,后来又主持MPEG委员会来制订这个标准。 为了对MPEG—2标准和4:2:2类负责,Tektronix希望成为第一家提供MPEG—2 4:2:2@ML设 备的厂商。实际上,Tektronix:在1996年的NAB贸易展览会上就展示了早期硬件模型。 基于这些观点和背景,了。Tektronix作出以下总结: 符合标推对生产厂商和用户都有利。对象Tektronix一样的厂商有利是因为它打开了通向高 效率比压缩应用的大门,作为生产厂商我们能够把精力集中在为用户提供最好的解决方案 上。对于视频设备用户而言,符合标准意味着选择设备只需考虑谁能提供最好的解决方案, 你就不会受困于一家厂商,因为所有使用复合,分量视频标准的设备能够象今天一样地协调 工作。</FONT></P>
" E1 X8 y" w8 e0 A- C<P align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><b><FONT color=#800080 size=2>MPEG标准向着互操作性迈进了一大步</FONT></b></P>
# o+ A5 ^4 _2 {: K1 \: J1 l2 G<P align=left style="LINE-HEIGHT: 200%; MARGIN-LEFT: 5px; MARGIN-RIGHT: 5px; TEXT-INDENT: 20px"><FONT size=2>  4:2:0格式(MPEG-2MP·ML)是通过DBS(直播卫星)和电缆向家庭用户发送MPEG-2码 流的最佳选择。然而,如果要向NTSC或PAL的发射机传送广播质量的信号,MPEG-2 4:2:2@ML 将是更为合适的选探。主观评价已经证实,选择好码率和GOP结构,MPEG-2   4:2:2@ML可以达到甚至超过专业视频 的要求。 码率和GOP结构的灵活性是保证图象质量的关键,如何权衡这两个参数是由应用决定的。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
May God grant me the wisdom to discover the right and strength to make it endure 因为陌生,所以勇敢,因为距离,所以美丽。
ilikenba 实名认证       

1万

主题

49

听众

2万

积分

  • TA的每日心情
    奋斗
    2024-6-23 05:14
  • 签到天数: 1043 天

    [LV.10]以坛为家III

    社区QQ达人 新人进步奖 优秀斑竹奖 发帖功臣

    群组万里江山

    群组sas讨论小组

    群组长盛证券理财有限公司

    群组C 语言讨论组

    群组Matlab讨论组

    回复

    使用道具 举报

    kenneth        

    10

    主题

    1

    听众

    98

    积分

    升级  97.89%

    该用户从未签到

    新人进步奖

    回复

    使用道具 举报

    loveyuan        

    21

    主题

    2

    听众

    104

    积分

    该用户从未签到

    国际赛参赛者

    元老勋章

    呵呵 mpeg-2的源码好长的 就是个协议也有几百页那!这点介绍只是皮毛了 嘿嘿!
    回复

    使用道具 举报

    ilikenba 实名认证       

    1万

    主题

    49

    听众

    2万

    积分

  • TA的每日心情
    奋斗
    2024-6-23 05:14
  • 签到天数: 1043 天

    [LV.10]以坛为家III

    社区QQ达人 新人进步奖 优秀斑竹奖 发帖功臣

    群组万里江山

    群组sas讨论小组

    群组长盛证券理财有限公司

    群组C 语言讨论组

    群组Matlab讨论组

    <DIV class=quote><B>以下是引用<I>kenneth</I>在2004-4-30 10:27:00的发言:</B>
    # s5 V: n/ S0 g5 P9 j/ L" M0 B5 b2 ?3 o) W% J4 i5 l0 a
    <>太長了</P>1 w7 D3 A7 X/ A1 i: t" D
    <>又不是源代碼</P>
    / T( {- `1 x5 w! z2 F6 g<>以後有空再看吧</P></DIV>0 W8 E  z9 r$ g& r) r& Q

    6 `9 _* O/ I6 U5 C先理解了算法再看源代码不是更好吗?
    回复

    使用道具 举报

    duanfei        

    0

    主题

    1

    听众

    23

    积分

    升级  18.95%

    该用户从未签到

    新人进步奖

    回复

    使用道具 举报

    xShandow        

    43

    主题

    1

    听众

    385

    积分

    升级  28.33%

    该用户从未签到

    新人进步奖

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-20 09:56 , Processed in 0.648224 second(s), 91 queries .

    回顶部