IPTV那些事儿
IPTV吵得很热啊,不过不管它热不热,相关技术都是相通的,最近也开始做这方面的应用了,但对于视频、音频这方面,我完全是门外汉,那么多标准、那么多格式一下子就搞糊涂了,网上查来查去,也还是个一知半解,于是决定理一下思路,这个思路呢,围绕IPTV来理吧,因为这个东西,不管它有没有用,确实是个技术交叉点。
先说明一下,这些东西大多是从互联网上搜索来了,我呢,全当自己的学习笔记了。
IPTV,顾名思义,在IP网络上传输的TV。在以前绝对是两个完全不相关的行业,现在由于技术的发展,要融合到一起了,我觉得要理清这些东西,首先得从两个行业说起,通俗点就是电视和电脑。
电视这东西,比电脑历史更悠久,先来看看电视的远古历史:
1926年1月27日,苏格兰发明家约翰·贝尔德向伦敦皇家学院的院士们展示了一种新型的、能够通过无线电传递活动图象的机器,贝尔德称他的发明为“电视”。
1927年,约翰·贝尔德成功地在640公里之间接纳传送了电视信号。同年,美国人的第一个实验电台WGY开始实验广播。
1930年,德国展出了功率为2000瓦的电视发射机。
1931年,美国RCA无线电公司制造的第一个实用摄像管问世。
1935年,英国人建立了亚力山大电视台,正式播放电视节目。同年,德国通过电视播放了奥林匹克运动会的实况。
1939年,美国实验播放彩色电视。
1956年,美国安培公司研制成功第一台广播用磁带录像机,用磁性材料记录活动影像的时代从此开始。
…..
…..
…..
就这样,电视发展到了今天,成为了上个世纪全球最重要的信息工具,这些远古历史好像和我们没有什么太大的关系,但这些电视的远古历史一直到最近,都有一个共同点,那就是:它是模拟的!
一,模拟电视
你会说,这也不是什么大秘密嘛,大家都知道模拟电视。但对于我来说,却还是有点怪怪的感觉,小时候,在家看电视,也没管过它是模拟的还是数字的(当然,也不知道管),只知道小孩子天天要看动画片,大人则忙着看肥皂剧,后来,到外地读书,离电视远了,走进了电脑的世界,这个世界比那个世界丰富多彩得多,自然也就没有机会再去了解电视了,对电视的相关技术,我还真是一点也不了解。扯远了,网上查了半天,也没找到模拟电视的定义,到有数字电视的定义:从拍摄、编辑、制作、播出、传输等电视信号播放和接收的全过程都使用数字技术的电视系统叫数字电视。那我想,模拟电视就可以说是这些过程中不完全采用数字技术的电视系统罗!
至少,所有的视频节目,不管是电视上的还是电脑上的,都是由摄像机拍摄的,我们知道摄像机有数字的也有模拟的,它们之间的区别主要是,模拟摄像机拍摄的视频直接在磁带上存储为模拟信号,可以直接在电视机上播放,而要利用电脑来处理就需要利用视频采集卡把模拟信号转换成数字信号再放到电脑中处理;而数字摄像机在摄像机内部已经把CCD或者CMOS传来的模拟信号直接转换成了数字信号存储在数码专用磁带或硬盘、闪存卡等中了。一般来说数字摄像机比模拟摄像机的效果要好,但专业级别我就不好说了,那些器材大多价格高昂,这也不是这里的主题了。
现在的电视节目制作肯定逃不过电脑,所以,就算是模拟电视,我觉得至少编辑制作的过程应该是数字的吧,然后呢,再转换成模拟信号发送出去,电视机接受到模拟信号,再播放出来。根据电视机的不同,如果是阴极射线管电视机,就直接显示出来,如果是数字的,比如液晶电视,需要先把模拟信号再转换成数字信号才能显示出来 。
写到这里,对于传统的模拟电视,思路已经比较清晰了,但模拟电视也需要相关的标准,无规矩不成方圆嘛,这里,三员大将登场啦:PAL & NTSC & SECAM。
这是目前,电视行业的三大制式:
1.正交平衡调幅制——National Television Systems Committee,简称NTSC制。采用这种制式的主要国家有美国、加拿大和日本等。 NTSC制又称为恩制。它属于同时制,是美国在1953年12月首先研制成功的,并以美国国家电视系统委员会(National Television System Committee)的缩写命名。这种制式的色度信号调制特点为平衡正交调幅制,即包括了平衡调制和正交调制两种,虽然解决了彩色电视和黑白电视广播相互兼容的问题,但是存在相位容易失真、色彩不太稳定的缺点。NTSC制电视的供电频率为60Hz,场频为每秒60场,帧频为每秒30帧,扫描线为525行,图像信号带宽为6.2MHz。
2.正交平衡调幅逐行倒相制——Phase-Alternative Line,简称PAL制。中国、德国、英国和其它一些西北欧国家采用这种制式。PAL制又称为帐尔制。它是为了克服NTSC制对相位失真的敏感性,在1962年,由前联邦德国在综合NTSC制的技术成就基础上研制出来的一种改进方案。PAL是英Phase Alteration Line的缩写,意思是逐行倒相,也属于同时制。它对同时传送的两个色差信号中的一个色差信号采用逐行倒相,另一个色差信号进行正交调制方式。这样,如果在信号传输过程中发生相位失真,则会由于相邻两行信号的相位相反起到互相补尝作用,从而有效地克服了因相位失真而起的色彩变化。因此,PAL制对相位失真不敏感,图像彩色误差较小,与黑白电视的兼容也好,但PAL制的编码器和解码器都比NTSC制的复杂,信号处理也较麻烦,接收机的造价也高。PAL制式中根据不同的参数细节,又可以进一步划分为G、I、D等制式,其中PAL-D制是我国大陆采用的制式。PAL制电视的供电频率为50Hz、场频为每秒50场、帧频为每秒25帧、扫描线为625行,图像信号带宽分别为4.2,5.5,5.6MHz等。
3.行轮换调频制——Sequential Coleur Avec Memoire,简称SECAM制。采用这种制式的有法国、前苏联和东欧一些国家。又称塞康制,法文Sequentiel Couleur A Memoire缩写,意为"按顺序传送彩色与存储",1966年法国研制成功,它属于同时顺序制。在信号传输过程中,亮度信号每行传送,而两个色差信号则逐行依次传送,即用行错开传输时间的办法来避免同时传输时所产生的串色以及由其造成的彩色失真。SECAM制式特点是不怕干扰,彩色效果好,但兼容性差。帧频每秒25帧,扫描线625行,隔行扫描,画面比例4:3,分辨率720×576。 采用SECAM制的国家主要为俄罗斯、法国、埃及等等。
不用说,上面这些长篇大论是网上抄来的啦,但它可以帮助我们了解这些制式的基本信息,我们可能见的最多的是PAL,因为我们国家用的就是这种制式,其次是NTSC,其实对于SECAM,我以前都没听说过,这里主要讨论PAL和NTSC,至于SECAM,我暂且放过它啦。
看到这些,其实我都头大了,因为很多概念容易和电脑上的混淆,特别是分辨率,就从这里说起,在电脑上,一般来讲,我们讲的分辨率就是指水平和垂直两个方向上显示的像素的个数,比如800×600、1024×768。
大家知道,在LCD刚热起来的时候,大家选购显示器时,总会考虑是买CRT还是买LCD,特别是游戏玩家,其中,最重要的一个因素就是分辨率。对于LCD来讲,它由数量众多的晶体管构成的,因此这就决定了其最佳分辨率就是其固定分辨率,而且它的最高分辨率就是其固定分辨率,如果LCD不以其固定分辨率来显示的话,就不会达到最好的效果。而CRT显示器的分辨率通常在一定范围内是可以调节的。在CRT的参数中,有一个是和分辨率紧密相关的,这就是扫描频率 ,所谓扫描频率,是指显示器每秒钟扫描的行数,单位为千赫(KHz)。它决定着最大逐行扫描清晰度和刷新速度。水平扫描频率、垂直扫描频率、分辨率这三者是密切相关的,每种分辨率都有其对应的最基本的扫描速度,比如分辨率为1024×768的水平扫描速率为64KHz。
再回到模拟电视上,在模拟电视上,电视机本身的参数就和CRT显示器一样,不会固定分辨率,只会在一个范围内可调,不过这个分辨率范围比用于电脑的CRT显示器低得多,那么我们讲的电视的分辨率是指什么呢?
是指NTSC或PAL这种制式所规定的分辨率,这就引入了一个新词汇——扫描线。在电脑上,我们以像素点的个数定义分辨率,但在模拟电视上,像素这个概念是不准确的,因为模拟电视信号是模拟的,它的图像是由扫描线构成的(CRT显示器也如此吧)。比如NTSC制式所规定的扫描线是525行,也就是说NTSC制式的全屏图像每一帧有525条水平线。这些线是从左到右从上到下排列的。从电视的角度说,NTSC的分辨率就是525线,相应的PAL的分辨率是625线。那为什么经常看见很多资料说NTSC的分辨率是720*480,PAL的分辨率是704×576,而且上面SECAM的资料里说它的分辨率是720×576呢?这个问题要等到后面再来解答。
NTSC和PAL以及SECAM还有很多参数和特性,各有优缺点,总之,在历史的迷雾中,他们互相都没有打倒对方,所以才有了今天的局面,事实上,现在全球在使用的电视制式远不止这三种,而且,不同两个国家如果都采用PAL制式,它们之间还有区别,所以,电视行业也够复杂的把。
下面,不得不说的一个东西就是色彩了,因为这些制式最终目的就是要把真实世界中丰富的色彩给显示出来。这些色彩的表示方法就是我们常叫的色彩空间吧。
二、色彩空间
在电脑上,我们用RGB色彩空间来描述颜色,在印刷行业,用的是CMYK色彩空间。那么在电视行业呢?对应的就是PAL制式的YUV色彩空间、NTSC的YIQ色彩空间等,以及还有其他的表示方法,比如HSI。这些知识涉及的面很广,但它们的目的是一样的,就是以一种方式来表达颜色。
先简单说下RGB,计算机彩色CRT显示器显示色彩的原理与彩色电视机一样,都是采用R(Red)、G(Green)、B(Blue)相加混色的原理:通过发射出三种不同强度的电子束,使屏幕内侧覆盖的红、绿、蓝磷光材料发光而产生色彩。根据三基色原理,任意一种色光F都可以用不同分量的R、G、B三色相加混合而成。
F = r [ R ] + g [ G ] + b [ B ]
其中,r、g、b分别为三基色参与混合的系数。当三基色分量都为0(最弱)时混合为黑色光;而当三基色分量都为k(最强)时混合为白色光。调整r、g、b三个系数的值,可以混合出介于黑色光和白色光之间的各种各样的色光。
那么YUV又从何而来呢?在现代彩色电视系统中,通常采用三管彩色摄像机或彩色CCD摄像机进行摄像,然后把摄得的彩色图像信号经分色、分别放大校正后得到RGB,再经过矩阵变换电路得到亮度信号Y和两个色差信号R-Y(即U)、B-Y(即V),最后发送端将亮度和色差三个信号分别进行编码,用同一信道发送出去。这种色彩的表示方法就是所谓的YUV色彩空间表示。
采用YUV色彩空间的重要性是它的亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V分量,那么这样表示的图像就是黑白灰度图像。彩色电视采用YUV空间正是为了用亮度信号Y解决彩色电视机与黑白电视机的兼容问题,使黑白电视机也能接收彩色电视信号。
YUV与RGB相互转换的公式如下(RGB取值范围均为0-255):
Y = 0.299R + 0.587G + 0.114B
U = -0.147R – 0.289G + 0.436B
V = 0.615R – 0.515G – 0.100B
R = Y + 1.14V
G = Y – 0.39U – 0.58V
B = Y + 2.03U
通常,YUV还有一种叫法,叫YCbCr,其实,他们不是等同的,大多情况下,我们把他们混淆了,YCbCr 是在世界数字组织视频标准研制过程中作为ITU – R BT1601 建议的一部分, 其实是YUV经过缩放和偏移的翻版。其中Y与YUV 中的Y含义一致, Cb , Cr 同样都指色彩, 只是在表示方法上不同而已。YCbCr和RGB之间的转换公式如下:
Y’ = 0.257*R’ + 0.504*G’ + 0.098*B’ + 16
Cb’ = -0.148*R’ – 0.291*G’ + 0.439*B’ + 128
Cr’ = 0.439*R’ – 0.368*G’ – 0.071*B’ + 128
R’ = 1.164*(Y’-16) + 1.596*(Cr’-128)
G’ = 1.164*(Y’-16) – 0.813*(Cr’-128) – 0.392*(Cb’-128)
B’ = 1.164*(Y’-16) + 2.017*(Cb’-128)
在YUV 家族中, YCbCr 是在计算机系统中应用最多的成员, 其应用领域很广泛,JPEG、MPEG均采用此格式。所以一般人们所讲的YUV大多是指YCbCr。所以,到后面VCD、DVD、数字高清什么的都会和这个YCbCr有关系,不过大家一般还叫它YUV。YCbCr有很多种取样格式,比如4:4:4,4:2:2,4:1:1以及4:2:0。这些东西大多和电脑发展起来后的多媒体有关系,再后面再讲。
在硬件上,还有YCbCr、YPbPr等色差接口的叫法,它们也很容易让人混淆,但他们都是电脑发展以后的产物了。在电脑不能处理多媒体以前,就是在没有VCD什么的以前,大家知道,那个时候有录像机,那个记录的也是模拟信号,就像卡带随身听的卡带一样,和它最相关的标准可能就是VHS了,这里不多说,要不就扯远了。总之,那个时代是模拟的时代。所以,我想,有线电视,无线电视,他们是不是接收的以模拟方式传输的YUV信号,再播放出来?那个年代是不是和YCbCr没有关系?
关于这些硬件的视频接口,将在后面再一次讨论。至于YIQ,Y分量代表图像的亮度信息,I、Q两个分量则携带颜色信息,I分量代表从橙色到青色的颜色变化,而Q分量则代表从紫色到黄绿色的颜色变化。跟YUV的概念差不多。
讲到这里,在没有电脑掺和的模拟电视时代的情况我基本回顾完拉,不过似乎忘了讲一个东西了,就是声音。
大家可能知道,很多收音机可以收到电视台的声音,其实这就是模拟电视的伴音,在模拟电视系统中,声音是模拟传输的,只是不同的电视频道有不同的频率,网上可以找到很多电视伴音频率表。模拟电视的伴音都是单声道,即便电视是两个喇叭播出来,但效果还是很差。现在的数字电视或者IPTV就大大不一样拉。
下次,就去从电脑的角度整理思路去,等这两条思路融合了,就到现在我们讲的IPTV啦…
三、电脑入侵
上次说完了模拟电视,这次就从电脑说开了,自从多媒体技术在计算机领域飞速发展应用以来,这些技术快速的渗透到了传统行业,当然也包括电视行业…
首先是显示设备,古老的CGA、EGA显示器就不说了,直接从VGA说起,正是有了VGA,才有了电脑多媒体的可能,最早的VGA显示器分辨率只有640×480,颜色只有256色,现在一个手机都比它强吧,从最早的VGA一直发展到了今天的SVGA(800×600)、XGA(1024×768)、UVGA(1600×1200)、WXGA(1280×800)等各种分辨率规格,以及手机等掌上设备使用的QVGA(240×320)也就是VGA的四分之一。这些分辨率,都是计算机行业使用的标准分辨率,很显然和电视行业不同。
那个时候,VGA的显示器都是CRT显示器,CRT显示器因为设计制造上的原因,只能接受模拟信号输入,这就需要显卡能输出模拟信号。VGA(VideoGraphicsArray)接口,也叫D-Sub接口就是显卡上输出模拟信号的接口,就是大家最常见的那种15针的显示器接口。直到现在来到了液晶时代,还受到那个年代的影响,本来液晶显示器应该直接输入数字信号,结果,为了和以前的设备兼容,只好还采用VGA的接口,电脑里的数字信号先被显卡转换成模拟信号,再送给液晶显示器又转换回数字信号显示出来,这样的转换过程,图像必定有所损失。不过,现在的显卡上已经有了DVI、HDMI等数字传输的接口,这是将来的发展趋势了。
让我们回忆一下,最早在电脑上看片是什么时候,我出道较晚,接触电脑基本上已经全是瘟98了,那是在电脑上看碟已经很普遍了。据说,瘟95是世界上第一个用CD-ROM发行的操作系统,直接促进了CD-ROM在PC上的普及,也直接催生了VCD、DVD这些数码播放机的诞生。
其实,CD光存储早在上个世纪70年代就已经研制成功,比如以前如火冲天的CD随声听、LD激光视盘等,直到90年代才在电脑上普及。
电脑上的影音,这时就要谈到MPEG了,MPEG的全称是“Motion Picture Expert Group”(移动影像专家组),隶属于ISO/IEC的一个专家工作组,组建于1988年,目的是为传送音频和视频制定标准。正是由于它,。今天,视听才全面进入数码化的时代。
MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。
简单来说,到目前为止,有MPEG-1、MPEG-2、MPEG-4三大标准在历史上诞生,本来还有专门为HDTV准备的MPEG-3,但结果被MPEG-2取代了。
MPEG-1最大的应用可能就是VCD了,MPEG-2最大的应用可能是DVD和现在的数字高清电视,MPEG-4则是在网络上流传最广的拉,至于流行的MP3,其实是MPEG 1 layer 3,MPEG-1的一部分。
先说VCD,VCD标准由索尼、飞利浦、JVC、松下等电器生产厂商联合于1993年制定。它的格式可分为:
分辨率为352×240像素,每秒29.97幅画面(NTSC制式)
分辨率为352×240像素,每秒23.976幅画面
分辨率为352×288像素,每秒25幅画面(PAL制式)
也就是说VCD的分辨率大约是对应电视制式分辨率的四分之一,说道这里,得回到上次说的那个问题,就是说为什么说NTSC的分辨率是720*480,PAL的分辨率是704×576?这样看来,VCD刚好是它们的四分之一。
这个问题,也是网上得来的答案,已经有网友分析了这个问题,以NTSC为例子来说明:
我们上次说过,在模拟电视上讨论“像素”是不合适的,因为它的图像是由扫描线构成的,电视上的像素其实是扫描线上的取样点。从视频业界的角度来看,目前的数字视频格式,包括DVD、DV、VCD、SVCD、数字电视等所有实际应用的格式,都是为了通用性而设置的。二十世纪七十年代晚期数字视频技术诞生的时候,已经有了大量的模拟视频设备和素材。如果下一代的数字设备和这些已有的设备全无关系而且要把老设备完全扔掉的话,那真是巨大的浪费。因此数字视频技术标准从一开始就考虑到了和以前模拟设备的兼容性,以及对模拟素材的数字化。
当时的模拟电视制式主要有PAL、SECAM以及NTSC,为了统一标准以及降低设备成本,人们需要制定一个统一的取样率标准对这些制式进行数字化。这个取样率被定为13.5 MHz。我们知道对于NTSC制式,可以认为是相当于每秒钟扫描29.97帧图像,每幅图像由525条扫描线组成。这样每条扫描线的时长就是1/ (29.97*525)=63.5微秒。但是这63.5微秒并不能全部用来搭载图像信息,因为要有大约10微秒用于回扫和同步信号,实际可以搭载图像信息的时长只有约53.3微秒。对于13.5 MHz的取样率,这53.3微秒的取样数是多少呢?53.3*13.5约等于720,每条扫描线有720个取样,这就是水平分辨率720像素的由来。
那么垂直方向上是如何取样的呢?很简单,就是按照有效扫描线的数量来取样。NTSC制式虽然总共有525条扫描线,但用于显示图像的有效扫描线只有486 条(其它的也是用于回扫和同步),所以垂直方向上应该就是486个取样。不过486这个数字不零不整,而MPEG-2对画面是按16*16像素的宏块来处理的,如果取样数能被16整除会很方便。因此在垂直方向上裁掉6个像素而只保留480个像素,这就得到了NTSC制式720*480的画面分辨率。

其他制式,比如PAL,道理也是一样的。
再回到VCD的话题,VCD的视频采用MPEG-1压缩编码,音频采用MPEG 1/2 Layer 2(MP2)编码。码率分别为视频1150kbit/s,音频224kbit/s。 整个视频质量和模拟时代的VHS录像带相当。但进步依然是明显的。
VCD有一些后续发展,比如SVCD,不过现在基本都被DVD取代了。
VCD同时带来了我们所熟悉的一些接口,比如,AV端子、S端子 。
抄一段网上对这两个端子的描述做为今天的结尾吧:
复合端口也称AV 接口,通常都是成对的白色音频接口和黄色的视频接口,它通常采用RCA(俗称莲花头)进行连接,使用时只需要将带莲花头的标准AV线缆与相应接口连接起来即可。AV接口实现了音频和视频的分离传输,这就避免了因为音/视频混合干扰而导致的图像质量下降,但由于AV接口的传输仍然是一种亮度/色度(Y/C) 混合的视频信号,仍然需要显示设备对其进行亮/色分离和色度解码才能成像,这种先混合再分离的过程必然会造成色彩信号的损失,色度信号和亮度信号也会有很大的机会相互干扰从而影响最终输出的图像质量。AV还具有一定生命力,但由于它本身Y/C混合这一不可克服的缺点因此无法在一些追求视觉享受极限的场合中普及。
S端子也是非常常见的端子,其全称是Separate Video,也称为 SUPER VIDEO。S-Video连接规格是由日本人开发的一种规格,S指的是“SEPARATE(分离)”,它将亮度和色度分离输出,避免了混合视讯讯号输出时亮度和色度的相互干扰。S端子实际上是一种五芯接口,由两路视亮度信号、两路视频色度信号和一路公共屏蔽地线共五条芯线组成。
同AV 接口相比,由于它不再进行Y/C混合传输,因此也就无需再进行亮色分离和解码工作,而且使用各自独立的传输通道在很大程度上避免了视频设备内信号串扰而产生的图像失真,极大地提高了图像的清晰度。但S-Video 仍要将两路色差信号(Cr Cb)混合为一路色度信号C,进行传输然后再在显示设备内解码为Cb和Cr进行处理,这样多少仍会带来一定信号损失而产生失真(这种失真很小但在严格的广播级视频设备下进行测试时仍能发现) 。而且由于Cr Cb的混合导致色度信号的带宽也有一定的限制,所以S-Video虽然已经比较优秀,但离完美还相去甚远。S-Video虽不是最好的,但考虑到目前的市场状况和综合成本等其它因素,它还是应用最普遍的视频接口之一。
四、流水帐
突然觉得前面那样写也很无聊,反正大多是网上搜来的,自己记录下来,那就记点流水帐好了:
DVD:
DVD,视频采用MPEG-2编码,音频格式AC3、DTS等,最多容纳8条音轨,最高码率10.08M/s,分辨率720×480(NTSC),720×576(PAL)。
DVD光盘目录下包含三种类型的文件:.VOB文件、.IFO文件和.BUP文件。
.VOB文件用来保存所有的音视频数据。这些数据不仅包含影片本身,而且还有供菜单和按钮用的画面以及多种字幕的子画面流;
.IFO文件保存控制.VOB文件播放的信息,这个文件中可以找到有关怎么样以及何时播放.VOB文件中数据的控制信息。由于.IFO文件对于保证光盘的正常播放是至关重要的,因此.IFO文件的副本保存在.BUP文件中。
在每一个DVD光盘中都有视频管理器 (VMG)。视频管理器存放在一个VIDEO_TS.IFO文件中,它保存光盘的全局信息,比如光盘可以在哪个地区播放。同时,还保存如何显示可选菜单的信息。其中用于显示菜单的数据保存在VIDEO_TS.VOB文件中。当光盘插入到光驱中时播放器首先显示这个菜单。大多数菜单可以让观众跳到影片中指定场景,选择语言字幕以及观看增加或删除的场景等。在每一个DVD视频光盘中至少应该有一个视频节目(video title)。这个视频节目包含实际呈现给观众的信息,比如一部电影。其他的节目可以包含剪辑下来的场景、影片预告、拍摄花絮或者其他的信息。
而由于商业利益的原因,DVD刻录技术有三大类、五种规范(DVD-RAM、DVD-R/RW、DVD+R/RW)。以及后来的DVD±RW。
除了S端子、AV端子,DVD上常常见到YCbCr、YPbPr,也就是色差分量端口,网上有两种观点。

一、YPbPr 表示逐行扫描色差输出、YCbCr表示隔行扫描色差输出。
二、YCbCr用来定义数字信号,YPbPr为模拟信号可以是逐行也可以是隔行,P被一些DVD和TV 厂家曲解成Progressive,导致了理解的混乱。
DVD采用的相关编码技术:
MPEG-2: 制定于1994年,设计目标是高级工业标准的图象质量以及更高的传输率。MPEG-2所能提供的传输率在3-10Mbits/sec间,MPEG-2也可提供并能够提供广播级的视像和CD级的音质。MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也可播放 MPEG-1格式的数据,如VCD。
同时,由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。(MPEG-3要求传输速率在20Mbits/sev-40Mbits/sec间,但这将使画面有轻度扭曲)。除了做为DVD的指定标准外,MPEG-2还可用于为广播,有线电视网,电缆网络以及卫星直播提供广播级的数字视频。
MPEG-2的另一特点是,其可提供一个较广的范围改变压缩比,以适应不同画面质量,存储容量,以及带宽的要求。
MPEG-2的编码图像被分为三类,分别称为I帧,P帧和B帧。
I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。
MPEG-2的编码码流分为六个层次。为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。它分为六层,自上到下分别是:图像序列层、图像组(GOP)、图像、宏块条、宏块、块。
AC3(全称Audio Coding3音频编码3)是杜比数码的同义词,杜比数码是一种高级音频压缩技术,它最多可以对6个比特率最高为448kbps的单独声道进行编码。
1994年,日本先锋公司宣布与美国杜比实验室合作研制成功一种崭新的环绕声制式,并命名为“杜比AC-3”(Dolby Surround Audio Coding-3)。1997年初,杜比实验室正式将“杜比AC-3环绕声”改为“杜比数码环绕声”(Dolby Surround Digital),我们常称为Dolby Digital。
杜比AC-3提供的环绕声系统由5个全频域声道和1个超低音声道组成,被称为5.1声道。5个声道包括左前、中央、右前、左后、右后。低音声道主要提供一些额外的低音信息,使一些场景,如爆炸、撞击等声音效果更好。6个声道的信息在制作和还原过程中全部数字化,信息损失很少,全频段的细节十分丰富。
DTS(DTS Digital Surround),DTS采用CAC(Coherent Acoustics Coding,相干声学编码)方式工作。
DTS分左、中、右、左环绕、右环绕5个声道,加上低音声道组成5.1声道,这一点和杜比数字相同。但DTS在DVD中标准的数据流量为 1536kbps,而Dolby Digital的数据流量是384Kbps~448Kbps,最高可提升到640Kbps,显然相比之下DTS具体更高的数据流量,也就具有更低的数字压缩比。数据压缩比越低,占用的记录空间越大,但其重放音质就有可能越好,加之DTS采取高比特、高取样率等措施,使之对原音重现的追求上就更进了一步,因此DTS被很多人认为比Dolby Digital具体更好的效果。
Place your comment