Field 场交错的视频流 (
Interlaced video streams) 包含的是场而不是帧 (
frames)。
FourCCFourCC代表四字符代码(four character code),是一种独立标示视频数据流格式的四字符代码。视频播放软件通过查询FourCC代码并且寻找与FourCC代码相关联的视频解码器来播放特定的视频流。比如: DIV3 = DivX Low-Motion, DIV4 = DivX Fast-Motion, DIVX = DivX4.
Formats used for DVD conversion DVD转换时使用的格式
- VCD: Video CD,在很多DVD播放器上都可以播放,几乎每个操作系统下都有相应的播放软件。播放这种盘不需要很快的电脑,但是图像质量和VHS差不多。它的视频是1150kbit/s的MPEG1,音频是224kbit/s的MPEG1 audio layer 2。
- SVCD: Super Video CD,在亚洲国家多用。视频部分使用MPEG2,达到了LD的图像质量,同时提供高质量的环绕立体声。另外它也可以借助硬件解码器的优势,很多系统上也有播放软件。但是,只有少数亚洲制造的低端DVD播放机可以播放SVCD,在欧洲和美国没有这种播放机出售,你只能在你的电脑上看。视频使用最高2600kbit/s的MPEG2,音频使用224kbit/s的MPEG1 audio layer 2。虽然也可以用MPEG2多声道音频,但它只能在Linux上编码,而且由于对这种格式的支持很少,很难说大部分的播放器能不能播放这种5.1声道的MPEG2音轨。同时这种盘可以提供菜单。
- miniDVD: 可以说是在CD上存放的DVD,码率最高10mbit/s (包括视频和音频)。视频部分采用MPEG2,VBR,音频部分可以是MPEG1 audio layer 2、raw uncompressed PCM或者AC3。如果你愿意接受播放时间的限制的话,视频质量可以和DVD一样。你也可以建立DVD一样的菜单。缺点是miniDVD只能在PC上播放,在Affrey LD 2060上需要你升级播放机来得到播放miniDVD的能力。
- DivX/MPEG4: 根据你选择的分辨率和码率的不同,视频质量可以从低于VHS到接近DVD。可以选择很多种音频格式。你可以制作非常像DVD的DivX CD:多语言、字幕、菜单,虽然工作量很大。另外虽然目前还没有播放机可以放DivX,但是基本所有的操作系统都可以播放,包括Mac、Linux、BeOS,当然还有Windows。不过也有很多奇怪的毛病,在慢的机器上工作正常,而在快的机器上跳祯等等。不过如果他在你的机器上工作,那么它当然是你的不二之选。
Frame 帧 电影的基本组成单位。一帧代表一幅图象。电影通常1秒钟播放24帧,所以它1秒钟有24幅不同图象。设想有24幅鸟的图象,在第一幅里鸟在图的左侧,然后它逐渐向右移动。在第24帧鸟已经在图象的最右侧了。设想这24幅图象以足够快的速度按顺序播放,那么人眼看来就好象这鸟从屏幕的左侧飞到了右侧。
I and P Frames I帧和P帧当前
帧(Frame) 仅仅描述它与前一帧的区别(虽然描述的不甚准确但相信理解含义并非难事)。比如说我们有一幅一只小鸟飞过一片有云彩天空的图象,这是个
关键帧(keyframe)。然后我们可以使用I帧来这样描述:将小鸟向左和下方各移动一英寸。
iDCT & Wavelet iDCT和小波 MPEG文件中的视频信息是存储于频域而非空间域(即我们看到的图象)中的。信息通过这种方式得到
压缩从而减少了信道中传播的信息量。MPEG通过离散余弦变换DCT(Discrete Cosine Transform)把空间域的信息变换到频域的信息。从MPEG流中提取出空间域的信息时,我们需要使用反离散余弦变换(IDCT)来抵消编码时做的离散余弦变换。
DCT和IDCT其实就是一种离散傅立叶变换(DFT),只不过我们通过DFT得到的是复数,而DCT/IDCT变换的结果是整数。我们可以在DSP,通信系统等领域的大学课本中查到更详尽的相关信息。
小波是一种基空间。小波基可以有无穷种(比如Daubechies, Haar, Mexican Hat, "Spline", Zebra等等),但小波基的主要特性是它是局部化的。傅立叶函数跨越了整个空间(从负无穷到正无穷),而小波实际上是不同位置、不同尺度上的脉冲波。
压缩以后的数据分成了两部分。一般来说90%以上的数据通过低通滤波器,而高通滤波器会滤出数值非常小的细节数据(当然,如果信息源噪音很大的话这个自然不成立)。对于图像来说,使用这种方法的最大价值在于基的局部化,因此我们可以用小波来很好的模拟像边缘这些非连续的部分。使用小波以后就不会再出现那些奇怪的JPEG光环了。
IFO 文件信息文件 (InFOrmation file) 通常存在与DVD中。这些文件包含了为DVD播放器导航的信息。如果想了解更多信息请关注
DVD structure article。
Interlaced 隔行扫描Interlaced (隔行扫描)是一种视频存储模式一个交错的视频流不包含帧而是一些场,每个场包含了一帧里的一半数量的行(全部是odd或全部是even)。关于视频存储模式和隔行(interlacing)的更多信息可以参考
video basics.
Interleaving 交错 想象一下在一个特定点把音频和视频结合在一起,就是我们所说的交错。播放器会识别交错点,确保音频和视频在整部电影中按照粘合的点的规律来播放。
更详细地解释:假设我们有10秒钟的视频和10秒钟的音频片断。每一秒钟的视频用V表示 ,音频用A表示,那么如果你的交错设置为10秒,磁盘上的文件将是VVVVVVVVVVAAAAAAAAAA的形式。如果交错设置为1秒这里将是:VAVAVAVAVAVAVAVAVA。
Inverse Telecine Telecine 的反向工程。此过程将29.97fps的片源还原为本来的24fps。
Keyframe 关键帧 一个完整的帧
(frame),但是此帧被尽可能的
压缩了。
m1v/m2v这两个术语分别被作为
MPEG-1和MPEG-2视频数据的扩展(仅仅是视频,不包含任何音频)。
MPEGMPEG意思是动态影像专家组
(Motion Picture Expert Group),通常它是视频格式的来源。这个专家组解释数字视频的标准(或规范),包括MPEG1标准(VCD)、MPEG2标准(用于DVD以及SVCD)、MPEG4标准以及若干音频标准包括
mp3和AAC。使用MPEG-1或者MPEG-2标准的视频通常以.mpg或者.mpeg作为扩展名。
MPEG4 MPEG4是MPEG专家组
(MPEG Group) 所确定的一系列标准(或者规范),它将成为数字视频的下一标准(主要用于视频电话、因特网上的流媒体以及更多方面)。MPEG4允许运用多种编码方式,比如一个关键帧可以使用
ICT 或者 小波 以得到不同的输出质量。
MPGMPG可以看作
MPEG 的缩写,也可以作为MPEG-1以及MPEG-2视频数据的扩展名。
MM4Multiple MPEG 4: 不同比特率编码文件的组合.比如你能把2000kbit/s和910kbit/s编码的文件组合起来,采用比特率较低的文件,取代文件中由于和2000kbit/s的部分作用太多而导致严重失真的画面.这里也可以是两种DIVX编码的组合:你可以把低MOTION和高MOTION的文件合并起来(这里也可以使用不同的比特率)。
Multipass encoding 多通路编码在你阅读之前:目前真正的多通路编码只存在WM8和MPEG-2(SCVD和miniDVD)中。M4C并不是真正的多通路编码(阅读M4C指南去寻找它究竟是什么和如何工作的)。一个支持多通路的编码将在第一个通路中分析将要被编码的视频流并把它遇到的任何东西都记录下来。假设我们有一个以对话场景开始的小片断,这其中有很少的剪切而且摄像机保持静止。然后它变成一场空手道打斗,这其中有大量的快速剪切和动作(人们在天空中飞行、踢、拳打等等)。在正常的CBR编码中每秒会获得大约相同的比特率(很难说保持100%的CBR但那是枝节了)但是在多通路VBR模式中编码将根据视频流的信息来使用相应的比特率,这就是说对话部分获得足够的比特率而打斗部分获得更高的比特率。通路越多比特率的分配就越细致。在单通路VBR中编码必须只根据它前面所编码东西的知识来决定使用多少的比特率。
Multiplexing 复用 通常视频和音频是分别编码的。然后你必须将他们合起来这样才能变成可以播放的电影(你当然能在两个播放器中分别播放音频和视频,但是同步将会变得相当困难)。在复用中音频和视频轨道合成为一个音频/视频流。音频和视频流似乎交织在一起,并在其中加入导航信息,使播放器能在快进/速退的采样中保持AV同步。
Normalizing 标准化标准化包括找到一个音轨的容量峰值,然后增加音轨其余部分至同样等级。这通常在WAV等级完成,那就是说所有的变量都是整数因此不如DRC精确。所以在标准化中DRC更受喜爱。
OGMOGM表示OGg媒体,是Tobias Waldvogel为Ogg container所做的增补,OGM可以看作是另一种
AVI container,它可以含有Ogg Vorbis、
mp3、AC3音频、各种各样的视频格式、段落信息以及字幕。
PGCPGC表示ProGram Chain。它是一个在DVD编写中经常使用的术语,基本上是一个同时回放东西。举例说电影主要部分有它自己的PGC,DVD上的每一个预告片通常有自己的PGC。当你播放碟片时出现的工作室标志有自己的PGC等等。SmartRipper的电影模式和DVD Decrypter的IFO模式将向你展示一张DVD上所有的PFC。要想进一步获得关于PGC的信息参阅
MPUCoder's DVD information site 网站。
Progressive 逐行扫描与隔行扫描
(interlaced) 相对。一个只包括全帧
(frames) 的视频流被认为是逐行扫描的.逐行/隔行扫描的知识详见
video basics 。
Quantizer 量化因子要想真正理解这个术语你必须学习信号处理的课程。在一般人的术语中它表示
压缩因子。这个值越大一幅图象就压缩的越多(因此高量化因子意味着低图象质量和占空间小而低量化因子意味着高的图象质量和占用空间大)。
rff/tff 标记RFF表示repeat first frame(重复第一帧),这是一项用来把源头以每秒24帧记录的电影转化称为需要的每秒29.97帧的技术。采用rff标记编码的电影-标记告诉播放器重复一场。Tff表示首先是顶上的场而且被用来实现telecine从而将24fps的电影制作为29.97fps的。你可以在
Robshot关于同步的文章 中得到更多关于胶片转换为视频方面的信息。
Ripping 关于这方面有很多的混乱。基本上ripping表示把DVD电影拷贝到你的硬盘上。这包括DVD驱动器的认证
(authentication) 过程(试图从DVD上拷贝下一个文件时,你将会看到一条消息:如果你的驱动器还没有被认证那么该操作是不受支持的)和真正的CSS解码
(Descrambling) 过程。CSS(Contentated Scrambling System数据干扰系统)是一种设计用来防止未授权地拷贝DVD电影的防拷贝方案,虽然许多人争论说它也是设计用来控制哪里的DVD电影可以播放,因为没有CSS许可要想播放DVD电影你实质上必须将其加密crack掉-我非常同意这一点。ripping这个词也经常用于(甚至在本站点)描述解码DVD的整个过程,然后把音频和视频转化称为另一种-更少的-格式。
SBCSmart Bitrate Control智能比特率控制。一种新的称为Nandub的DivX编码器能在
压缩过程中动态修改很多内部参数,给你更好的质量和更多的编码控制。更多信息可以参见 DivX指南部分中的SBC指南。
Streamlist 流目录 流目录是一个包括路径名和你的VOB文件名的ASCII测试文件,一行一个文件。这里有一个小例子:
e:video_tsvts_01_1.vob
e:video_tsvts_01_2.vob
e:video_tsvts_01_3.vob
e:video_tsvts_01_4.vob
e:video_tsvts_01_5.vob
把该文件保存为streamlist.txt或者streamlist.lst。确保你存成为未格式化的ASCII文本,我建议你用记事本来编辑你的流目录,因为记事本不会存成为另一种格式。MPeg2avi要求流目录的扩展名是lst,然而在其他程序使用流目录的时候你可以自由选择任意的扩展名。但是GUI在选择输入文件名/扩展名是有所限制,所以如果流目录没有在文件选择对话框中出现的话,那么你必须重命名你的流目录。
Telecine 把24fps的片源转换成29.97fps或29.97x2交错场/秒。
这篇文章 具体解释了这是如何工作的。
VBR变码率。将音频和视频均以VBR模式编码是可能的,在整个文件中码率将不会固定不变(就像在CBR中固定不变一样),视频/音频中较复杂的部分将会使用更高的码率以获得更佳的视/听觉感受,而其它部分则获得较少的码率。
VKI可变关键帧间隔。其基本意思即在需要关键帧的地方不再象通常的DivX编码解码器那样按照固定的间隔插入。有两种实现VKI的方法:第一种方法是编码器解开压缩的帧,将其与原始的比较,如果品质差别高于一个设定的极限值就重新编码。这种编码方法只适用于一种特定程序:M4C。有一种基于命令行的版本和一种可供AviUtl使用的插件(后者在AviUtl向导中有详细介绍)。如果有把极限值设定的过高那么你最后将得到许多关键帧还有第二种方法,其主要是在场景变换的时候插入关键帧。为了达到这个目的编码程序或者编码解码器会侦测到哪个位置有一个所谓的“cut”(就象电影制作者所使用的)存在并且使新场景的第一帧成为关键帧。这可以通过使用mpeg2aviAr(AviRevolution的一部分),m4c或者通过安装DivX VKI编码解码器来实现。如果你使用后者就不用担心编码器。每个可以进行DivX编码的程序都可以使文件在场景变换处有关键帧。当VKI被合理地使用时(只适用于第一种方法),可以帮助你增减关键帧数量,从而再次得到更高品质,这是因为尤其在低比特率时,太多的关键帧将会带来更糟糕的品质。
VM2VKI + MM4 + VBR
mp3的缩写
VOB IDVOB ID用来将DVD中一个
PGC内的
Cell归为一组。
VOB Files 所有的DVD影片都存储在vob文件中。vob文件通常包含混在一起的杜比数码音频和MPEG2格式的视频。vob文件按以下形式命名:vts_XX_y.vob,这里的XX代表标题Y代表这一标题的某一部分。总共可以有99个标题和10个部分,虽然 vts_XX_0.vob 从来不包括任何视频,通常只是菜单或者导航信息。有两种方法来找出哪个文件包含着电影的主体:
方法一:用DVD播放器播放电影,然后观察单机的指示灯或者软件播放器的状态窗口;
方法二:电影的主体是数字连续的VOB文件中数字最大的那个。比如有vts_05_1.vob;
vts_05_2.vob……vts_05_8.vob(我从来没有看到过包含9部分文件的电影,但那并不意味着不存在)。
VTSVTS是视频标题集的简称,也就是说是一连串VOB文件和相应的IFO和BUP文件的合集。举例来说,VTS2将会包含VTS_02_0.VOB(包含菜单)、VTS_02_1.VOB、VTS_02_2. VOB等等,以及VTS_02_0.IFO和VTS_02_0.BUP等文件。VTS用来将视频材料以及其附属文件归为一组。举例来说,一个VTS通常来说用于主影片(而有时还会包括预告片和某些影片公司的logo),别的VTS用于花絮。
Windows Media Microsoft版权所有的个人
电脑音频和视频体系.它是基于一系列的编码,这些编码被
WindowsMedia Player用来播放任何其所支持的格式文件.这里介绍WindowsMedia Player的版本是7.0版.WindowsMedia 7.0提供了一系列的新的编码,其中包括一个完全兼容ISO的MPEG4编码(名为Windows Video V1),一个名为MS Video V7的改进了的MPEG-4编码(尽管我并没有发现它和DivX基于的MS Windows Video V3相比有任何的改进),这种编码支持Deinterlacing和Inverse Telecine.
XCDeXtended CD是一种即将到来的(能否译作下一代?感觉不太合适)CD格式,这种格式允许用mode2的第二种形式来刻录你的CD,这基本上就意味着它含有较少的校验码,从而你可以在单张CD上存储更多的数据。XCD允许你在一张普通的700MB CD里存储800MB的数据。正如我所说得那样,由于只有较少的校验码,XCD不是非常可靠所以建议你只把container中具有附加校验的数据(比如说OGM)放到这种CD中。如需了解更多请查阅
XCD指南。
XviDXviD是个文字游戏。把它倒过来读,你就会看到一个熟悉的词。XviD是一种开放源码的MPEG-4编码解码器,通过它你能得到比最好的DivX编码解码器更佳的效果。XviD的主页可以查阅
这里
MPEG2-TS随着从HDTV录制的高清节目在网上的流传,烧友们现在对TS这个名词大概已经不陌生了,但随之而来就是如何播放、如何添加字幕等等的一系列问题。先来简要介绍一下什么是MPEG2-TS吧。MPEG2格式大家都通过对DVD的接触而多多少少了解了一些,DVD节目中的MPEG2格式,确切地说是MPEG2-PS,全称是Program Stream,而TS的全称则是Transport Stream。MPEG2-PS主要应用于存储的具有固定时长的节目,如DVD电影,而MPEG-TS则主要应用于实时传送的节目,比如实时广播的电视节目。这两种格式的主要区别是什么呢?简单地打个比喻说,你将DVD上的VOB文件的前面一截cut掉(或者干脆就是数据损坏),那么就会导致整个文件无法解码了,而电视节目是你任何时候打开电视机都能解码(收看)的,所以,MPEG2-TS格式的特点就是要求从视频流的任一片段开始都是可以独立解码的。
MPEG2-TS流文件的简单回放
有一些播放器软件可以直接播放MPEG2-TS流,播放前,先将TS流文件的后缀名改为.mpg,以便播放器可以识别它是一个MPEG文件,否则一些"以貌取人"的播放器可能会拒绝提供服务。修改了后缀名后,直接用播放器打开文件播放即可。
但是需要通过VOBSub
外挂字幕的朋友,可能很快就会发现,在WinDVD里无法对MPEG文件加载字幕,这是因为WinDVD在对MPEG文件解码的时候,用了内部的解码流程,而没有按照微软的DirectShow标准去搭建解码框架,这样自然就无法触发VOBSub这些基于DirectShow标准的外挂控件了。这些问题将在“MPEG2-TS流文件的高级回放篇”里进一步解决。
优点缺点并重
喜欢看高清视频的朋友一定知道,目前网上
下载的高清片采用的最多的就是TS流,也就是基于MPEG2编码格式的,虽然他的应用面非常广,使用简单占用系统资源相对也较少,并且大多数数字高清普及国家也都采用此种编码的视频流,其中也包括我国即将开播的央视高清,不过他的缺点也不少,譬如体积巨大,占用相当多的硬盘空间
压缩比最高的H.264JVT(Joint Video Team,视频联合工作组)于2001年12月在泰国Pattaya成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高
压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。H264标准使运动图像压缩技术上升到了一个更高的阶段,在较低带宽上提供高质量的图像传输是H.264的应用亮点。H.264的推广应用对视频终端、网守、网关、MCU等系统的要求较高,将有力地推动视频会议软、硬件设备在各个方面的不断完善……
相对于之前介绍的MPEG-2,H.264的优点在于由于采用更复杂的运算并提高运算效率,也提高了压缩比,因此体积占用远远小于MPEG-2更优势的是在体积减小的同时在画质上不但没有损失,某些细节反而更好。作为将来高清视频流的有力竞争者目前获得不少媒体的青睐:日本六大电视台都将采用这一标准,国内最近商权的IPTV也在考虑这一格式。苹果的高清.mov文件都采用这一编码方式。
H.264的数据压缩率在MPEG2的2倍以上、MPEG4的1.5倍以上。从理论上来说,在相同画质、相同容量的情况下,可比目前的DVD光盘多保存2倍以上时间的影像。有望作为电影与音乐会等映像内容与便携设备的编解码器广泛使用。预计支持该技术的产品与服务将于2004年内问世。
当然目前的H.264也有它的缺点:虽然提高压缩比减小了文件体积,但是却对硬件解码能力提出了更高的要求。目前支持H.264解码的硬件
显卡只有ATI的R520,价格也
高达5XXX,非普通用户消受得起。除此之外对
cpu的要求同样苛刻:最低3.0G的运行效率是十分必要的,因此如果你喜欢H.264那么赶快升级你的硬件吧,相信会有不小的改善。
而WMV9是微软开发的动态图像压缩技术,是WMV系列的最新版本。虽然WMV是微软的独有规格,但因该公司的Windows标准支持WMV,从而得到了迅速普及。WMV9的数据压缩率与H.264一样,也被考虑用于映像内容与移动设备等各种用途。该公司1月发表的“Windows Media HD”就是把WMV9扩展为可供HDTV使用的规格。