Section
1.3 数字视/音频格式

导读

非线性编辑的出现,使得视频影像的处理方式进入了数字化时代。与之相应的是,影像的数字化记录方法也更加多样化。本节详细介绍数字音/视频格式方面的知识。

1.3.1 常见视频格式

微课堂 00分16秒

视频格式是视频播放软件为了能够播放视频文件而赋予视频文件的一种识别符号。

视频格式可以分为适合本地播放的本地影像视频和适合在网络中播放的网络流媒体影像视频两大类。尽管后者在播放的稳定性和画面质量上可能没有前者优秀,但网络流媒体影像视频的广泛传播性使之正被广泛应用于视频点播、网络演示、远程教育、网络视频广告等互联网信息服务领域。下面详细介绍几种常用的视频格式。

1. MPEG

MPEG(运动图像专家组)是Motion Picture Experts Group的缩写。这类格式包括MPEG-1、MPEG-2和MPEG-4在内的多种视频格式。MPEG-1正在被广泛地应用在VCD的制作和一些视频片段下载的网络应用上面。大部分的VCD都是用MPEG-1格式压缩的。使用MPEG-1的压缩算法,可以把一部120分钟长的电影压缩到1.2 GB左右的大小。MPEG-2则是应用在DVD的制作中,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用MPEG-2的压缩算法压缩一部120分钟长的电影可以压缩到5~8GB的大小(MPEG-2的图像质量是MPEG-1无法比拟的)。MPEG系列标准已成为国际上影响最大的多媒体技术标准,其中MPEG-1和MPEG-2是采用相同原理为基础的预测编码、变换编码、熵编码及运动补偿等第一代数据压缩编码技术;MPEG-4(ISO/IEC 14496)则是基于第二代压缩编码技术制定的国际标准,它以视听媒体对象为基本单元,采用基于内容的压缩编码,以实现数字视/音频、图形合成应用及交互式多媒体的集成。MPEG系列标准对VCD、DVD等视听消费电子及数字电视和高清晰度电视、多媒体通信等信息产业的发展产生了巨大而深远的影响。

2. AVI

AVI是由微软公司所研发的视频格式,其优点是允许影像的视频部分和音频部分交错在一起同步播放,调用方便,图像质量好,缺点是文件体积过于庞大。

3. ASF

ASF(Advanced Streaming Format)的中文翻译为高级流格式。ASF是微软为了和Real Player竞争而开发出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了MPEG-4的压缩算法,压缩率和图像的质量都很不错。因为ASF是以一个可以在网上即时观赏的视频流格式存在的,所以它的图像质量比VCD差一点,但比同是视频流格式的RAM格式要好。

4. WMV

WMV是一种独立于编码方式、在Internet上实时传播多媒体的技术标准,微软公司希望用其取代QuickTime之类的技术标准以及WAV、AVI之类的文件扩展名。WMV的主要优点在于可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。

5. RMVB/RM

RMVB的前身为RM格式,它们是Real Networks公司所制定的音/视频压缩规范,根据不同的网络传输速率,而制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放,具有体积小、画质也还不错的优点。

6. MKV

后缀为MKV的视频文件可在一个文件中集成多条不同类型的音轨和字幕轨,而且其视频编码的自由度也非常大,可以是常见的DivX、3IVX,甚至可以是RealVideo、QuickTime、WMV这类流式视频。实际上,它是一种全称为Matroska的新型多媒体封装格式,这种先进的、开放的封装格式已经给我们展示出非常好的应用前景。

1.3.2 常见音频格式

微课堂 00分09秒

音频格式是指要在计算机内播放或处理的音频文件,是对声音文件进行数、模转换的过程。下面详细介绍几种常见的音频格式。

1. MP3

MP3格式诞生于20世纪80年代的德国,所谓MP3指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层。需要注意的是MPEG音频文件的压缩是一种有损压缩,MPEG-3音频编码具有10∶1~12∶1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12kHz~16kHz高音频这部分的质量来换取文件的尺寸。相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,因而音质要次于CD格式或WAV格式的声音文件。由于其文件尺寸小,音质好,所以在问世之初还没有什么别的音频格式可以与之匹敌,因而为*.mp3格式的发展提供了良好的条件。直到现在,这种格式还很流行,作为主流音频格式的地位难以被撼动。

2. WAV

WAVE(*.WAV)是微软公司开发的一种声音文件格式,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所支持。*.WAV格式支持多种压缩算法,支持多种音频位数、采样频率和声道。标准格式的WAV文件和CD格式一样,也是44.1kHz的采样频率,是目前PC上广为流行的声音文件格式,几乎所有的音频编辑软件都识别WAV格式。

3. WMA

WMA(Windows Media Audio)格式也是来自微软,音质要强于MP3格式,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的。WMA的压缩率一般都可以达到1∶18左右。WMA的另一个优点是内容提供商可以通过DRM(Digital Rights Management)方案加入防拷贝保护。这种内置的版权保护技术可以限制播放时间和播放次数,甚至于播放的机器等,这对被盗版搅得焦头烂额的音乐公司来说可是一个福音。另外,WMA还支持音频流(Stream)技术,适合在网络上在线播放,更方便的是不用像MP3那样需要安装额外的播放器,而Windows操作系统和Windows Media Player的无缝捆绑让只要安装了Windows操作系统的用户就可以直接播放WMA音乐。

4. MIDI

MIDI(Musical Instrument Digital Interface)格式被经常玩音乐的人使用。MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后告诉声卡如何再现音乐的一组指令。这样一个MID文件每存1分钟的音乐只用5~10KB。MID文件主要用于原始乐器作品、流行歌曲的业余表演、游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。*.mid格式的最大用处是在电脑作曲领域。*.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入计算机里,制成*.mid文件。

1.3.3 高清视频

微课堂 00分30秒

现今视频主要有一般、标准、高清、超清几种。高清视频就是现在的HDTV。

要解释HDTV,首先要了解DTV。DTV是一种数字电视技术,是当下传统模拟电视技术的接班人。所谓的数字电视,是指从演播室到发射、传输、接收过程中的所有环节都使用数字电视信号,或该系统所有的信号传播都是通过由二进制数字所构成的数字流来完成的。数字信号的传播速率为每秒19.39兆字节,如此大的数据流传输速度保证了数字电视的高清晰度,克服了模拟电视的先天不足。同时,由于数字电视可以允许几种制式信号同时存在,因此每个数字频道下又可分为若干个子频道,能够满足以后频道不断增多的需求。HDTV是DTV标准中最高的一种,即High Definition TV,故而称为HDTV。

HDTV规定了视频必须至少具备720线非交错式逐行(720p, p代表逐行)或1080线交错式隔行(1080i, i代表隔行)扫描,屏幕纵横比为16∶9。音频输出为5.1声道(杜比数字格式),同时能兼容接收其他较低格式的信号并进行数字化处理重放。

HDTV有3种分辨率,分别是720p(1280×720,非交错式,欧美国家有的电视台就是用这种分辨率),1080i(1920×1080,隔行扫描),1080p(1920×1080,逐行扫描),其中网络上使用的以720p和1080p最为常见。480p属于标清,480p的效果就是市面上的DVD效果。

480p是一种视频显示格式。字母p表示逐行扫描(progressive scan),数字480表示其垂直分辨率,也就是垂直方向有480条水平线的扫描线;而每条水平线分辨率有640像素,纵横比(aspect ratio)为4∶3,即通常所说的标准电视格式(standard-definition television, SDTV)。帧频通常为30Hz或者60Hz。一般描述该格式时,最后的数字通常表示帧频。480p通常应用在使用NTSC制式的国家和地区,如北美、日本等。480p60格式被认为是准高清晰电视格式(enhanced-definition television, EDTV)。

知识拓展:行频的概念

行频也被称为水平扫描率,是指电子枪每秒在荧光屏上扫描水平线的数量,以kHz为单位,属于显示设备的固定工作参数。显示设备的行频越大,其工作越稳定。