1.5 数字视频的基础知识

数字视频是和模拟视频相对的,指以数字形式记录的视频。其制作方式是采用视频捕捉设备(如数字摄像机等)将外界影像的颜色和亮度信息转变为电信号,再将电信号记录到存储介质(如磁盘等)中。

1.5.1 数字视频的优势

数字视频的优势有以下3点。

第1点:对数字视频可以不失真地进行没有次数限制的复制,且查询与存储方便。

第2点:数字视频可以在计算机网络(局域网或广域网)上传输图像数据,且没有距离限制,也不易受到外界因素的干扰。

第3点:数字视频具有更好的信息交互性,不需要布设数量庞大的线路,从而减少了工作量。

1.5.2 数字视频的常用格式

数字视频有以下几种常用格式。

AVI

这是一种将音频和视频同步组合在一起的文件格式。这种格式的特点在于其对视频文件进行了有损压缩,且压缩比较高,因此尽管画面质量不算最好,但其应用范围非常广泛。AVI支持256色和RLE压缩,多用来保存电视、电影等各种影像信息。

MPEG

这是一种运动图像压缩算法的国际标准,现已被几乎所有的计算机平台支持。它包括MPEG-1、MPEG-2和MPEG-4。其中MPEG-1被广泛应用在VCD(Video Compact Disc)的制作上;MPEG-2被应用在DVD(Digital Versatile Disc)的制作、HDTV(高清晰度电视)和一些高要求的视频编辑处理方面;MPEG-4是一种全新的压缩算法,使用这种算法的ASF格式可以把一部约120分钟的电影压缩为文件大小仅300 MB左右的视频流,方便用户在网络上观看。

MOV

MOV即QuickTime影片格式,它是由苹果公司开发的一种音频、视频文件格式,常用于存储数字媒体类型的文件。其特点在于兼容性好、所需存储空间小。与AVI格式相比,MOV格式文件也采用了有损压缩的方式,但画面效果较AVI格式要稍微好一些。

WMV

这是微软公司开发的一种视频编解码格式,其特点在于可同时下载与播放,因此适合网络实时视频的播放。

FLV/F4V

FLV即Flash Video的简称,其特点在于文件小、加载速度快,因此许多网站视频采用这种格式;F4V可以理解为FLV的升级版,支持H.264编码的高清视频。

RMVB

即Real Media可变比特率,相较于常见的按固定比特率(CBR)编码的流媒体,RMVB较常应用于本地多媒体文件保存上。

MKV

MKV不是一种压缩格式,而是一种多媒体容器文件。它能够容纳多种不同编码类型的视频、音频及字幕流,如AVI、WAV、MPEG、RMVB、MOV等。

1.5.3 逐行扫描与隔行扫描

逐行扫描(也叫作非交错扫描)是一种对位图图像进行编码的方式,如图1-8所示,即每一帧图像由电子束按顺序一行一行地连续扫描,扫描显示第1行、第2行、第3行……直至最后一行。逐行扫描的画面清晰度高且无闪烁,动态失真较小,但带宽等技术要求相较于隔行扫描更高。

56797-00-028-1

图1-8

隔行扫描(也叫作交错扫描)也是一种对位图图像进行编码的方式,即每一帧图像被分割为奇偶两场,交替进行扫描,首先扫描显示属于奇场的第1行、第3行、第5行……直至奇数行的最后一行,然后扫描显示属于偶场的第2行、第4行、第6行···直至偶数行的最后一行。隔行扫描的带宽等技术要求相比逐行扫描较低,但画面容易产生行间闪烁、并行现象及垂直边缘锯齿化现象等。

1.5.4 场

视频扫描分为逐行扫描和隔行扫描两种,在隔行扫描播放的设备中,每一帧画面都将被拆分显示,拆分后得到的不完整画面称为“场”,如图1-9所示。在采用NTSC制式的电视中,显示设备每秒需要播放60场画面(NTSC制式的帧速率为30fps,即每秒30帧。因为每帧画面被隔行扫描分割为两场,所以总计为60场,PAL制式同理);对于PAL制式的电视来说,则需要每秒播放50场的画面。而无场是针对逐行扫描而言的。

56797-00-028-2

图1-9

1.5.5 时间码

时间码是数字摄像机在记录图像信号时,为每一幅图像标记的唯一时间编码。这是一种应用于流的数字信号,这种信号为视频中的每一帧都分配一个数字,用以表示时、分、秒和帧,如图1-10所示。

56797-00-028-3

图1-10

知识课堂:时间码的运算

时间码的前面3个数分别表示时、分、秒,为六十进制;而最后一个表示帧的数字的进制则不是固定的,它是由帧速率决定的,例如对于帧速率为25fps的视频,帧数字为二十五进制,也就是满25帧,则需要进1秒,如图1-11所示;如果是帧速率为30fps的视频,帧数字则为三十进制,也就是满30帧进1秒,如图1-12所示。

56797-00-029-1

图1-11

56797-00-029-2

图1-12

1.5.6 有损压缩与无损压缩

有损压缩也叫作破坏性压缩,是利用人类对图像或声波中的某些频率不敏感的特性,允许数据在压缩过程中损失一定量的信息。有损压缩后虽然最终不能够完全恢复原始数据,但是所损失的部分对解读原始数据的影响不大,其目的是利用较大的压缩比来节省数据空间。

无损压缩是利用数据的统计冗余进行的压缩,无损压缩后可以完全恢复原始数据而不引起任何失真,但其压缩率受到数据统计冗余度的理论限制,一般为2:1到5:1。无损压缩常用于文本数据、程序和特殊应用场合的图像数据(如指纹图像、医学图像等)的压缩。

1.5.7 帧内压缩与帧间压缩

帧内压缩也叫作空间压缩,即压缩一帧图像时,仅考虑该帧的数据而不考虑相邻帧之间的冗余信息,这种压缩方式实际上与静态图像的压缩类似。帧内压缩一般采用有损压缩的算法,但还达不到很高的压缩比。

帧间压缩也叫作时间压缩,是基于许多连续画面的前后两帧具有相关性(即连续画面的相邻帧之间具有冗余信息)的特点实现的,一般采用无损压缩的方式进行。