视频会议基础知识

来源：暴趣科技网

视频基础知识---高清晰度视频会议

高清晰度视频会议

在高清晰度编码/ 解码技术产生之前，视频会议数据是根据公用交换格式(CIF) 进行编码的。国际电信联盟-电信标准部门(ITU-T) 制定了视频标准，称为H.261 和H.263。H.261 标准只定义了QCIF 和CIF 格式。四分之一CIF (QCIF) 格式只被用于最低数据率（千位/ 秒及更低）的会议，今天已经很少使用。自从H.263 标准发行以来，更多使用“全分辨率”（定以为16CIF）的格式（4CIF 和16CIF）被采用。由于采用此类标准时，计算和宽带功能有限，所以，用于全动感视频会议的公用分辨率仍然是CIF 到4CIF。下面的表格列出了用于NTSC（北美）和PAL（欧洲）视频信号的H.261 和H.263 标准的相应格式分辨率。以下列出的分辨率代表4:3 的屏幕高度比。

格式 QCIF CIF 4CIF 16CIF 帧/秒 30 30 30 30 分辨率NTSC 176 X 120 352 X 240 704 X 480 1408 X 960 分辨率PAL 176 X 144 352 X 288 704 X 576 1408 X 1152

ITU-T 最近采用了视频压缩新标准，该方法减小了整个视频文件的大小，从而文件可以更为节省地通过容量更小的网络连接（更低的数据率/ 宽带）进行传输。现在，ITU-T 建议高清晰度视频会议采用H.2 视频标准，该标准通过比较低的数据传输率提供上好的画面质量。现在，H.2 是HD-DVD（高清晰度DVD）以及广播、电缆、视频会议和消费者电子产品的强制使用的标准。下面的表格说明了H.2 标准中引入的SD和HD 分辨率。

格式 1080p 720p 480p 帧/秒 25,30 25,30 25,30 分辨率(16:9) 1920 X 1080 1280 X 720 860 X 480 SD/HD HD HD SD

H.2 规格是视频会议理想的工具。尽管和之前的H.26x 算法相比，它需要更强的处理能力，但是自2004年之后生产的大多数视频会议系统都包括H.2。它可提供优质的视频传输和低延时的编码和解码，从而视频流更为流畅、自然。事实上，H.2 的效率是H.263 的两倍，在特定线路速率下的视频质量也要高出一倍。此外，某些增强的H.2 规格包括互动视频的错误隐藏算法，此技术可自动调整视频操作，即便网络负担过重、不稳定或者出错率高，都可以保证操作自如，并提供更高品质的视觉享受。H.2 编码标准提供了更强的灵活性，为不同的开发商提供了进行互操作的通用平台。H.263 标准支持大量可能的变异产品，与此不同，H.2 标准只包括少量的压缩技术。这样一来，可以在不大幅度下、降视频质量的前提下更为轻易地实现来自多个生产商的不同视频会议设备的集成。

基于编解码算法的改进、网络传输带宽的提高、高清数字电视的发展，视频会议终于从4CIF一步迈入了高清殿堂，720p、1080p顺理成章的融入了视频会议系统。

视频基础知识---数字电视分辨率

数字电视分辨率

电视技术，经历着从黑白电视到彩色电视，再到高清电视的发展过程。我国决定从1999年10月1日起开始试播高清晰度电视(HDTV)。电视的使用范围早已超越了广播娱乐界，并深深地扩展到文化教育、科研管理、工矿企业、医疗卫生、交通、军事宇航等各个重要部门。近十多年来，由于微电子技术、超大规模集成电路技术、数字信号处理技术、计算机技术的突飞猛进，使数字电视的发展已取得了令人鼓舞的成果。特别是数字图像获取、数字存储、位图打印和图形显示的数字设备的出现，带来了许多数字图像方面的应用。技术先进国家的电视演播室设备数字化已完成，数字电视接收机已上市出售，各种数字图像编码压缩设备随多媒体技术的发展已投人使用。国际上也相应地制定了统一的数字电视信号的编码标准，为数字电视的发展奠定了坚实的基础。

美国先进电视系统委员会（Advanced Television Systems Committee ，简称ATSC）定义了18种数字电视采用的画面格式，这些画面格式被分成了三种类型：SDTV（Standard Definition TV，480i标准清晰度电视，和现有电视系统的画面质量相当），EDTV（Enhanced Definition TV，480p增强清晰度电视，和DVD电影画面质量相当）以及HDTV。如今这种分级方式已经得到了业界的广泛接受。而其中的HDTV包含了两种画面分辨率，1920×1080和1280×720，当前各国各种标准的高清信号也无外乎这两种画面分辨率格式而已。

表2 数字电视的分辨率

格式 576i 分辨率 720×576 扫描线水平576线隔行扫描 D1(480i) 720×480 水平480线隔行扫描 D2(480P) 720×480 水平480线逐行扫描 D3(1080i) 1920×1080 水平1080线隔行扫描 D4(720p) 1280×720 水平720线逐行扫描 D5(1080p) 1920×1080 水平1080线逐行扫描 16:9 目前民用高清视频的最高标准 16:9 虽然分辨率较D3要低，但是因为逐行扫描，视觉效果更加清晰 16:9 标准数字电视显示模式 4:3 较D1隔行扫描要清晰不少，和逐行扫描DVD规格相同 4:3 和NTSC模拟电视清晰度相同画面比例 4:3 清晰度和PAL模拟电视清晰度相同视频基础知识---CIF格式

CIF格式

为了既可用625 行的电视图像又可用525 行的电视图像，CCITT 规定了称为公用中间分辨率格式CIF(Common Intermediate Format)，1/4 公用中分辨率格式(Quarter-CIF，QCIF)和(Sub-Quarter Common Intermediate Format，SQCIF)格式对电视图像进行采样。 CIF 格式具有如下特性：

(1) 电视图像的空间分辨率为家用录像系统(Video Home System，VHS)的分辨率，即352×288。 (2) 使用非隔行扫描(non-interlaced scan)。

(3) 使用NTSC 帧速率，电视图像的最大帧速率为30000/1001≈29.97 幅/秒。 (4) 使用1/2 的PAL 水平分辨率，即288 线。

(5) 对亮度和两个色差信号(Y、Cb 和Cr)分量分别进行编码，它们的取值范围同ITU-R BT.601。即黑色=16，白色=235，色差的最大值等于240，最小值等于16。

下面是目前在非高清视频会议中定义的分辨率： QCIF: 176×144 CIF: 352×288 4CIF: 704×576

视频基础知识---分辨率

分辨率

在视频会议中和电视系统中提到的图像分辨率、显示设备的分辨率，经常不知道怎么才能说清楚、搞明白；再加上视频会议中的经常提到的CIF格式，电视系统中提到的清晰度、电视扫描线，计算机显示设备提到VGA、XGA等分辨率，直到现在风靡各种媒体报端的720p、1080i和1080p的高清电视，这些五花八门的分辨率都是怎么形成的？本文就做一个全方位的阐述。

1 图像分辨率

数码图像有两大类，一类是矢量图，也叫向量图；另一类是点阵图，也叫位图。矢量图比较简单，它是由大量数学方程式创建的，其图形是由线条和填充颜色的块面构成的，而不是由像素组成的，对这种图形进行放大和缩小，不会引起图形失真。

点阵图很复杂，是通过摄像机、数码相机和扫描仪等设备，利用扫描的方法获得，由像素组成的，典型的是以每英寸的像素数（PPI）来衡量。点阵图具有精细的图像结构、丰富的灰度层次和广阔的颜色阶调。当然，矢量图经过图像软件的处理，也可以转换成点阵图。家庭影院所使用的图像，动画片的原图属于矢量图一类，但经过制作中的转化，已经与其他电影片一样，也属于点阵图一类了。因此，我们在这里主要讨论由像素构成的点阵图。

(1) 像素的含义

虽然人们经常听到―像素‖一词，也依稀知道一些含义，但不少人对其确切意义和特点并不清楚。像素就是组成数字图像的最小单元，即一个一个彩色的颜色点。像素一词是个外来词，在英文中，像素这个单词Pixels就是由―Picture（图像）‖和―Element（元素）‖两个单词的词头―Pi-el-‖拼合而成的。是构成图像的元素的意思。从中文来说，像素这个术语是―图像元素‖一词的简称。

一般人都以为像素是一个个的小圆点，但实际上它不是圆的，而是方的。也就是说，数码图像是由大量微小的彩色小方块按照一定的方式排列起来的。这种关于像素是方的而不是圆的看法，是一些图像处理软件专家和有关书籍的作者特意明确过，而不是凭空猜测。如果您在计算机上把一幅图像放得很大，在图形的边缘和有斜线的地方，就可以看见像素了，那是阶梯状或马赛克状的小方块，而不是小圆点。 (2) 像素的特性

构成点阵图图像的像素具有如下特性：

①像素关系的性：组成图像的像素具有性，即各个像素之间不是互相关联的，改变其中一个像素，不会影响其它像素。利用这个特性，可以对图像像素进行去像素处理或插补新像素的处理，而不会改变原图像的形貌，但对得到的新图像质量有一下影响。

②像素数量大小的固定性：一幅图像的像素多少是固定的，构成图像的像素数量并不因为显示图像时的放大或缩小而改变其数量。一般将像素数量的固定性称作―像素的固定大小‖，这种称呼与单个像素尺寸的大小混为一谈，所以在这里我们特意将这个特性强调成―像素数量大小的固定性‖。实际上，作为一个一个的像素块来说，其大小是可以改变的，整幅图像的大小也可以随之改变。

③排列位置的固定性：像素点的排列位置是固定的，单独的像素点不能随意移动，如果移动像素，将对整幅图像造成完全的破坏。最典型的例子是利用图像处理软件对画面进行波纹化处理，像素的相对位置改变了，原始图像状态也破坏了。

④像素的位深决定图像的层次：像素位深是指RGB三原色的比特数（Bit）。彩色图像中，在R、G、B三个颜色通道中，如果每一种颜色通道占用了8位，即有256种颜色，三个通道就包含了256的3次方的颜色，即1677万种颜色。对于单独的一种颜色，需要8个字节来记录，对于3种颜色来说，就需要24个字节来记录（8×3=24）。因此，一般的彩色图像需要24位颜色来表现，成为―真彩色‖。根据需要，也可以使用更低的色位，如256色（三色共占8位）或16位色，或者使用更高的色位，如32位、位等。

图像分辨率的表达方式也为―水平像素数×垂直像素数‖，也可以用规格代号来表示。

不过需要注意的是，在不同的书籍中，甚至在同一本书中的不同地方，对图像分辨率的叫法不同。除图像分辨率这种叫法外，也可以叫做图像大小、图像尺寸、像素尺寸和记录分辨率。在这里，―大小‖和―尺寸‖一词的含义具有双重性，它们都可以既指像素的多少（数量大小），又可以指画面的尺寸（边长或面积的大小），因此很容易引起误解。由于在同一显示分辨率的情况下，分辨率越高的图像像素点越多，图像的尺寸和面积也越大，所以往往有人会用图像大小和图像尺寸来表示图像的分辨率。

根据像素的特点可以得出下面结论：图象分辨率和图象尺寸的值一起决定文件的大小及输出质量，该值越大图形文件也越大。

2 物理分辨率

在视频会议中，会场的图像最终要在电视机或者通过投影仪显示，那么怎么衡量电视的分辨率？在双流发送的视频会议中，主流发送动态图像，辅流可以传送PC桌面，那么PC显示器的分辨率又怎么衡量？

电视机的分辨率和显示器的分辨率都是物理分辨率，但是叫法不一，这里澄清一下。 2.1 显示器的分辨率

1、显示器分辨率

指计算机显示器的物理分辨率，即在显示器屏幕上的荧光粉点数或像素数。过去人们只注意显示器的荧光粉点距，没有注意显示器的荧光粉点数，因此在这里听起来有点不习惯。但自从有了液晶显示器后，人们就开始熟悉显示器的固有像素点数和显示器本身的分辨率了。因此，显示器分辨率就是在生产制造时加工出来的显像小单元的数量，这种显像小单元对CRT显示器来说是指屏幕上的荧光粉点，对液晶显示器和等离子显示器来说是指显示屏上的像素。

显示器分辨率的高低，既可以用规格代号表示，如VGA和XGA等，也可以用―水平像素数×垂直像素数‖的数字表示，如800×600和1024×768。

但是在实用中，人们往往将显示器分辨率、显示分辨率和屏幕分辨率混为一谈。因为这3个术语的中文含义十分接近，所以产生这种混乱，但实际上这3者却是有的相同、有的不同，因此我们应当好好注意一下它们的区别。

2、显示分辨率

指进行计算机桌面属性―屏幕分辨率‖设置时选用的分辨率，也叫显示属性，它是用来实际显示图像时计算机所采用的分辨率，而与显示器分辨率无关。显示分辨率既可以小于显示器分辨率，也可以等于或大于显示器分辨率。这种分辨率有很多格式提供给操作者选择，如从0×480的低规格，直到1600×1200甚至更高的规格。显示分辨率，与显示器分辨率却不是一回事，显示器分辨率是描述的显示器自身的像素点数量，每台显示器只有一种固有分辨率，它是不可改变的。显示分辨率的表达方式与显示器分辨率的表达方式相同，也是用分辨率规格代号或―水平像素数×垂直像素数‖的数字来表示。 2.2 电视的分辨率

在电视工业中，分辨率是用清晰度来度量，单位是电视线（TVLine）。 1、人眼的分辨力和电视的清晰度

人眼的分辨力是指人眼对所观察的实物细节或图像细节的辨别能力，具体量化起来就是能分辨出平面上的两个点的能力。人眼的分辨力是有限的，在一定距离、一定对比度和一定亮度的条件下，人眼只能区分出小到一定程度的点，如果点更小，就无法看清了。根据人眼的分辨力，决定了影视工作者力求达到的影像清晰度的指标，也决定了采用图像像素的合理值。

人眼分辨图像细节的能力也称为―视觉锐度‖，视觉锐度的大小可以用能观察清楚的两个点的视角来表示，这个最小分辨视角称为―视敏角‖。视敏角越大，能鉴别的图像细节越粗糙；视敏角越小，能鉴别的图像细节越细致。在中等亮度和中等对比度的条件下，观察静止图像时，对正常视力的人来说，其视敏角在1～1.5分之间，观察运动图像时，视敏角更大一些。

为了将研究的对象从两个点扩大到一个面，所以将视敏角从人眼到两个点之间的夹角，引伸到从观察点（人眼）到一定距离的一条相邻黑、白线条之间的夹角。如果观察的是在垂直方向上排列的一系列连续水平黑白线条，则能表现出图像的垂直清晰度；如果观察的是在水平方向排列的一系列连续垂直黑白线条，则能表现出图像的水平清晰度。

电视正是利用了这个原理，确定出了电视应当设计成具有多高的垂直清晰度和多高的水平清晰度，再从清晰度推算出需要多少条水平扫描线和多少条垂直扫描线，从扫描线又推导出需要多少水平像素和多少垂直像素，也即建立起了相应的图像的分辨率和单幅电视图像的扫描格式，将它再与每秒钟图像的显示次数和其它指标结合起来，最终建立起了相应的电视制式。

2、垂直清晰度

上面已经提到过，根据视敏角原理，人眼能辨别在垂直方向上排列的相邻黑白水平线条的细致程度叫垂直清晰度，但是怎么来鉴别和量度这个细致程度呢？假设画面高度为H，在垂直方向上有M条黑白相间、具有一定宽度的水平线条，每条水平线条在垂直方向上的宽度为h。如果人眼在距离为L处刚好可以分辨清楚这些水平线条，则视敏角θ可表示为： θ＝h/L（弧度）因为每条线对的宽度为 h＝H/M 则有

θ＝H/（LM）（弧度）将弧度化为角度后，则为 θ＝3438H/（LM）（分）也就是

M＝3438（H/L）（1/θ）

试验表明，观看图像的最佳距离应当是画面高度的4倍至5倍，这时的总视角约为15度，在这种情况下，可以保证人眼不转动就能看到完整的画面。这个距离，既可以避免因过近观看时眼球需要不停地转动而引起眼疲劳，又可以避免过远观看时对图像辨别能力的降低，以及防止画面以外的景象进入视野中。如果选择观看距离L为画面高度H的5倍，即L＝5H，将其与视敏度θ＝1.5分一起代入上式后，则为 M＝3438（1/5）（1/1.5）＝458（线）

这个458线也就是我们所说的45电视线，简称―线‖。从上面的计算可以看到，在5倍画面高度的距离观看图像时，人眼的垂直分辨力是约458线，这时图像所具有的垂直清晰度正是458线。这样，在制定电视制式的扫描格式时，其垂直像素应当基于458线清晰度来考虑。

3、水平清晰度

水平清晰度的确定，与确定垂直清晰度的思路是一样的。不过，由于电视机画面的宽高比，以及垂直清晰度和水平清晰度对整体图像质量影响的关系，不经过上述复杂的推导，也可以很方便地算出水平清晰度线数来。

传统电视屏幕的宽高比是4:3，这是根据原来的电影银幕的长宽比预先确定下来的。试验说明，在图像显示时，水平清晰度和垂直清晰度应当接近或一样，才能获得最佳的图像质量。利用这两点，再根据垂直清晰度计算原理，将垂直清晰度线数乘以屏幕幅型比4/3，立即可以算出图像的水平清晰度线数N为： N＝4/3 M ＝4/3×458 ＝610（线）

这就是说，在5倍画面高度距离观看4：3画面的图像时，人眼的水平分辨力约为610线，这时图像所具有的水平清晰度正是610线。

4、清晰度和分辨率

以上就是电视垂直清晰度和水平清晰度的来源。从这里不难看出，在明确了人眼的垂直和水平―分辨力‖后，也明确了电视的―清晰度‖的概念：电视的清晰度是指电视机已经显示出来的黑白相间的直线，在垂直方向或水平方向将屏幕排满时，人眼所能辨别的最细线条数，或者说能辨别的最多线条数。在垂直方向排列的这种水平线条的最大数量，是电视的垂直清晰度；在水平方向排列的这种垂直线条的最大数量，是电视的水平清晰度。

可见，清晰度是在确定电视图像的扫描线数和像素数之前就提出来的一个重要概念和物理量，而与―水平像系×垂直像素‖所表示的分辨率概念和物理量完全不是一个东西。分辨率对图像信号来说也好，对显示器材的屏幕像素来说也好，都是固定不变的，而清晰度却是可变的。虽然图像信号分辨率的高低对电视机图像清晰度有影响，但信号分辨率并不是人们看到的图像清晰度；显示设备的像素对图像清晰度也有影响，但它也并不是人们看到的图像清晰度。图像信号分辨率是源头，最终显示的图像清晰度是结果；从数量上来说，清晰度永远小于分辨率。同一分辨率的图像信号，通过不同的传输渠道和不同的显示设备，最终得到的图像清晰度是各不相同的。因此，分辨率与清晰度之间并没有直接换算关系。如果说有换算关系的话，也只能是―自己与自己‖换算，而不能进行源头与结尾、源头与中间以及中间与结尾之间的换算。

5、清晰度和扫描线

从上面的介绍已经知道，将处在同一垂线上的所有水平扫描点（水平像素）从垂直方向连接起来，可以构成垂直方向的许多线条；将每一条水平扫描线的所有扫描点（水平像素）从水平方向连接起来，可以构成许多水平线条。那么，如果已经有45水平扫描线和610条垂直线条将屏幕布满，这些线条是否就可以再现出上面计算出来的458线垂直清晰度和610线水平清晰度来呢？回答是否定的，因为这牵涉到―孔阑效应‖和扫描线的有效性问题。

因此，为了保证复原100％的清晰度，就应当增加垂直和水平扫描线，也就是在上面所计算出的垂直清晰度458线上需要乘以一个系数K，这个系数K称为有效系数，这个系数一般取1.3～1.4。乘以有效系数以后，所得到的扫描线数肯定大于458线。

如果不采用乘以有效系数的办法，我们姑取就以上面计算出的75％的总有效率来计算，也可以反推出要还原出100%的清晰度时应当具有的扫描线的行数m： m＝458÷0.75＝611（行）

同样，根据电视屏幕4：3的比例，也可以很方便地计算出垂直扫描线n的数量： n＝611×4/3＝815（行）

可见，要达到普通人在正常收视条件下获得458线的垂直清晰度和610线的水平清晰度图像，原则上需要611行水平扫描线和815行垂直扫描线。因为垂直扫描线并非直接从竖向扫出来的，而是水平扫描线上的像素点在垂直方向上排列起来构成的一条线，所以人们也可能将其叫做垂直扫描线，也可能将其叫做水平像素点。

以上讲到的水平扫描线是构成图像的有效扫描线，如果加上逆程扫描线，水平扫描线的数字还要大些。

以PAL电视制式为例，由于在制定电视制式时考虑到视频带宽和其他技术条件的，最后将PAL制的扫描格式确定为：

水平像素×垂直方向的水平扫描线＝720×625

在625条扫描线中，包括了50行左右的逆程线，实际有效扫描线为575～576左右。

由于制定电视制式时，PAL制电视最后安排的视频带宽为6MHz，这种带宽连720×625都不能完全满足，实际使用时，只好将PAL制电视的图像格式在720×625的基础上又有所压缩，压缩的是水平像素点，保留了625行水平扫描线。因此，PAL制电视的分辨率经过由815×611到720×625的降低，再经过为满足6MHz视频带宽的压缩，PAL制电视并不能达到458线的垂直清晰度和610线的水平清晰度，而只能达到431线的垂直清晰度和468线的水平清晰度。

所以，电视线（TVLine）与PAL制或NTSC制的中的扫描线是不同的，不能混淆。在选购数码产品时要明确其单位。

视频基础知识--视频图像采样

视频图像采样

模拟视频的数字化包括不少技术问题，如电视信号具有不同的制式而且采用复合的YUV 信号方式，而计算机工作在RGB 空间；电视机是隔行扫描，计算机显示器大多逐行扫描；电视图像的分辨率与显示器的分辨率也不尽相同等等。因此，模拟视频的数字化主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一。

模拟视频一般采用分量数字化方式，先把复合视频信号中的亮度和色度分离，得到YUV 或YIQ 分量，然后用三个模／数转换器对三个分量分别采样并进行数字化，最后再转换成RGB 空间。

对彩色电视图像进行采样时，可以采用两种采样方法。一种是使用相同的采样频率对图像的亮度信号（Y）和色差信号（Cr，Cb）进行采样，另一种是对亮度信号和色差信号分别采用不同的采样频率进行采样。如果对色差信号使用的采样频率比对亮度信号使用的采样频率低，这种采样就称为图像子采样

(subsampling)。由于人的视觉对亮度信号的敏感度高于对色差的敏感度，这样做利用人的视觉特性来节省信号的带宽和功率，通过选择合适的颜色模型，可以使两个色差信号所占的带宽明显低于Y 的带宽，而又不明显影响重显彩色图像的观看。

目前使用的子采样格式有如下几种：

(1) 4:4:4 这种采样格式不是子采样格式，它是指在每条扫描线上每4 个连续的采样点取4个亮度Y 样本、4个红色差Cr 样本和4个蓝色差Cb 样本，这就相当于每个像素用3个样本表示。

(2) 4:2:2 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y 样本、2个红色差Cr 样本和2个蓝色差Cb 样本，平均每个像素用2个样本表示。

(3) 4:1:1 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y 样本、1个红色差Cr 样本和1个蓝色差Cb 样本，平均每个像素用1.5个样本表示。

(4) 4:2:0 这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y 样本、1个红色差Cr 样本和1个蓝色差Cb 样本，平均每个像素用1.5个样本表示。

图6图像子采样

视频基础知识---电视制式

电视制式

1 彩色电视制式

目前世界上现行的彩色电视制式有三种：NTSC 制、PAL 制和SECAM 制。这里不包括高清晰度彩色电视HDTV (High-Definition television)。 NTSC制式

NTSC(National Television Systems Committee)彩色电视制是1952 年美国国家电视标准委员会定义的彩色电视广播标准，称为正交平衡调幅制。美国、加拿大等大部分西半球国家，以及日本、韩国、菲律宾等国和中国的采用这种制式。 NTSC 彩色电视制的主要特性是：

(1) 525 行/帧, 30 帧/秒(29.97 fps, 33.37 ms/frame)；

(2) 高宽比：电视画面的长宽比(电视为4:3；电影为3:2；高清晰度电视为16:9)； (3) 隔行扫描，一帧分成2 场(field)，262.5 线/场；

(4) 在每场的开始部分保留20 扫描线作为控制信息，因此只有485 条线的可视数据；

(5) 每行63.5 微秒，水平回扫时间10 微秒(包含5 微秒的水平同步脉冲)，所以显示时间是53.5 微秒； (6) 颜色模型：YIQ。

一帧图像的总行数为525 行，分两场扫描。行扫描频率为15750 Hz，周期为63.5μs；场扫描频率是60 Hz，周期为16.67 ms；帧频是30 Hz，周期33.33ms。每一场的扫描行数为525/2=262.5 行。除了两场的场回扫外，实际传送图像的行数为480 行。 PAL制式

由于NTSC 制存在相位敏感造成彩色失真的缺点，因此德国于1962 年制定了PAL(Phase-Alternative Line)制彩色电视广播标准，称为逐行倒相正交平衡调幅制。德国、英国等一些西欧国家，以及中国、朝鲜等国家采用这种制式。

PAL 电视制的主要扫描特性是：

(1) 625 行(扫描线)/帧，25 帧/秒(40 ms/帧)； (2) 长宽比(aspect ratio)：4:3；

(3) 隔行扫描，2 场/帧，312.5 行/场； (4) 颜色模型：YUV。 SECAM制式

法国制定了SECAM (法文：Sequential Coleur Avec Memoire)彩色电视广播标准，称为顺序传送彩色与存储制。法国、苏联及东欧国家采用这种制式。世界上约有65 个地区和国家试验这种制式。

这种制式与PAL 制类似，其差别是SECAM 中的色度信号是频率调制(FM)，而且它的两个色差信号：红色差(R'-Y')和蓝色差(B'-Y')信号是按行的顺序传输的。图像宽高比为4:3，625 线，50 Hz，6 MHz 电视信号带宽，总带宽8 MHz。

表1 电视制式的比较

制式名 NTSC历史制(National 1952年美国国家电视Systems 标准委员会定义的彩色电视广播标准应用美国、加拿大等大部分西半球国家，以及日本、韩国、菲律宾等国和中国的采用这种制式 PAL(Phase-Alternative Line)逐行倒相正交平衡调幅制 SECAM制。(法文：Sequential Coleur Avec Memoire)顺序传送彩色与存储制法国制定制德国(当时的西德)于1962年制定德国、英国等一些西欧国家，以及中国、朝鲜等国家采用这种制式法国、苏联及东欧国家采用这种制式。世界上约有65个地区和国家试验这种制式 625行(扫描线)/帧，25帧/秒;隔行扫描 625行(扫描线)/帧，25帧/秒;隔行扫描，2场/帧，;颜色模型：YUV 区别 525行/帧, 30帧/秒;隔行扫描;颜色模型：YIQ Television 调幅制 Committee)正交平衡

2 彩色电视的颜色空间

在彩色电视中，用Y、C1, C2 彩色表示法分别表示亮度信号和两个色差信号，C1，C2 的含义与具体的应用有关。在NTSC 彩色电视制中，C1，C2 分别表示I、Q 两个色差信号；在PAL 彩色电视制中，C1，C2 分别表示U、V 两个色差信号；在CCIR 601 数字电视标准中，C1，C2 分别表示Cr，Cb 两个色差信号。所谓色差是指基色信号中的三个分量信号(即R、G、B)与亮度信号之差。 (1) NTSC 的YIQ 颜色空间与RGB 颜色空间的转换关系如下： Y=0.30R+0.59G+0.11B

I=0.74(R－Y)－0.27(B－Y) = 0.60R+0.28G+0.32B Q=0.48(R－Y)－0.27(B－Y) = 0.21R+0.52G+0.31B

(2) PAL 的YUV 颜色空间与RGB 颜色空间的转换关系如下：

Y=0.30R+0.59G+0.11B

U=0.493(B－Y) = －0.15R－0.29G+0.44B Q=0.877(R－Y) = 0.62R－0.52G－0.10B

视频基础知识--逐行扫描与隔行扫描

多媒体的应用已经深入人们生活，视频会议已经成为工作会议、教学中重要的手段之一。高清电视、高清视讯也是现在人们茶余饭后的谈资，那么什么是高清的标准？什么是高清的分辨率？计算机行业中的显示器与电视行业中的分辨率有什么区别？为什么视频会议、数字电视在图像采样上采用子采样的方式？高清视频会议和高清电视是怎么统一起来的？本文就为你解开视频的层层面纱，深入了解视频会议的基础知识。

逐行扫描与隔行扫描

隔行（interlaced）和逐行（progressive）都是CRT时代显示器的水平扫描方式。CRT的每一帧画面都通过电器自上而下的扫描来完成。这一过程中，如果逐一完成每一条水平扫描线，就称作逐行扫描。如果先扫描所有奇数扫描线，再完成偶数扫描线，就是隔行扫描，每一帧(Frame)图像通过两场(Filed)扫描完成，第一场只扫描奇数行，第二场只扫描偶数行。

图1 隔行扫描(左图是奇数场，右图是偶数场)

图2 逐行扫描

进入到数字时代，虽然采用液晶、等离子等数字技术的电视机本身不再采用CRT扫描显示方式，但是隔行和逐行却仍然成为高清信号的两种格式。经常见到的720p、1080i、1080p中的P就是指逐行扫描，I指隔行扫描。

逐行扫描和隔行扫描的特点：

 逐行扫描的图像画面平滑、无闪烁；

 隔行扫描行间闪烁比较明显、会造成锯齿现象，它们是由组成单一帧的两个视场间的相对位移

造成的；

 隔行扫描是一种压缩方式，用帧周期一半的时间，通过偏置两个视场来组建一帧，减少了一半

需要传输或储存的信息量；对于未被压缩的隔行高清晰度视频，这个数据产生速度大约是前面的两倍。

图3 逐行扫描与隔行扫描图像质量对比

视频基础知识---颜色空间

颜色空间

1 光和颜色

可见光是波长在380 nm～780 nm 之间的电磁波，我们看到的大多数光不是一种波长的光，而是由许多不同波长的光组合成的。如果光源由单波长组成，就称为单色光源。该光源具有能量，也称强度。实际中，只有极少数光源是单色的，大多数光源是由不同波长组成，每个波长的光具有自身的强度。这称为光源的光谱分析。

颜色是视觉系统对可见光的感知结果。研究表明，人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞。红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同，对不同亮度的感知程度也不同。

自然界中的任何一种颜色都可以由R，G，B 这3 种颜色值之和来确定，以这三种颜色为基色构成一个RGB 颜色空间，基色的波长分别为700 nm(红色)、546.1nm(绿色)和435.8 nm(蓝色)。

颜色＝R(红色的百分比)＋G(绿色的百分比)＋B(蓝色的百分比)，只要其中一种不是由其它两种颜色生成，可以选择不同的三基色构造不同的颜色空间。

图4 颜色构成原理

2 颜色的度量

图像的数字化首选要考虑到如何用数字来描述颜色。国际照明委员会CIE（International Commission on Illumination ）对颜色的描述作了一个通用的定义，用颜色的三个特性来区分颜色。这些特性是色调，饱和度和明度，它们是颜色所固有的并且是截然不同的特性。

色调(hue)又称为色相，指颜色的外观，用于区别颜色的名称或颜色的种类。色调用红、橙、黄、绿、青、蓝、靛、紫等术语来刻画。用于描述感知色调的一个术语是色彩(colorfulness)。

饱和度(saturation)是相对于明度的一个区域的色彩，是指颜色的纯洁性，它可用来区别颜色明暗的程度。完全饱和的颜色是指没有渗入白光所呈现的颜色，例如仅由单一波长组成的光谱色就是完全饱和的颜色。明度(brightness)是视觉系统对可见物体辐射或者发光多少的感知属性。它和人的感知有关。由于明度很难度量，因此国际照明委员会定义了一个比较容易度量的物理量，称为亮度(luminance) 来度量明度，亮度(luminance)即辐射的能量。明度的一个极端是黑色(没有光)，另一个极端是白色，在这两个极端之间是灰色。光亮度(lightness)是人的视觉系统对亮度(luminance)的感知响应值，光亮度可用作颜色空间的一个维，而明度(brightness)则仅限用于发光体,该术语用来描述反射表面或者透射表面。

3 颜色空间

颜色空间是表示颜色的一种数学方法，人们用它来指定和产生颜色，使颜色形象化。颜色空间中的颜色通常使用代表三个参数的三维坐标来指定，这些参数描述的是颜色在颜色空间中的位置，但并没有告诉我们是什么颜色，其颜色要取决于我们使用的坐标。

从技术上角度区分，颜色空间可考虑分成如下三类：

 RGB 型颜色空间/计算机图形颜色空间：这类模型主要用于电视机和计算机的颜色显示系统。

例如，RGB，HSI, HSL 和HSV 等颜色空间。

 XYZ 型颜色空间/CIE 颜色空间：这类颜色空间是由国际照明委员会定义的颜色空间，通常

作为国际性的颜色空间标准，用作颜色的基本度量方法。例如，CIE 1931 XYZ，L*a*b，L*u*v 和LCH 等颜色空间就可作为过渡性的转换空间。

 YUV 型颜色空间/电视系统颜色空间：由广播电视需求的推动而开发的颜色空间，主要目的是

通过压缩色度信息以有效地播送彩色电视图像。例如，YUV，YIQ，ITU-R BT.601 Y'CbCr, ITU-R BT.709 Y'CbCr 和SMPTE-240M Y'PbPr 等颜色空间。

4 颜色空间的转换

不同颜色可以通过一定的数学关系相互转换：

 有些颜色空间之间可以直接变换。例如，RGB 和HSL，RGB 和HSB，RGB 和R'G'B', R'G'B'和

Y'CrCb，CIE XYZ 和CIE L*a*b*等。

 有些颜色空间之间不能直接变换。例如，RGB 和CIE La*b*, CIE XYZ和HSL，HSL 和Y'CbCr 等，

它们之间的变换需要借助其他颜色空间进行过渡。

其中，R'G'B'和Y'CbCr 两个彩色空间之间的转换关系可以用下式表示： Y = 0.299R + 0.587G + 0.114B

Cr = (0.500R - 0.4187G - 0.0813B) + 128 Cb = (-0.1687R - 0.3313G + 0.500B) + 128

图5 色彩空间的变换

Y'CbCr中，Y表示亮度，CbCr表示色差。Y'CbCr彩色空间的特点：

 亮度信号和色度信号相互的 ----可以对这些单色图分别进行编码。这就是为什么黑白电视能接

收彩色电视信号的原因。

 人眼对彩色细节的分辨能力远比对亮度细节的分辨能力低----可以把几个相邻像素不同的彩色值当

作相同的彩色值来处理，从而减少所需的存储容量和传输量。

视频系统术语---音频技术

音频技术

视频通讯过程是视频和音频的实时双向完整通讯过程。在这个过程中我们为了获得高清晰视频图像，有时却忽略了另外一个重要的过程——音频通讯过程。如果我们在观看高清晰视频图像的时候，不能得到一个更清晰、连续的音频效果。那么这个过程实际上就没有任何意义，所以其重要性甚至超过视频。在传统的视频会议系统中音频技术发展极其缓慢，原因在于目前应用于视频通讯的音频编解码压缩标准都是为了保持传输时的低带宽占用和较高的编解码效率，从而将音频信号的采样频率、采样精度和采样范围指标做了极大的降低，使得所能提供的音频清晰度和还原性都有很大程度上的衰减。与用于存储和回放非实时压缩协议的标准（如OGG、MP3等）相比，音频的保真度非常低。这样就在某种程度上对现场声音的还原达不到要求。目前传统视频通讯过程中主要采用的是G.711、G.722、G.721、G.728等音频标准，音频宽度仅有50Hz－7KHz单声道，而人耳所能感知的自然界的频响能力可以达到20Hz－20KHz，因此，在对现场环境音的还原过程中过多的音频信息的丢失造成了无法真实表现现场情况。所以在高清晰视频通讯过程中我们势必要有一种相辅助的音频处理方式解决此问题。使整个高清晰通讯过程更去近于完美。

目前国际上对音频处理技术上标准较多，在对下一代实时交互音频处理上可以采用MPEG-1 Layer 2或AAC系列音频，对选用标准的原则是，音频频响范围要达到22KHz，这样就几乎可以覆盖了人耳听觉的全部范围，甚至在高频方面还有所超越，能够使现场音频得到真实自然的还原，并且在还原时可以采用双声道立体声回放，使整个视频通讯的声音有更强的临近感，达到CD级音质。同时在对链路带宽的适应和编解码效率上达到最佳。下面是各种音频编码标准的说明：

1 G.711

类型：Audio 制定者：ITU-T 所需频宽：Kbps

特性：算法复杂度小，音质一般

优点：算法复杂度低，压缩比小（CD音质>400kbps），编解码延时最短（相对其它技术）缺点：占用的带宽较高

备注：70年代CCITT公布的G.711 kb/s脉冲编码调制PCM。

2 G.721

制定者：ITU-T 所需带宽：32Kbps 音频频宽：3.4KHZ

特性：相对于PCMA和PCMU，其压缩比较高，可以提供2：1的压缩比。优点：压缩比大缺点：声音质量一般

备注：子带ADPCM（SB-ADPCM）技术。G.721标准是一个代码转换系统。它使用ADPCM转换技术，实现 kb/s A律或μ律PCM速率和32 kb/s速率之间的相互转换。

3 G.722

制定者：ITU-T 所需带宽：Kbps 音频宽度：7KHZ

特性：G722能提供高保真的语音质量优点：音质好缺点：带宽要求高

备注：子带ADPCM（SB-ADPCM）技术

4 G.721

制定者：ITU-T

所需带宽：32Kbps/24Kbps 音频宽度：7KHZ

特性：可实现比G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现 G.722 大致相当的质量。优点：音质好缺点：带宽要求高

备注：目前大多用于电视会议系统。

5 G.721附录C

制定者：ITU-T

所需带宽：48Kbps/32Kbps/4Kbps 音频宽度：14KHZ

特性：采用自Polycom 的Siren™14 专利算法，与早先的宽频带音频技术相比具有突破性的优势，提供了低时延的14 kHz 超宽频带音频，而码率不到MPEG4 AAC-LD 替代编解码器的一半，同时要求的运算能力仅为十分之一到二十分之一，这样就留出了更多的处理器周期来提高视频质量或者运行因特网应用程序，并且移动设备上的电池续航时间也可延长。

优点：音质更为清晰，几乎可与CD 音质媲美，在视频会议等应用中可以降低听者的疲劳程度。缺点：是Polycom的专利技术。备注：目前大多用于电视会议系统

6 G.723(低码率语音编码算法)

制定者：ITU-T

所需带宽：5.3Kbps/6.3Kbps 音频宽度：3.4KHZ

特性：语音质量接近良，带宽要求低，高效实现，便于多路扩展，可利用C5402片内16kRAM实现53coder。达到ITU-TG723要求的语音质量，性能稳定。可用于IP电话语音信源编码或高效语音压缩存储。优点：码率低，带宽要求较小。并达到ITU-TG723要求的语音质量，性能稳定。缺点：声音质量一般

备注：G.723语音编码器是一种用于多媒体通信，编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。G.723标准是国际电信联盟（ITU）制定的多媒体通信标准中的一个组成部分，可以应用于IP电话等系统中。其中，5.3kbits/s码率编码器采用多脉冲最大似然量化技术（MP－MLQ），6.3kbits/s码率编码器采用代数码激励线性预测技术。

7 G.723.1(双速率语音编码算法)

制定者：ITU-T 所需带宽：5.3Kbps(29) 音频宽度：3.4KHZ

特性：能够对音乐和其他音频信号进行压缩和解压缩，但它对语音信号来说是最优的。G.723.1采用了执行不连续传输的静音压缩，这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外，这种技术使发信机的调制解调器保持连续工作，并且避免了载波信号的时通时断。

优点：码率低，带宽要求较小。并达到ITU-TG723要求的语音质量，性能稳定,避免了载波信号的时通时断。缺点：语音质量一般

备注：G.723.1算法是ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法，其目标应用系统包括H.323、H.324等多媒体通信系统。目前该算法已成为IP电话系统中的必选算法之一。

8 G.728

制定者：ITU-T

所需带宽：16Kbps/8Kbps 音频宽度：3.4KHZ

特性：用于IP电话、卫星通信、语音存储等多个领域。G.728是一种低时延编码器，但它比其它的编码器都复杂，这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。优点：后向自适应，采用自适应后置滤波器来提高其性能

缺点：比其它的编码器都复杂

备注：G.728 16kb/s短延时码本激励线性预测编码（LD-CELP）。1996年ITU公布了G.728 8kb/s的CS－ACELP算法，可以用于IP电话、卫星通信、语音存储等多个领域。16 kbps G.728低时延码激励线性预测。 G.728是低比特线性预测合成分析编码器（G.729和G.723.1）和后向ADPCM编码器的混合体。G.728是LD-CELP编码器，它一次只处理5个样点。对于低速率（56~128 kbps）的综合业务数字网（ISDN）可视电话，G.728是一种建议采用的语音编码器。由于其后向自适应特性，因此G.728是一种低时延编码器，但它比其它的编码器都复杂，这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。

9 G.729

制定者：ITU-T 所需带宽：8Kbps 音频宽度：3.4KHZ

特性：在良好的信道条件下要达到长话质量，在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。这种语音压缩算法可以应用在很广泛的领域中，包括ＩＰ电话、无线通信、数字卫星系统和数字专用线路。

G.729算法采用―共轭结构代数码本激励线性预测编码方案‖（CS-ACELP）算法。这种算法综合了波形编码和参数编码的优点，以自适应预测编码技术为基础，采用了矢量量化、合成分析和感觉加权等技术。 G.729编码器是为低时延应用设计的，它的帧长只有10ms，处理时延也是10ms，再加上5ms的前视，这就使得G.729产生的点到点的时延为25ms，比特率为8 kbps。

优点：语音质量良，应用领域很广泛，采用了矢量量化、合成分析和感觉加权，提供了对帧丢失和分组丢失的隐藏处理机制。

缺点：在处理随机比特错误方面性能不好。

备注：国际电信联盟（ITU-T）于1995年11月正式通过了G.729。ITU-T建议G.729也被称作―共轭结构代数码本激励线性预测编码方案‖(CS-ACELP)，它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。

10G.729A

制定者：ITU-T 所需带宽：8Kbps(34.4) 音频宽度：3.4KHZ

特性：复杂性较G.729低，性能较G.729差。

优点：语音质量良，降低了计算的复杂度以便于实时实现，提供了对帧丢失和分组丢失的隐藏处理机制缺点：性能较G.729差

备注：96年ITU-T又制定了G.729的简化方案G.729A，主要降低了计算的复杂度以便于实时实现，因此目前使用的都是G.729A。

11 MPEG-1 audio layer 1

制定者：MPEG

所需带宽：384kbps（压缩4倍）音频宽度：

特性：编码简单，用于数字盒式录音磁带，2声道，VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。优点：压缩方式相对时域压缩技术而言要复杂得多，同时编码效率、声音质量也大幅提高，编码延时相应增加。可以达到―完全透明‖的声音质量（EBU音质标准）缺点：频宽要求较高

备注：MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准，它分为三个层次： --层1(Layer 1)：编码简单，用于数字盒式录音磁带

--层2(Layer 2)：算法复杂度中等，用于数字音频广播(DAB)和VCD等

--层3(Layer 3)：编码复杂，用于互联网上的高质量声音的传输，如MP3音乐压缩10倍

12MPEG-1 audio layer 2,即MP2

制定者：MPEG

所需带宽：256～192kbps（压缩6～8倍）音频宽度：

特性：算法复杂度中等，用于数字音频广播(DAB)和VCD等，2声道，而MUSICAM由于其适当的复杂程度和优秀的声音质量，在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。优点：压缩方式相对时域压缩技术而言要复杂得多，同时编码效率、声音质量也大幅提高，编码延时相应增加。可以达到―完全透明‖的声音质量（EBU音质标准）缺点：

备注：同MPEG-1 audio layer 1

13MPEG-1 audio layer 3(MP3)

制定者：MPEG

所需带宽：128～112kbps（压缩10～12倍）音频宽度：

特性：编码复杂，用于互联网上的高质量声音的传输，如MP3音乐压缩10倍，2声道。MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术，在当时的技术条件下，MP3的复杂度显得相对较高，编码不利于实时，但由于MP3在低码率条件下高水准的声音质量，使得它成为软解压及网络广播的宠儿。

优点：压缩比高，适合用于互联网上的传播

缺点：MP3在128KBitrate及以下时，会出现明显的高频丢失备注：同MPEG-1 audio layer 1

14MPEG-2 audio layer

制定者：MPEG

所需带宽：与MPEG-1层1，层2，层3相同音频宽度：

特性：MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器，层1, 层2和层3的结构也相同，但它能支持5.1声道和7.1声道的环绕立体声。优点：支持5.1声道和7.1声道的环绕立体声缺点：

备注：MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器，层1, 层2和层3的结构也相同，但它能支持5.1声道和7.1声道的环绕立体声。

15AAC-LD (dvanced Audio Coding，先进音频编码)

制定者：MPEG 所需带宽：48- kbps 音频宽度：22KHZ

特性：提供高质量的低延时的音频编码标准，以其20ms的算法延时提供更高的比特率和各种声音信号的高质量音频。缺点：

备注：超宽带编解码器技术支持高达48KHz采样率的语音传输，与传统的窄带与宽带语音编解码器相比大幅提高了音质。该技术可提供接近CD音质的音频，数据速率高达48–kbps，不仅提高了IP语音与视频应用的清晰度，而且支持电话音乐传输功能。高清语音通道支持更高的采样率，配合音频编解码器的高保真音效，显著丰富并扩展了频谱两端的音质范围，有效改善了语音回响性能，提高了清晰度。

视频系统术语---视频分辩率

视频分辨率

1 CIF

CIF是常用的标准化图像格式（Common Intermediate Format）。在H.323协议簇中，规定了视频采集设备的标准采集分辨率。CIF = 352×288像素。 CIF格式具有如下特性：

(1) 电视图像的空间分辨率为家用录像系统(Video Home System，VHS)的分辨率，即352×288。 (2) 使用非隔行扫描。

(3) 使用NTSC帧速率，30幅/秒。

(4) 使用1/2的PAL水平分辨率，即288线。

(5) 对亮度和两个色差信号(Y、Cb和Cr)分量分别进行编码，它们的取值范围同ITU-R BT.601。即黑色=16，白色=235，色差的最大值等于240，最小值等于16。下面为5种CIF 图像格式的参数说明。 sub-QCIF 128×96

QCIF 176×144 CIF 352×288 4CIF 704×576 9CIF 1056×8 16CIF 1408×1152

目前在视频会议行业中使用CIF、4CIF，而在监控行业中使用CIF、HALF D1、D1等几种分辨率。

2 DCIF

在视频监控中，经过研究发现一种更为有效的监控视频编码分辨率（DCIF），其像素为528×384。DCIF分辨率的是视频图像来历是将奇、偶两个HALF D1，经反隔行变换，组成一个D1（720*576），D1作边界处理，变成4CIF（704×576），4CIF经水平3/4缩小、垂直2/3缩小，转换成528×384。528×384的像素数正好是CIF像素数的两倍，为了与常说的2CIF（704*288）区分，我们称之为DOUBLE CIF，简称DCIF。显然，DCIF在水平和垂直两个方向上，比Half D1更加均衡。

3 Dx系列/720p/1080p

Dx系列是数字电视系统显示格式的标准，共分为如下五种规格。我们经常说的高清视频、超高清视频的720p和1080p也是数字电视系统的显示格式。

D1：480i格式（525i）：720×480（水平480线，隔行扫描），和NTSC模拟电视清晰度相同，行频为15.25kHz，

相当于我们所说的4CIF（720×576）。

D2：480p格式（525p）：720×480（水平480线，逐行扫描），较D1隔行扫描要清晰不少，和逐行扫描DVD规格相同，行频为31.5kHz。

D3：1080i格式（1125i）：1920×1080（水平1080线，隔行扫描），高清采用最多的一种分辨率，分辨率为1920×1080i/60HZ，行频为33.75kHz。

D4：720p格式（750p）：1280×720（水平720线，逐行扫描），虽然分辨率较D3要低，但是因为逐行扫描，市面上更多人感觉相对于1080i（实际逐次540线）视觉效果更加清晰。在最大分辨率达到1920×1080的情况下，D3要比D4感觉更加清晰，尤其是文字表现力上，分辨率为1280×720p/60HZ，行频为45kHz。 D5：1080p格式（1125p）：1920×1080（水平1080线，逐行扫描），目前民用高清视频的最高标准，分辨率为1920×1080p/60HZ，行频为67.5KHZ。

其中D1 和D2标准是我们一般模拟电视的最高标准，并不能称的上高清晰，D3的1080i标准是高清晰电视的基本标准，它可以兼容720p格式，而D5的1080p只是专业上的标准，并不是民用级别的，上面所给出的60HZ只是理想状态下的场频，而它的行频为67.5KHZ，目前还没有如此高行频的电视问世，实际在专业领域里1080p的场频只有24HZ，25HZ和30HZ。

需要指出的一点是，DVI接口是日本独有的特殊接口，国内电视几乎没有带这种接口的，最多的是色差接口，而色差接口最多支持到D4，理论上肯定没有HDMI（纯数字信号，支持到1080p)的最高清晰度高，但在1920×1080以下分辨率的电视机上，一般也没有很大差别

视频系统术语--音频接口

除了高清视频带来的视觉上的冲击，音频方面质量也有很大提高，能给大家带来更逼真的现场效果。对于目前经常提到的音频接口做一个说明。

1 RCA模拟音频

RCA接头就是常说的莲花头，利用RCA线缆传输模拟信号是目前最普遍的音频连接方式。每一根RCA线缆负责传输一个声道的音频信号，所以立体声信号，需要使用一对线缆。对于多声道系统，就要根据实际的声道数量配以相同数量的线缆。立体声RCA音频接口，一般将右声道用红色标注，左声道则用蓝色或者白色标注。

2 平衡模拟音频

大三芯插头

XLR接口

与RCA模拟音频线缆直接传输声音的方式完全不同，平衡模拟音频（Balanced Analog Audio）接口使用两个通道分别传送信号相同而相位相反的信号。接收端设备将这两组信号相减，干扰信号就被抵消掉，从而获得高质量的模拟信号。平衡模拟音频通常采用XLR接口和大三芯接口。XLR俗称卡侬头，有三针插头和锁定装置组成。由于采用了锁定装置，XLR连接相当牢靠。大三芯接口则采用直径为6.35毫米的插头，其优点是耐磨损，适合反复插拔。平衡模拟音频连接主要出现在高级模拟音响器材或专业音频设备上。

3 S/PDIF

S/PDIF（Sony/Philips Digital Interface，索尼和飞利浦数字接口）是由SONY公司与PHILIPS公司联合制定的一种数字音频输出接口。该接口广泛应用在CD播放机、声卡及家用电器等设备上，能改善CD的音质，给我们更纯正的听觉效果。该接口传输的是数字信号，所以不会像模拟信号那样受到干扰而降低音频质量。需要注意的是，S/PDIF接口是一种标准，同轴数字接口和光线接口都属于S/PDIF接口的范畴。

4 数字同轴

数字同轴（Digital Coaxial）是利用S/PDIF接口输出数字音频的接口。同轴线缆有两个同心导体，导体和屏蔽层共用同一轴心。同轴线缆是由绝缘材料隔离的铜线导体，阻抗为75欧姆，在里层绝缘材料的外部是另一层环形导体及其绝缘体，整个电缆由聚氯乙烯或特氟纶材料的护套包住。同轴电缆的优点是阻抗稳定，传输带宽高，保证了音频的质量。虽然同轴数字线缆的标准接头为BNC接头，但市面上的同轴数字线材多采用RCA接头。

5 光纤

光纤（Optical）以光脉冲的形式来传输数字信号，其材质以玻璃或有机玻璃为主。光纤同样采用S/PDIF接口输出，其是带宽高，信号衰减小，常常用于连接DVD播放器和AV功放，支持PCM数字音频信号、Dolby以及DTS音频信号。

6 凤凰头

凤凰头也经常被用来作为音频的输入和输出端口。

视频系统术语--视频接口

目前，国内外各个视频会议生产厂家都陆续推出了自己的各种高清或超清产品，都在不遗余力的宣传图像分辨率。但是，要达到高清/超清的视频会议，单单有720p或者1080p的图像分辨率是不够的。视频会议作为多媒体的一种应用，整个系统涉及到前端视频采集、图像的编码能力、高质量的网络传输、高清晰的视频显示设备。另外，如果我们在观看高清晰视频图像的时候，不能得到一个更清晰、连续的音频效果，那么这个过程实际上就没有任何意义，所以高质量音频的重要性完全不亚于视频。所以在高清或者超清的视频会议中有几个关键的知识点需要了解：高清的视频分辨率、高清视频显示设备的接口、高质量的音频传输接口、高质量的音频。技术的发展都是循序渐进的过程，在本文档中不但列出了高清视频的相关术语，还把非高清视频系统中的相关术语也一并列出，这样会有一个很直观的比较过程。

视频接口

我们经常在家里的电视机、各种播放器上，视频会议产品和监控产品的编解码器的视频输入/输出接口上看到很多视频接口，这些视频接口哪些是模拟接口、哪些是数字接口，哪些接口可以传输高清图像等，下面就做一个详细的介绍。

目前最基本的视频接口是复合视频接口、S-vidio接口；另外常见的还有色差接口、VGA接口、DVI接口、HDMI接口、SDI接口。

1.复合视频接口1.1.接口图

1.2 说明

复合视频接口也叫AV接口或者Video接口，是目前最普遍的一种视频接口，几乎所有的电视机、影碟机类产品都有这个接口。

它是音频、视频分离的视频接口，一般由三个的RCA插头（又叫梅花接口、RCA接口）组成的，其中的V接口连接混合视频信号，为黄色插口；L接口连接左声道声音信号，为白色插口；R接口连接右声道声音信号，为红色插口。

1.3 评价

它是一种混合视频信号，没有经过RF射频信号调制、放大、检波、解调等过程，信号保真度相对较好。图像品质影响受使用的线材影响大，分辨率一般可达350-450线，不过由于它是模拟接口，用于数字显示设备时，需要一个模拟信号转数字信号的过程，会损失不少信噪比，所以一般数字显示设备不建议使用。

1.2 S-Video接口1.2.1 接口图

1.2.2 说明

S接口也是非常常见的接口，其全称是Separate Video，也称为SUPER VIDEO。S-Video连接规格是由日本人开发的一种规格，S指的是―SEPARATE（分离）‖，它将亮度和色度分离输出，避免了混合视讯讯号输出时亮度和色度的相互干扰。S接口实际上是一种五芯接口，由两路视亮度信号、两路视频色度信号和一路

公共屏蔽地线共五条芯线组成。

1.2.3 评价

同AV 接口相比，由于它不再进行Y/C混合传输，因此也就无需再进行亮色分离和解码工作，而且使用各自的传输通道在很大程度上避免了视频设备内信号串扰而产生的图像失真，极大地提高了图像的清晰度。但S-Video 仍要将两路色差信号(Cr Cb)混合为一路色度信号C，进行传输然后再在显示设备内解码为Cb和Cr进行处理，这样多少仍会带来一定信号损失而产生失真(这种失真很小但在严格的广播级视频设备下进行测试时仍能发现) 。而且由于Cr Cb的混合导致色度信号的带宽也有一定的，所以S-Video虽然已经比较优秀，但离完美还相去甚远。S-Video虽不是最好的，但考虑到目前的市场状况和综合成本等其它因素，它还是应用最普遍的视频接口之一。

1.3 YPbPr /YCbCr色差接口1.3.1 接口图

1.3.2 说明

色差接口是在S接口的基础上，把色度（C）信号里的蓝色差（b）、红色差（r）分开发送，其分辨率可达到600线以上。它通常采用YPbPr 和YCbCr两种标识，前者表示逐行扫描色差输出，后者表示隔行扫描色差输出。现在很多电视类产品都是靠色差输入来提高输入讯号品质，而且透过色差接口，可以输入多种等级讯号，从最基本的480i到倍频扫描的480p，甚至720p、1080i等等，都是要通过色差输入才有办法将信号传送到电视当中。

1.3.3 评价

由电视信号关系可知，我们只需知道Y、Cr、Cb的值就能够得到G（绿色）的值，所以在视频输出和颜色处理过程中就统一忽略绿色差Cg而只保留Y Cr Cb，这便是色差输出的基本定义。作为S-Video的进阶产品，色差输出将S-Video传输的色度信号C分解为色差Cr和Cb，这样就避免了两路色差混合译码并再次分离的过程，也保持了色度信道的最大带宽，只需要经过反矩阵译码电路就可以还原为RGB三原色信号而成像，这就最大限度地缩短了视频源到显示器成像之间的视频信号信道，避免了因繁琐的传输过程所带来

的影像失真，所以色差输出的接口方式是目前最好模拟视频输出接口之一。

1.4 VGA接口

1.4.1 接口图

1.4.2 说明

VGA接口也叫D-Sub接口。VGA接口是一种D型接口，上面共有15针，分成三排，每排五个。VGA接口是显卡上应用最为广泛的接口类型，绝大多数的显卡都带有此种接口。迷你音响或者家庭影院拥有VGA接口就可以方便的和计算机的显示器连接，用计算机的显示器显示图像。

1.4.3 评价

VGA接口传输的仍然是模拟信号，对于以数字方式生成的显示图像信息，通过数字/模拟转换器转变为R、G、B三原色信号和行、场同步信号，信号通过电缆传输到显示设备中。对于模拟显示设备，如模拟CRT显示器，信号被直接送到相应的处理电路，驱动控制显像管生成图像。而对于LCD、DLP等数字显示设备，显示设备中需配置相应的A/D（模拟/数字）转换器，将模拟信号转变为数字信号。在经过D/A和A/D二次转换后，不可避免地造成了一些图像细节的损失。VGA接口应用于CRT显示器无可厚非，但用于数字电视之类的显示设备，则转换过程的图像损失会使显示效果略微下降。

1.5 DVI接口

1.5.1 接口图目前的DVI接口分为两种：

一个是DVI-D接口，只能接收数字信号，接口上只有3排8列共24个针脚，其中右上角的一个针脚为空。不兼容模拟信号。

另外一种则是DVI-I接口，可同时兼容模拟和数字信号。兼容模拟幸好并不意味着模拟信号的接口D-Sub接口可以连接在DVI-I接口上，而是必须通过一个转换接头才能使用，一般采用这种接口的显卡都会带有相关的转换接头。

1.5.2 说明

DVI全称为Digital Visual Interface，它是1999年由Silicon Image、Intel（英特尔）、Compaq（康柏）、IBM、HP（惠普）、NEC、Fujitsu（富士通）等公司共同组成DDWG（Digital Display Working Group，数字显示工作组）推出的接口标准。它是以Silicon Image公司的PanalLink接口技术为基础，基于S（Transition Minimized Differential Signaling，最小化传输差分信号）电子协议作为基本电气连接。S是一种微分信号机制，可以将象素数据编码，并通过串行连接传递。显卡产生的数字信号由发送器按照S协议编码后通过S通道发送给接收器，经过解码送给数字显示设备。一个DVI显示系统包括一个传送器和一个接收器。传送器是信号的来源，可以内建在显卡芯片中，也可以以附加芯片的形式出现在显卡PCB上；而接收器则是显示器上的一块电路，它可以接受数字信号，将其解码并传递到数字显示电路中，通过这两者，显卡发出的信号成为显示器上的图象。

1.5.3 评价

显示设备采用DVI接口具有主要有以下两大优点： 1、速度快

DVI传输的是数字信号，数字图像信息不需经过任何转换，就会直接被传送到显示设备上，因此减少了数字→模拟→数字繁琐的转换过程，大大节省了时间，因此它的速度更快，有效消除拖影现象，而且使用DVI进行数据传输，信号没有衰减，色彩更纯净，更逼真。 2、画面清晰

计算机内部传输的是二进制的数字信号，使用VGA接口连接液晶显示器的话就需要先把信号通过显卡中的D/A（数字/模拟）转换器转变为R、G、B三原色信号和行、场同步信号，这些信号通过模拟信号线传输到液晶内部还需要相应的A/D（模拟/数字）转换器将模拟信号再一次转变成数字信号才能在液晶上显示出图像来。在上述的D/A、A/D转换和信号传输过程中不可避免会出现信号的损失和受到干扰，导致图像出现失真甚至显示错误，而DVI接口无需进行这些转换，避免了信号的损失，使图像的清晰度和细节表现力都得到了大大提高。

1.6 SDI接口

1.6.1 接口图

1.6.2 说明

SDI接口是“数字分量串行接口”。

串行接口是把数据的各个比特以及相应的数据通过单一通道顺序传送的接口。由于串行数字信号的数据率很高，在传送前必须经过处理。用扰码的不归零倒置（NRZI）来代替早期的分组编码，其标准为SMPTE-259M和EBU-Tech-3267，标准包括了含数字音频在内的数字复合和数字分量信号。在传送前，对原始数据流进行扰频，并变换为NRZI码，确保在接收端可靠地恢复原始数据。这样在概念上可以将数字串行接口理解为一种基带信号调制。SDI接口能通过270Mb/s的串行数字分量信号，对于16：9格式图像，应能传送360Mb/s的信号。 1.6.3 评价

SDI接口不能直接传送压缩数字信号，数字录像机、硬盘等设备记录的压缩信号重放后，必须经解压并经SDI接口输出才能进入SDI系统。如果反复解压和压缩，必将引起图像质量下降和延时增加，为此各种不同格式的数字录像机和非线性编辑系统，规定了自己的用于直接传输压缩数字信号的接口。（a）索尼公司的串行数字数据接口SDDI（SerialDigital Data Interface），用于Betacam-SX非线性编辑或数字新闻传输系统，通过这种接口，可以4倍速从磁带上载到磁盘。（b）索尼公司的4倍速串行数字接口QSDI（QuarterSerial

Digital Interface），在DVCAM录像机编辑系统中，通过该接口以4倍速从磁带上载到磁盘、从磁盘下载到磁带或在盘与盘之间进行数据拷贝。（c）松下公司的压缩串行数字接口CSDI（CompressionSerial Digital Interface），用于DVCPRO和Digital-S数字录像机、非线性编辑系统中，由带基到盘基或盘基之间可以4倍速传输数据。

以上三种接口互不兼容，但都与SDI接口兼容。在270Mb/s的SDI系统中，可进行高速传输。这三种接口是为建立数字音视频网络而设计的，这类网络不象计算机网络那样使用握手协议，而使用同步网络技术，不会因路径不同而出现延时。

人们常在SDI信号中嵌入数字音频信号，也就是将数字音频信号插入到视频信号的行、场同步脉冲（行、场消隐）期间与数字分量视频信号同时传输。

1.7 HDMI接口

1.7.1 接口图

1.7.2 说明

HDMI的英文全称是―High Definition Multimedia‖，中文的意思是高清晰度多媒体接口。HDMI接口可以提供高达5Gbps的数据传输带宽，可以传送无压缩的音频信号及高分辨率视频信号。同时无需在信号传送前进行数/模或者模/数转换，可以保证最高质量的影音信号传送。应用HDMI的好处是：只需要一条HDMI线，便可以同时传送影音信号，而不像现在需要多条线材来连接；同时，由于无线进行数/模或者模/数转换，能取得更高的音频和视频传输质量。对消费者而言，HDMI技术不仅能提供清晰的画质，而且由于音频/视频采用同一电缆，大大简化了家庭影院系统的安装。

1.7.3 评价

2002年的4月，日立、松下、飞利浦、Silicon Image、索尼、汤姆逊、东芝共7家公司成立了HDMI组织开始制定新的专用于数字视频/音频传输标准。2002年岁末，高清晰数字多媒体接口(High-definition Digital Multimedia Interface)HDMI 1.0标准颁布。与DVI相比，HDMI可以传输数字音频信号，并增加了对HDCP的支持，同时提供了更好的DDC可选功能。HDMI支持5Gbps的数据传输率，最远可传输15米，足以应付一个1080p的视频和一个8声道的音频信号。而因为一个1080p的视频和一个8声道的音频信号需求少于4GB/s，因此HDMI还有很大余量。这允许它可以用一个电缆分别连接DVD播放器，接收器和PRR。此外HDMI支持EDID、DDC2B，因此具有HDMI的设备具有―即插即用‖的特点，信号源和显示设备之间会自动进行―协商‖，自动选择最合适的视频/音频格式。 HDMI在针脚上和DVI兼容，只是采用了不同的封装： HDMI to DVI-D转接头：

HDMI to DVI-D转接线：

1.8 IEEE1394接口1.8.1 接口图

1.8.2 说明

IEEE 1394也称为火线或iLink，它能够传输数字视频和音频及机器控制信号，具有较高的带宽，且十分稳定。通常它主要用来连接数码摄像机、DVD录像机等设备。IEEE 1394接口有两种类型：6针的六角形接口和4针的小型四角形接口。6针的六角形接口可向所连接的设备供电，而4针的四角形接口则不能。 1.8.3 评价

它的设计初衷是成为电子设备(包括便携式摄像机、个人电脑、数字电视机、音/视频接收器、DVD播放机、打印机等)之间的一个通用连接接口。1394电缆可以传输不同类型的数字信号，包括视频、音频、数码音响、设备控制命令和计算机数据。IEEE 1394主要的性能特点如下：

数字接口：数据能够以数字形式传输，不需要模数转换，从而降低了设备的复杂性，保证了信号的质量。热插拔：即系统在全速工作时，IEEE 1394设备也可以插入或拆除，用户会发现，增添一个1394器件，就

像将电源线插入其电气插座中一样容易。

1.9 BNC接口

1.9.1 接口图

1.9.2 说明

BNC接口是指同轴电缆接口，BNC接口用于75欧同轴电缆连接用，提供收（RX）、发（TX）两个通道，它用于非平衡信号的连接。

1.9.3 评价

BNC（同轴电缆卡环形接口）接口主要用于连接高端家庭影院产品以及专业视频设备。BNC电缆有5个连接头，分别接收红、绿、蓝、水平同步和垂直同步信号。BNC接头可以让视频信号互相间干扰减少，可达到最佳信号响应效果。此外，由于BNC接口的特殊设计，连接非常紧，不必担心接口松动而产生接触不良。

H.263与H.2的比较

－视讯会议的编码协议及带宽选择

摘要：视讯会议应采用什么样的编码协议？不同H.系列协议间的主要区别是什么？不同协议与带宽有什么样的联系？这些都是目前常常困扰视讯应用者的问题，本文对这些问题作了一些探讨并给出了相应的建议。

1 会议电视的视频编码标准回顾

会议电视公认的图像编码标准协议是H系列，即ITU-T H.261、H.263和H.2协议。1995年之前，会议电视系统图像都采用H261编码协议。1995年，ITU-T针对低比特率视频应用制定了H.263标准，当时H263被公认为是以像素为基础的采用第一代编码技术混合编码方案所能达到的最佳结果。在随后几年中，ITU-T又对其进行了多次完善，以提高编码效率，增强编码功能。1998年发布了H.263+；2000年发布了H.263++。尽管采用H263编码技术较H261编码在压缩率和图像质量上都有大幅度的提升，但H.263信源编码算法的核心仍然是H.261标准中采用的DPCM/DCT混和编码算法，原理框图也和H.261十分相似。

2001年12月，ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成视频联合工作组（JVT，Joint Video Team），负责制定一个新的视频编码标准，以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。随后JVT制定出的视频编码标准被ITU-T 定义为H.2；该标准也被ISO定义为14496-10（MPEG-4 第10部分）高级视频编码（AVC，Advanced Video Coding）标准。

H.2相对以前的编码方法，在图像内容预测方面提高了编码效率，采用可变块大小运动补偿、1/4采样精度运动补偿、加权预测等算法，改善了图像质量，增加了纠错功能和各种网络环境传输的适应性。测试结果表明，在中低带宽情况下，H.2具有比H.263++更优秀的PSNR性能：H.2的PSNR比H.263++平均要高3dB。所以目前业界主流视频会议系统厂家都推出了基于H.2的视讯产品。

H2编码技术使运动图像压缩技术上升到了一个更高的阶段，在较低带宽上提供高质量的图像传输是H.2的应用亮点。H.2的推广应用对视频终端、网守、网关、MCU等系统的要求较高，目前只有真正有实力的厂家才有能力提供全线的产品。

H.2编码标准正在被其它行业认同，H2有可能成为广播、通信和存储媒体（CD、DVD）的统一的标准，即成为未来宽带交互新媒体的统一标准。 2 H263协议还是H2对比分析

从视频标准的发展来看，H.2作为国际两大标准组织确定的共同标准，全面覆盖了视频通信、广播、存储等各方面的应用，采用H2的视频标准协议的会议电视系统是是合理的选择。采用H2编码协议的优势：

不同大小和形状的宏块分割：H.2支持7种模式。最小可达4×4的小块模式的运动补偿为运动详细信息的处理提高了性能，减少了方块效应，提高了图像的质量。

高精度的亚像素运动补偿：在H.263中采用的是半像素精度的运动估计，而在H.2中可以采用1/4或者1/8像素精度的运动估值。运动估计后的残差小。

多帧预测：H.2提供可选的多帧预测功能，在帧间编码时，可选5个不同的参考帧，提供了更好的纠错性能，这样更可以改善视频图像质量。

去块滤波器：H.2定义了自适应去除块效应的滤波器，这可以处理预测环路中的水平和垂直块边缘，大大减少了方块效应。

4×4块的整数变换：由于用二变换块的尺寸缩小,运动物体的划分更精确,这样,不但变换计算量比较小,而且在运动物体边缘处的衔接误疾差也大为减小；

先进的量化方法：与H.263等的固定常数量化步长不同，H.2步长是以12.5%的复合率递进的，并对色度系数采用了较小量化步长。这些措施提高了码率控制的能力，并加强了彩色的逼真性。

H.239双流技术

关键词：双流 H.239

摘要：本文描述H.239双流技术原理及其在H3C产品中应用状况。缩略语：缩略语 - 英文全名中文解释

目录 1 概述 2 H.239技术 2.1 概念介绍 2.2 技术原理 2.3 技术实现 3 双流应用状况 4 H3C产品双流实现状况

1 概述

视讯会议主要是以语音和图像的方式实现远程的面对面的交流，但是随着视讯系统应用的日益广泛，人们已经不满足于仅仅看到远程的视频图像，希望能够传递更多的信息，如开会时用到的图表、数据或文档等信息，而这些信息多以数据文件存在于电脑。因此，在很多场合下，视讯会议需要建立起与数据的协同工作，如远程会商、远程教育、远程办公等，以增强会议临场感，提高视讯会议的效率。

最初，人们通过T.120数据会议实现这些信息的传送，T.120系列协议是ITU-T制定的一整套多点数据会议的通信、会议管理和数据应用的协议总称。T.120系列协议是个多层次的协议族，包括必选项和可选项两部分。必选项主要是T.123、T.122、T.124、T.125等，定义了T.120协议的基础框架和核心实现机制；可选项包括T.126、T.127等，定义T.120协议的各种应用：T.126—静态图像传输和注释；T.127—二进制文件传输；T.128—应用程序共享。从理论上讲，T.120协议能够满足一般的数据会议用户的要求，但在实际应用中，往往不尽人意，特别是数据会议T.120和会议电视标准混合使用的时候，往往会出现不能满足客户需求的情况。比如：T.120的实现复杂；利用T.120文件传输传送高分辩率的图文时，速度很慢；共享大容量的应用程序时，很容易造成视讯会议系统瘫痪等。

为了寻找一种更加简单有效的视讯与数据协同工作方式，人们提出了H.239双流技术。 2 H.239技术2.1 概念介绍

什么是双流技术？所谓双流顾名思义就是指：终端能够同时发送/接收两路视频流。这样仅需要通过共享网络带宽便能使用户得到更多的信息，无需要更多的资源，通过最小的代价获得更多信息。

早期在双流的标准没有出来之前，部分终端厂商为了实现在会议中传送两组视频图像纷纷采用私有协议，这样做的后果是使许多终端的双流无法进行互通。

2003年7月，ITU批准了H.239标准，该标准支持“Additional Media Channels for H.3xx System”。即在一次呼叫建立媒体连接后，在两个H.239终端之间传送两路媒体流，这两条媒体流共享呼叫带宽，基于此项技术，视频用户可以得到双流视频服务，可以实现在会议系统中同时传送和显示多路视频信息。目前业界通常讲的标准双流技术指H.239双流。 2.2 技术原理

根据ITU-T协议规定，H.239双流发送过程如下所示：

图1 H.239实现消息流程

终端设备使用OpenLogicalChannel(extendedVideoCapability)消息请求打开辅流通道，在终端需要发送辅流时使用LogicalChannelActive消息激活辅流通道，发送辅流完成后发送LogicalChannelInactive消息使辅流通道休眠，最后采用CloseLogicalChannel消息关闭辅流通道。 2.3 技术实现

根据H.239双流标准协议，在进行技术实现时终端第一路主流图像通道用来传送主流摄像机采集的活动图像，第二路辅流通道用来传送从PC机上采集的信息或者辅流摄像机采集的活动图像。下面以辅流传送PC信息为例说明如何实现H.239双流功能应用：

把PC机输出的VGA信号直接作为视频源，输入到视讯会议终端上，该PC桌面信号和活动视音频图像同时传送给会议中其他终端。采用此方法可以快速地将类似Powerpoint等制作的幻灯片，打开的Word文档，或其他形式的PC桌面实时传送到会议中的其它会场。如下图所示：

图2 双流功能工程安装示意图

一些厂家在实现H.239双流传送PC信号时，需额外增加双流模块，或是外接其他设备将电脑的VGA输出转换为终端的视频输入。这种方式既增加了用户的投资成本，同时也增加系统复杂度和故障隐患。随着双流应用的广泛，视讯终端设备自带VGA输入、VGA输出接口已经成为大势所趋。 3 双流应用状况

双流已经成为视讯会议的一种基本应用，但是有些厂家设备采用了自己私有的协议实现，导致与其它厂家设备不能进行互通；另外一些厂家产品由于硬件处理能力或者架构设计的，使得产品不能实现H.239双流特性，这种情况往往在老一代产品及在软件终端上比较常见，导致使用其产品系列进行组网时不能实现全网H.239双流功能。

出现以上的情况都会给用户视讯网络投资保护带来严重隐患，如：

1、老产品采用非标的协议实现双流，而新产品采用标准的H.239双流实现，导致新老产品

不能实现双流的互联互通，在这种情况下视讯网络进行扩容时会给用户带来两难的境地，要么替换老产品网络，要么扩容后的新网络不提供双流特性。 2、软件终端一般会用于领导、出差人员的移动办公，或者用于安装在用户量大的三、四级

网络。目前视讯会议都会采用双流技术来共享资料，假设用户安装的软件终端不支持双流功能的话，会使得用户在会议中不能同步观看发言领导的讲解资料，大大地降低会议效果。

4 H3C产品双流实现状况

为了保证自主开发产品之间或者与其它厂家标准协议设备的兼容性，保证用户的投资，H3C开发的视讯产品都能遵循ITU-T视讯会议标准协议。H3C视讯产品的双流协议遵循于标准的H.239协议，并且所有产品都实现了H.239双流协议，可以为用户提供全网H.239功能特性，增强会议效果。以下为H3C视讯产品实现全网H.239双流功能典型组网图：

图3 H3C产品双流实现示意图

MG6060作为H.239双流的发送者把双流发送给ME5000，ME5000把双流直接或者通过级联ME5000间接发送给其它与会终端会场，实现全网H.239双流传递。

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文