
编辑推荐
本版教材系统介绍了多媒体系统的核心技术,在内容上力求选用相对成熟和实用的新技术,在技术原理阐述和解释上力求清楚准确。为保持多媒体技术基础教材内容的系统性和完整性,本教材不免与其他学科教材有交集。此外,教材中包含许多技术背景和技术细节,目的是为更好地理解技术原理,细节也反映理解的深浅。在上述思想指导下,使本教材的篇幅比较大,但还是比国外同类教材的篇幅小很多。
每章均附有练习和思考题,用于辅助读者掌握本章的要点;每章内容的来源都列出了参考文献和站点,读者可用于加深对教材内容的理解和扩大知识面。
作者简介
作者:林福宗
林福宗,清华大学计算机科学与技术系退休教授,1970年毕业于清华大学自动控制系,留校工作直至退休。从1989年开始对多媒体产生兴趣,其后一直从事多媒体技术基础的教学和应用研究,曾编写并在清华大学出版社出版《英汉多媒体技术辞典》、《多媒体技术基础》教材等图书。
目录
第1章多媒体技术概要1
1.1多媒体系统的概念1
1.1.1多媒体是什么1
1.1.2超文本的概念2
1.1.3超媒体的概念3
1.1.4多媒体的层次结构3
1.1.5多媒体的系统结构4
1.2多媒体数据压缩与编码5
1.2.1为什么要压缩5
1.2.2两种类型的压缩6
1.2.3三种类型的编码6
1.2.4压缩与编码6
1.3多媒体与光盘存储器7
1.4多媒体与网络8
1.4.1因特网是什么8
1.4.2万维网是什么8
1.5多媒体标准与国际标准组织9
1.5.1ITU(国际电信联盟)9
1.5.2ISO/IEC(国际标准化组织/国际电工技术委员会)11
1.5.3IEEE(电气和电子工程师学会)12
1.5.4ISOC(因特网协会)12
1.5.5W3C(万维网协会)13
1.5.6ETSI(欧洲电信标准学会)及其他组织15
1.6多媒体内容处理15
1.6.1内容是什么16
1.6.2内容处理是什么18
1.6.3内容标记语言19
1.6.4多媒体内容检索21
练习与思考题22
参考文献和站点23
第一部分多媒体压缩和编码
第2章字符编码与字体27
2.1数的表示法27
2.1.1记数法27
2.1.2计量单位28
2.2英文字符编码28
2.2.1英文字符28
2.2.2标准ASCII29
2.2.3扩展ASCII31
2.3汉字字符编码31
2.3.1汉字字符编码介绍31
2.3.2GB2312标准32
2.3.3GB180302005标准35
2.3.4ISO/IEC10646标准37
2.3.5Unicode标准39
2.3.6Unicode中的CJK汉字编码40
2.3.7UTF编码42
2.4字符显示45
2.4.1点阵字符45
2.4.2矢量字符46
2.5数字字体的概念46
2.5.1字体和字样46
2.5.2字体类型47
2.5.3贝塞尔曲线49
2.6字体的规范与标准51
2.6.1字体规范与标准概述51
2.6.2PostScript字体51
2.6.3TrueType53
2.6.4OpenType53
2.6.5ISO/IECOFF标准53
2.7字符的度量54
2.7.1字符的度量方法54
2.7.2字符的度量单位55
2.7.3字号与磅值55
2.8字体管理与制作工具55
2.8.1字体管理工具56
2.8.2字体制作工具56
2.8.3其他字体工具57
练习与思考题57
参考文献和站点58
第3章数据无损压缩60
3.1数据冗余60
3.1.1冗余概念60
3.1.2决策量61
3.1.3信息量61
3.1.4信息的熵61
3.1.5数据冗余量62
3.2统计编码62
3.2.1香农范诺编码62
3.2.2霍夫曼编码63
3.2.3算术编码64
3.3RLE编码67
3.4词典编码68
3.4.1词典编码的思想68
3.4.2LZ77算法69
3.4.3LZSS算法70
3.4.4LZ78算法71
3.4.5LZW算法73
练习与思考题78
参考文献和站点79
第4章数字语音编码80
4.1声音信号数字化80
4.1.1声音是什么80
4.1.2声音的频率81
4.1.3从模拟过渡到数字81
4.1.4模拟信号与数字信号82
4.1.5声音信号数字化方法82
4.1.6声音质量与数据率83
4.1.7声音质量的MOS评分标准84
4.2语音编码介绍85
4.2.1语音编码方法85
4.2.2语音编码质量86
4.2.3语音编码标准86
4.3波形编码88
4.3.1PCM编码(G.711)88
4.3.2增量调制(DM)93
4.3.3ADPCM编码(G.726)94
4.3.4SB—ADPCM编码(G.722)97
4.4参数编码99
4.4.1参数编码是什么99
4.4.2数字滤波器简介100
4.4.3线性预测编码(LPC)103
4.4.4语音生成模型106
4.4.5LPC声码器107
4.4.6混合激励线性预测(MELP)110
4.5混合编码111
4.5.1混合编码是什么111
4.5.2自适应预测编码(APC)111
4.5.3语音分析合成法(AbS)113
4.5.4码激励线性预测(CELP)114
4.5.5代数码激励线性预测(ACELP)117
4.5.6典型的混合算法和应用118
练习与思考题119
参考文献和站点120
第5章彩色数字图像基础122
5.1视觉系统对颜色的感知122
5.2图像的颜色模型122
5.2.1显示彩色图像用RGB相加混色模型123
5.2.2打印彩色图像用CMY相减混色模型125
5.3图像的三个基本属性126
5.3.1图像分辨率126
5.3.2像素深度与阿尔法(α)通道127
5.3.3真伪彩色和直接色128
5.4图像的种类128
5.4.1矢量图与位图128
5.4.2灰度图与彩色图129
5.5伽马(γ)校正130
5.5.1γ的概念130
5.5.2γ校正131
5.6JPEG压缩编码131
5.6.1JPEG是什么131
5.6.2JPEG算法概要132
5.6.3JPEG算法的计算步骤133
5.6.4JPEG压缩和编码举例139
5.7可缩放矢量图形(SVG)141
5.7.1SVG是什么141
5.7.2SVG文档结构141
5.7.3SVG图形功能143
5.8图像文件格式145
5.8.1BMP文件格式146
5.8.2GIF文件格式146
5.8.3JPEG文件格式147
5.8.4PNG文件格式149
练习与思考题150
参考文献和站点151
……
第6章小波与小波变换153
第7章小波图像编码175
第8章颜色度量体系196
第9章颜色空间转换216
第10章数字电视基础242
第11章MPEG介绍262
第12章MPEG视像285
第13章H.264/AVC与H.265/HEVC307
第14章MPEG声音341
第二部分多媒体光盘存储技术
第15章光盘存储技术369
第16章光盘存储格式386
第17章错误检测和纠正408
第三部分多媒体网络
第18章多媒体网络介绍423
第19章计算机网络的概念与模型442
第20章互联网上的地址464
第21章应用层技术482
第22章传输层技术499
第23章网络层技术513
第24章链路层技术529
第25章物理层技术556
第26章扩谱技术578
第27章多路复用与多址接入596
第28章有线宽带接入611
第29章无线宽带接入638
第30章移动宽带接入654
第31章智能手机与GPS694
第32章多媒体传输技术709
缩略语汇编731
序言
前言
《多媒体技术基础》第3版教材于2008年定稿出版发行。从技术上看,当时许多新技术正处在开发和试验过程中,如H.265/HEVC、移动多媒体等技术,现已趋成熟。从国外的多媒体技术课程来看,教学内容已不再局限于多媒体本身,已经扩展到多媒体系统。
“多媒体系统”这个名称已在科学技术文献中频繁出现,越来越多地把它作为学术杂志的名称、学术会议的名称、教科书的名称,国外许多高等院校把它作为本科生、研究生的课程名称。从多媒体系统角度考虑,本版教材在内容上做了较大幅度的增减,使《多媒体技术基础》更趋完整,可把它理解为“多媒体系统的技术基础”。
一、 教材内容的组织
与第3版相比,《多媒体技术基础》第4版教材变动较大的部分如下:
(1) 增加了字符编码和字体技术,系统介绍了汉字编码的过去和现在,弥补了过去多媒体教材没有字符技术的遗憾。
(2) 参照国外多媒体系统课程的教学大纲,较系统地介绍了多媒体互联网络,包括网络互联和宽带接入因特网的技术基础。宽带接入包括有线宽带、无线宽带和移动宽带接入,技术基础包括有线和无线数据通信学科方面的知识。
(3) 为减少教材篇幅,第3版中的不少内容没有保留,但仍然有参考价值,如介绍HTML和XML的多媒体内容处理语言。
《多媒体技术基础》第4版教材的内容组织成如下三个部分。
第一部分: 多媒体压缩和编码(第2~14章),介绍文字、声音、图像和数字电视媒体的基本知识、压缩技术和编码方法。
第二部分: 多媒体光盘存储技术(第15~17章),介绍CD、DVD、HDDVD和蓝光盘的存储原理和存储格式。
第三部分: 多媒体网络(第18~32章),以多媒体网络应用和服务质量(QoS)为中心,介绍计算机网络、宽带(有线、无线和移动)接入因特网的基础知识。
每章均附有练习和思考题,用于辅助读者掌握本章的要点;每章内容的来源都列出了参考文献和站点,读者可用于加深对教材内容的理解和扩大知识面。
二、 教材的使用建议
本版教材系统介绍了多媒体系统的核心技术,在内容上力求选用相对成熟和实用的新技术,在技术原理阐述和解释上力求清楚准确。
为保持多媒体技术基础教材内容的系统性和完整性,本教材不免与其他学科教材有些交集。此外,教材中包含许多技术背景和技术细节,目的是为更好地理解技术原理。在上述思想指导下,使本教材的篇幅较大。
对本教材的使用,编者还是建议,教师有所教有所不教,学生有所学有所不学。具体建议详见本教材第3版前言。
三、 衷心感谢
《多媒体技术基础》由林福宗主持编写,参加编写工作的教授、专家和高级程序员有黄民德、汪健如、黄国健、林彩荣和张哲等。特别感谢中国科学院院士、清华大学张钹教授长时期的直接指导和各方面给予的实质性支持;感谢我们课题组所有老师和硕博研究生为本教材所做的贡献;感谢使用本教材的师生和技术人员给予我们的热情鼓励和提出的宝贵建议。
林福宗
退休单位: 清华大学计算机科学与技术系
2017年3月1日第3版
前言
本教材第2版于2001年定稿,2002年9月第一次印刷。当时许多新技术还没有出现或正在开发之中,如MPEG4 AVC/H.264(2003年)和XML 1.1(2006年)。有些当时认为比较有前途的技术,现在已经更新,如普遍认为2002年公布的SIP(RFC 3261)比1996年公布的H.323更简单。根据笔者过去几年的科研、教学和观察,教材中的大部分内容都适合当前使用,因此确定第3版教材的修改方针是保留第2版的体系结构、更新部分章节内容和增加新内容。
一、 教材的组织结构
为保持多媒体技术基础课程内容的完整性,第3版教材仍由多媒体压缩和编码、多媒体存储、多媒体传输和多媒体内容处理语言共四个相对独立的部分组成。
第一部分: 多媒体压缩和编码(第2~13章),主要介绍声音、图像和数字电视的基本知识、压缩与编码方法。
第二部分: 多媒体存储(第14~16章),主要介绍CD、DVD、HDDVD和BD(Bluray Disc)光盘的存储原理和多媒体在光盘上的存放格式。
第三部分: 多媒体传输(第17~20章),主要介绍多媒体网络应用、服务质量(QoS)、因特网、TCP/IP协议和多媒体传输的基础知识。
第四部分: 多媒体内容处理语言(第21~22章),主要介绍HTML和XML的基础知识。
为帮助读者加深对基础知识的理解,每章后面都有练习和思考题,但这些题目没有难度,教师可增加一些有一定深度的练习和思考题。
每章后面都有参考文献和站点,列出它们有两个目的: (1)表示在编写本教材过程中访问过相关站点,参考或引用了相关内容; (2)更重要的是为读者提供进一步学习的指南,教师要鼓励学生主动上网查阅。虽然到本书截稿时每个网址都有效,但以后可能会有变化。
二、 教材修改的内容
在第2版教材基础上,第3版教材做了如下修改:
(1) 考虑到视像压缩技术在多媒体产品和各种服务中的重要性,因此增加了一章专门用来介绍MPEG4 AVC/H.264。此外,考虑到光盘存储器在多媒体存储方面的重要性,因此增加了HD DVD和Bluray Disc的内容。
(2) 考虑到网上多媒体应用如火如荼,如IP电视、IP电话、即时通信和多媒体会议,因此重写了第三部分(第17~20章),突出了多媒体传输或称多媒体通信技术。
(3) 考虑到20世纪90年代末期开展的内容处理已成为重要的研究方向,因此在第22章(XML语言)中增加了XML新版本的内容。HTML和XML等标准已经并将继续对日益增长的包括移动通信在内的多媒体网络应用和多媒体电子出版业等行业产生深远的影响。
(4) 为降低教材篇幅,第2版中的部分内容没有保留,如MIDI系统。
(5) XHTML是用XML重写的HTML版本,2008年1月介绍的HTML 5(也称XHTML 5)也是用XML编写的。因此本版教材没有保留第2版中的第23章(XHML语言)。
三、 教材的使用建议
国内许多大学开设多媒体技术课程已有多年,在网上看到许多兄弟院校在教材建设和课程教学方面已有很多很好的经验,在学习和借鉴他们成功经验的基础上,为使用或打算使用本教材的老师和同学提出如下建议供参考。
1. 有所教有所不教
在编写本教材过程中笔者注意到,国外有些信息技术学院从本科到研究生阶段,每个年级都开设内容不同、深浅不同的多媒体课程,既有广度又有深度。考虑到我国目前的多媒体课程教学计划一般只安排一个学期,学时也不多,因此教师可采用有所教有所不教和有所学有所不学的策略。任课教师可根据自己的兴趣和专长、学生已有的基础和专业方向,有的放矢地选择其中的部分内容。对于不作为重点的教学内容,如果有需要,学生自己就会主动去钻研。
2. 教材作为参考书
对于信息技术课程的教材来说,写进正式出版的教材的内容通常是比较成熟的,即使是刚刚出版的教材,其内容也不一定新。据观察,许多大学的多媒体课程内容是当前最新的技术,教师都有自己编写的教学提纲和材料,而把正式出版的教科书列为必要的参考材料加以推荐。这不是说正式出版的教材不重要,而是通过教授新技术来带动基本原理的学习。其结果是学的内容先进,学的基础扎实。
本教材共22章,比较系统地介绍多媒体技术。笔者有意使本教材覆盖多方面的重要技术,努力选取相对比较新的和实用的技术,力图对多媒体技术原理解释清楚和准确。因此可把本教材作为多媒体技术课程的起点,在此基础上教授最新的技术。
3. 用课程设计驱动
凡任课教师都很清楚,教一本书不等于开设一门课程。为配合我校加强实践教学的教学改革,更好地激励学生学习基础理论和技能的积极性,清华大学出版社出版了经过多年实际使用的《多媒体技术课程设计与学习辅导》。学生对课程设计反响强烈,由于严格实施“允许参考不许抄袭”的措施,学生普遍认为真正学到了知识。
辅助教材拟了多个难易程度不同的设计题目,每个题目都有原理介绍和示例。为便于学生撰写和教师评估课程设计报告,规范了课程设计报告的格式。由于设计题目的难度不大,任课教师可根据情况,从中选择一个或两个题目,也可在辅助教材所列的“参考选题”或其他参考选题中增加或更改设计题目。课程设计要求使用MATLAB语言来实现,因为MATLAB是攻读学位的大学生、硕士生和博士生必须掌握的基本工具。
4. 用评估系统引导
评估系统是一个无形的指挥棒,可以引导学生的学习方向。教授本教材是多媒体技术基础课程中的一个部分,而课程设计是课程的另一个重要组成部分。因此笔者的课程评估采用了“基础知识书面开卷考试约占50%,课程设计约占50%”的方法,但对不同专业的学生可以在评估标准或在所占分数的比例上加以调整。
四、 关于中文术语
随着信息科学和技术日新月异,新术语不断涌现,同时也给一些老术语赋予了新的含义,使用准确的术语有利于信息的交流。为使本教材中的中文术语尽量准确,笔者查阅了许多著名的英文词典,阅读了许多相关的科学和技术文献,参考了全国科学技术名词审定委员会2002年公布的《计算机科学技术名词》。
在本教材中,有几个常用术语有必要在此说明: (1)用“视频”作为video的释义是物理概念上的错误。video的真实含义是由一系列图像组成的(电)视(图)像,确切的中文译名应该是“视像”。“视频(video frequency)” 是电视信号频率的简称,在ITUR BT.601标准中,频率范围是0~6.75MHz。(2)不论什么场合,用“音频”作为audio的释义也是物理概念上的错误。audio是指人的听觉系统可感知的声音,是声音(sound)的同义词,作名词时的确切中文术语应该是“声音”。“音频(audio frequency)”是声音信号频率的简称,频率范围通常认为是15~20 000Hz。(3)“分组交换(packet switching)”是一个不确切的中文术语。“packet”的含义是一个由收、发送地址和实际数据组成的“数据包”,确切的术语应该是“包交换”。(4)“组播(multicast)”是一个容易被误认为“收发关系颠倒”的术语,本教材使用“多目标广播”。尽管我们习惯使用2~3个字构成的术语,但“多目标广播”是顾名就可思义的术语,即一个发送者向多个接收者(多目标)传送(广播)数据的意思。
五、 衷心感谢
特别感谢中国科学院院士张钹教授多年来的直接指导和各方面给予的实质性支持;衷心感谢我们课题组(智能多媒体组)所有老师和硕博研究生为本教材所做的贡献;衷心感谢使用本教材的老师和学生给予我们的热情鼓励和提出的宝贵建议。
参加本教材编写工作的有林彩荣、朱高建、朱高东、黄民德和谢霄艳,他们在多媒体语言、程序设计、多媒体通信、教育技术、软件评估、科研和教学方面都有各自的专长。
林福宗
清华大学计算机科学与技术系
智能技术与系统国家重点实验室
2008年10月15日
文摘
第5章彩色数字图像基础
图像是多媒体中携带信息的极其重要的媒体,有人发表过统计资料,认为人们获取的信息的70%来自视觉系统。由于图像数字化之后的数据量非常大,在因特网上传输时很费时间,在盘上存储时很占“地盘”,因此就必须要对图像数据进行压缩。压缩的目的就是要满足存储容量和传输带宽的要求,而付出的代价则是大量的计算。几十年来,许多科技工作者一直在孜孜不倦地寻找更有效的方法,用比较少的数据量表达原始的图像。
图像数据压缩主要是根据下面两个基本事实来实现的。一个事实是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据可减少数据量;另一个事实是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,也就达到压缩数据的目的。利用前一个事实的压缩技术是无损数据压缩技术,利用后一个事实的压缩技术是有损数据压缩技术。实际的图像压缩是综合使用各种有损和无损数据压缩技术来实现的。
本章将介绍表示数字彩色图像所需要的基本知识、使用得相当广泛的JPEG压缩标准和图像文件的存储格式。在介绍过程中,要涉及有关颜色的度量和颜色空间的转换问题,这些比较深入的问题将在第8章“颜色度量体系”和第9章“颜色空间转换”中介绍。
5.1视觉系统对颜色的感知
颜色是视觉系统对可见光的感知结果。可见光是波长在380~780nm之间的电磁波,我们看到的大多数光不是一种波长的光,而是由许多不同波长的光组合成的。人们在研究眼睛对颜色的感知过程中普遍认为,人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此颜色只存在于眼睛和大脑。在计算机图像处理中,杆状细胞还没有扮演什么角色。
人的视觉系统对颜色的感知可归纳出如下几个特性:
(1) 眼睛本质上是一个照相机。视网膜(human retina)通过神经元来感知外部世界的颜色,每个神经元是一个对颜色敏感的锥体(cone)或是一个对颜色不敏感的杆状体(rod)。
(2) 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同。这就意味着,人们可以使用数字图像处理技术来降低表示图像的数据量,而不使人感到图像质量有明显下降。
(3) 自然界中的任何一种颜色都可以由R、G、B这三种颜色值之和来确定,它们构成一个三维的RGB矢量空间。这就是说,R、G、B的数值不同,混合得到的颜色就不同,也就是光波的波长不同。
5.2图像的颜色模型
在文献和教材中,用于描述颜色的常用词有两个: 颜色模型和颜色空间。颜色模型(color model)是用数值指定颜色的方法,颜色空间(color space)是用空间中点的集合描述颜色的方法,它们互为同义词。RGB和CMYK是计算机系统使用最广泛的两个颜色模型。
5.2.1显示彩色图像用RGB相加混色模型
一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,并且使用RGB相加混色模型。电视机和计算机显示器使用的阴极射线管(Cathode Ray Tube,CRT)就是一个有源物体。CRT使用3个电子枪分别产生红(red)、绿(green)和蓝(blue)三种波长的光,并以各种不同的相对强度综合起来产生颜色,如图51(a)所示。虽然当今的电视机和计算机显示器几乎都使用彩色LED显示器,但生成颜色的原理与阴极射线管(CRT)类似。
组合这三种光波来产生特定颜色的方法叫作相加混色法(additive color mixture),因为这种相加混色是利用R、G和B颜色分量产生颜色,故称为RGB相加混色模型。相加混色是计算机应用中定义颜色的基本方法。
从理论上讲,任何一种颜色都可用三种基本颜色按不同的比例混合得到。三种颜色的光强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同。没有光到达眼睛,就是一片漆黑。当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜色。某一种颜色和这三种颜色之间的关系可用下面的式子来描述:
颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)
当三基色等量相加时,得到白色;等量的红绿相加而蓝为0时得到黄色;等量的红蓝相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。这些三基色相加的结果如图51(b)所示。
图51颜色生成原理
一幅彩色图像可以看成是由许多的点组成的,如图52所示。图像中的单个点称为像素(pixel),每个像素都有一个值,称为像素值,它表示特定颜色的强度。图52一幅图像由许多像素组成
一个像素值往往用R、G、B三个分量表示。如果每个像素的三个颜色分量都用二进制的1位来表示,那么每个颜色的分量只有“1”和“0”这两个值,这也就是说,每个颜色分量的强度是100%或者是0%。在这种情况下,每个像素所显示的颜色是8种可能的颜色之一,见表51。
对于标准的电视图形阵列(Video Graphics Array,VGA)适配卡的16种标准颜色,其对应的R、G、B值见表52。在Microsoft公司的Windows操作系统中,用代码0~15表示……
在HSL模型中,H定义颜色的波长,称为色调;S定义颜色的强度(intensity),表示颜色的深浅程度,称为饱和度;L定义掺入的白光量,称为亮度。用HSL表示颜色的重要性,是因为它比较容易为画家所理解。若把S和L的值设置为1,当改变H时就是选择不同的纯颜色;减小饱和度S时,就可体现掺入白光的效果;降低亮度时,颜色就暗,相当于掺入黑色。因此在Windows附带的画图软件也用了HSL表示法。表5216色VGA调色板的值代码RGBHSL相加色000016000黑(Black)10012816024060蓝(Blue)2012808024060绿(Green)3012812812024060青(Cyan)412800024060红(Red)5128012820024060品红(Magenta)612812804024060褐色(Dark Yellow)71921921921600180白(Light Gray)81281281281600120深灰(Dark Gray)900255160240120淡蓝(Light Blue)100255080240120淡绿(Light Green)110255255120240120淡青(Light Cyan)12255000240120淡红(Light Red)132550255200240120淡品红(Light Magenta)14255255040240120黄(Yellow)152552552551600240高亮白(Bright White)5.2.2打印彩色图像用CMY相减混色模型
一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用CMY相减混色模型。用彩色墨水或颜料进行混合,绘制的图画就是一种无源物体,用这种方法生成的颜色称为相减色。从理论上说,任何一种颜色都可以用三种基本颜色的颜料按一定比例混合得到。这三种颜色是青色(cyan)、图53相减混色
品红(magenta)和黄色(yellow),通常写成CMY,称为CMY模型。用这种方法产生的颜色之所以称为相减色,是因为它减少了为视觉系统识别颜色所需要的反射光。
在相减混色中,当三基色等量相减时得到黑色;等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。三基色相减结果如图53所示。
彩色打印机采用的就是这种原理,印刷彩色图片也是采用这种原理。按每个像素每种颜色用1位表示,相减法产生的8种颜色如表53所示。由于彩色墨水和颜料的化学特性,用等量的三基色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色(black ink),所以CMY又写成CMYK。表53相减色C(青色)M(品红)Y(黄色)相减色000白001黄010品红011红100青101绿110蓝111黑相加色与相减色之间有一个直接关系,见表54所示。利用它们之间的关系,可以把显示的颜色转换成输出打印的颜色。相加混色和相减混色之间成对出现互补色。例如,当RGB为1∶1∶1时,在相加混色中产生白色,而CMY为1∶1∶1时,在相减混色中产生黑色。从另一个角度也可以看出它们的互补性,例如,RGB为0∶1∶0,对应CMY为1∶0∶1。续表表54相加色与相减色的关系相加混色(RGB)相减混色(CMY)生成的颜色000111黑001110蓝010101绿011100青100011红101010品红110001黄111000白5.3图像的三个基本属性
属性是标识和描述被管理对象的特性,图像的属性包含分辨率、像素深度、真/伪彩色、图像的表示法和种类等,本节将介绍前面三个特性。
本版教材系统介绍了多媒体系统的核心技术,在内容上力求选用相对成熟和实用的新技术,在技术原理阐述和解释上力求清楚准确。为保持多媒体技术基础教材内容的系统性和完整性,本教材不免与其他学科教材有交集。此外,教材中包含许多技术背景和技术细节,目的是为更好地理解技术原理,细节也反映理解的深浅。在上述思想指导下,使本教材的篇幅比较大,但还是比国外同类教材的篇幅小很多。
每章均附有练习和思考题,用于辅助读者掌握本章的要点;每章内容的来源都列出了参考文献和站点,读者可用于加深对教材内容的理解和扩大知识面。
作者简介
作者:林福宗
林福宗,清华大学计算机科学与技术系退休教授,1970年毕业于清华大学自动控制系,留校工作直至退休。从1989年开始对多媒体产生兴趣,其后一直从事多媒体技术基础的教学和应用研究,曾编写并在清华大学出版社出版《英汉多媒体技术辞典》、《多媒体技术基础》教材等图书。
目录
第1章多媒体技术概要1
1.1多媒体系统的概念1
1.1.1多媒体是什么1
1.1.2超文本的概念2
1.1.3超媒体的概念3
1.1.4多媒体的层次结构3
1.1.5多媒体的系统结构4
1.2多媒体数据压缩与编码5
1.2.1为什么要压缩5
1.2.2两种类型的压缩6
1.2.3三种类型的编码6
1.2.4压缩与编码6
1.3多媒体与光盘存储器7
1.4多媒体与网络8
1.4.1因特网是什么8
1.4.2万维网是什么8
1.5多媒体标准与国际标准组织9
1.5.1ITU(国际电信联盟)9
1.5.2ISO/IEC(国际标准化组织/国际电工技术委员会)11
1.5.3IEEE(电气和电子工程师学会)12
1.5.4ISOC(因特网协会)12
1.5.5W3C(万维网协会)13
1.5.6ETSI(欧洲电信标准学会)及其他组织15
1.6多媒体内容处理15
1.6.1内容是什么16
1.6.2内容处理是什么18
1.6.3内容标记语言19
1.6.4多媒体内容检索21
练习与思考题22
参考文献和站点23
第一部分多媒体压缩和编码
第2章字符编码与字体27
2.1数的表示法27
2.1.1记数法27
2.1.2计量单位28
2.2英文字符编码28
2.2.1英文字符28
2.2.2标准ASCII29
2.2.3扩展ASCII31
2.3汉字字符编码31
2.3.1汉字字符编码介绍31
2.3.2GB2312标准32
2.3.3GB180302005标准35
2.3.4ISO/IEC10646标准37
2.3.5Unicode标准39
2.3.6Unicode中的CJK汉字编码40
2.3.7UTF编码42
2.4字符显示45
2.4.1点阵字符45
2.4.2矢量字符46
2.5数字字体的概念46
2.5.1字体和字样46
2.5.2字体类型47
2.5.3贝塞尔曲线49
2.6字体的规范与标准51
2.6.1字体规范与标准概述51
2.6.2PostScript字体51
2.6.3TrueType53
2.6.4OpenType53
2.6.5ISO/IECOFF标准53
2.7字符的度量54
2.7.1字符的度量方法54
2.7.2字符的度量单位55
2.7.3字号与磅值55
2.8字体管理与制作工具55
2.8.1字体管理工具56
2.8.2字体制作工具56
2.8.3其他字体工具57
练习与思考题57
参考文献和站点58
第3章数据无损压缩60
3.1数据冗余60
3.1.1冗余概念60
3.1.2决策量61
3.1.3信息量61
3.1.4信息的熵61
3.1.5数据冗余量62
3.2统计编码62
3.2.1香农范诺编码62
3.2.2霍夫曼编码63
3.2.3算术编码64
3.3RLE编码67
3.4词典编码68
3.4.1词典编码的思想68
3.4.2LZ77算法69
3.4.3LZSS算法70
3.4.4LZ78算法71
3.4.5LZW算法73
练习与思考题78
参考文献和站点79
第4章数字语音编码80
4.1声音信号数字化80
4.1.1声音是什么80
4.1.2声音的频率81
4.1.3从模拟过渡到数字81
4.1.4模拟信号与数字信号82
4.1.5声音信号数字化方法82
4.1.6声音质量与数据率83
4.1.7声音质量的MOS评分标准84
4.2语音编码介绍85
4.2.1语音编码方法85
4.2.2语音编码质量86
4.2.3语音编码标准86
4.3波形编码88
4.3.1PCM编码(G.711)88
4.3.2增量调制(DM)93
4.3.3ADPCM编码(G.726)94
4.3.4SB—ADPCM编码(G.722)97
4.4参数编码99
4.4.1参数编码是什么99
4.4.2数字滤波器简介100
4.4.3线性预测编码(LPC)103
4.4.4语音生成模型106
4.4.5LPC声码器107
4.4.6混合激励线性预测(MELP)110
4.5混合编码111
4.5.1混合编码是什么111
4.5.2自适应预测编码(APC)111
4.5.3语音分析合成法(AbS)113
4.5.4码激励线性预测(CELP)114
4.5.5代数码激励线性预测(ACELP)117
4.5.6典型的混合算法和应用118
练习与思考题119
参考文献和站点120
第5章彩色数字图像基础122
5.1视觉系统对颜色的感知122
5.2图像的颜色模型122
5.2.1显示彩色图像用RGB相加混色模型123
5.2.2打印彩色图像用CMY相减混色模型125
5.3图像的三个基本属性126
5.3.1图像分辨率126
5.3.2像素深度与阿尔法(α)通道127
5.3.3真伪彩色和直接色128
5.4图像的种类128
5.4.1矢量图与位图128
5.4.2灰度图与彩色图129
5.5伽马(γ)校正130
5.5.1γ的概念130
5.5.2γ校正131
5.6JPEG压缩编码131
5.6.1JPEG是什么131
5.6.2JPEG算法概要132
5.6.3JPEG算法的计算步骤133
5.6.4JPEG压缩和编码举例139
5.7可缩放矢量图形(SVG)141
5.7.1SVG是什么141
5.7.2SVG文档结构141
5.7.3SVG图形功能143
5.8图像文件格式145
5.8.1BMP文件格式146
5.8.2GIF文件格式146
5.8.3JPEG文件格式147
5.8.4PNG文件格式149
练习与思考题150
参考文献和站点151
……
第6章小波与小波变换153
第7章小波图像编码175
第8章颜色度量体系196
第9章颜色空间转换216
第10章数字电视基础242
第11章MPEG介绍262
第12章MPEG视像285
第13章H.264/AVC与H.265/HEVC307
第14章MPEG声音341
第二部分多媒体光盘存储技术
第15章光盘存储技术369
第16章光盘存储格式386
第17章错误检测和纠正408
第三部分多媒体网络
第18章多媒体网络介绍423
第19章计算机网络的概念与模型442
第20章互联网上的地址464
第21章应用层技术482
第22章传输层技术499
第23章网络层技术513
第24章链路层技术529
第25章物理层技术556
第26章扩谱技术578
第27章多路复用与多址接入596
第28章有线宽带接入611
第29章无线宽带接入638
第30章移动宽带接入654
第31章智能手机与GPS694
第32章多媒体传输技术709
缩略语汇编731
序言
前言
《多媒体技术基础》第3版教材于2008年定稿出版发行。从技术上看,当时许多新技术正处在开发和试验过程中,如H.265/HEVC、移动多媒体等技术,现已趋成熟。从国外的多媒体技术课程来看,教学内容已不再局限于多媒体本身,已经扩展到多媒体系统。
“多媒体系统”这个名称已在科学技术文献中频繁出现,越来越多地把它作为学术杂志的名称、学术会议的名称、教科书的名称,国外许多高等院校把它作为本科生、研究生的课程名称。从多媒体系统角度考虑,本版教材在内容上做了较大幅度的增减,使《多媒体技术基础》更趋完整,可把它理解为“多媒体系统的技术基础”。
一、 教材内容的组织
与第3版相比,《多媒体技术基础》第4版教材变动较大的部分如下:
(1) 增加了字符编码和字体技术,系统介绍了汉字编码的过去和现在,弥补了过去多媒体教材没有字符技术的遗憾。
(2) 参照国外多媒体系统课程的教学大纲,较系统地介绍了多媒体互联网络,包括网络互联和宽带接入因特网的技术基础。宽带接入包括有线宽带、无线宽带和移动宽带接入,技术基础包括有线和无线数据通信学科方面的知识。
(3) 为减少教材篇幅,第3版中的不少内容没有保留,但仍然有参考价值,如介绍HTML和XML的多媒体内容处理语言。
《多媒体技术基础》第4版教材的内容组织成如下三个部分。
第一部分: 多媒体压缩和编码(第2~14章),介绍文字、声音、图像和数字电视媒体的基本知识、压缩技术和编码方法。
第二部分: 多媒体光盘存储技术(第15~17章),介绍CD、DVD、HDDVD和蓝光盘的存储原理和存储格式。
第三部分: 多媒体网络(第18~32章),以多媒体网络应用和服务质量(QoS)为中心,介绍计算机网络、宽带(有线、无线和移动)接入因特网的基础知识。
每章均附有练习和思考题,用于辅助读者掌握本章的要点;每章内容的来源都列出了参考文献和站点,读者可用于加深对教材内容的理解和扩大知识面。
二、 教材的使用建议
本版教材系统介绍了多媒体系统的核心技术,在内容上力求选用相对成熟和实用的新技术,在技术原理阐述和解释上力求清楚准确。
为保持多媒体技术基础教材内容的系统性和完整性,本教材不免与其他学科教材有些交集。此外,教材中包含许多技术背景和技术细节,目的是为更好地理解技术原理。在上述思想指导下,使本教材的篇幅较大。
对本教材的使用,编者还是建议,教师有所教有所不教,学生有所学有所不学。具体建议详见本教材第3版前言。
三、 衷心感谢
《多媒体技术基础》由林福宗主持编写,参加编写工作的教授、专家和高级程序员有黄民德、汪健如、黄国健、林彩荣和张哲等。特别感谢中国科学院院士、清华大学张钹教授长时期的直接指导和各方面给予的实质性支持;感谢我们课题组所有老师和硕博研究生为本教材所做的贡献;感谢使用本教材的师生和技术人员给予我们的热情鼓励和提出的宝贵建议。
林福宗
退休单位: 清华大学计算机科学与技术系
2017年3月1日第3版
前言
本教材第2版于2001年定稿,2002年9月第一次印刷。当时许多新技术还没有出现或正在开发之中,如MPEG4 AVC/H.264(2003年)和XML 1.1(2006年)。有些当时认为比较有前途的技术,现在已经更新,如普遍认为2002年公布的SIP(RFC 3261)比1996年公布的H.323更简单。根据笔者过去几年的科研、教学和观察,教材中的大部分内容都适合当前使用,因此确定第3版教材的修改方针是保留第2版的体系结构、更新部分章节内容和增加新内容。
一、 教材的组织结构
为保持多媒体技术基础课程内容的完整性,第3版教材仍由多媒体压缩和编码、多媒体存储、多媒体传输和多媒体内容处理语言共四个相对独立的部分组成。
第一部分: 多媒体压缩和编码(第2~13章),主要介绍声音、图像和数字电视的基本知识、压缩与编码方法。
第二部分: 多媒体存储(第14~16章),主要介绍CD、DVD、HDDVD和BD(Bluray Disc)光盘的存储原理和多媒体在光盘上的存放格式。
第三部分: 多媒体传输(第17~20章),主要介绍多媒体网络应用、服务质量(QoS)、因特网、TCP/IP协议和多媒体传输的基础知识。
第四部分: 多媒体内容处理语言(第21~22章),主要介绍HTML和XML的基础知识。
为帮助读者加深对基础知识的理解,每章后面都有练习和思考题,但这些题目没有难度,教师可增加一些有一定深度的练习和思考题。
每章后面都有参考文献和站点,列出它们有两个目的: (1)表示在编写本教材过程中访问过相关站点,参考或引用了相关内容; (2)更重要的是为读者提供进一步学习的指南,教师要鼓励学生主动上网查阅。虽然到本书截稿时每个网址都有效,但以后可能会有变化。
二、 教材修改的内容
在第2版教材基础上,第3版教材做了如下修改:
(1) 考虑到视像压缩技术在多媒体产品和各种服务中的重要性,因此增加了一章专门用来介绍MPEG4 AVC/H.264。此外,考虑到光盘存储器在多媒体存储方面的重要性,因此增加了HD DVD和Bluray Disc的内容。
(2) 考虑到网上多媒体应用如火如荼,如IP电视、IP电话、即时通信和多媒体会议,因此重写了第三部分(第17~20章),突出了多媒体传输或称多媒体通信技术。
(3) 考虑到20世纪90年代末期开展的内容处理已成为重要的研究方向,因此在第22章(XML语言)中增加了XML新版本的内容。HTML和XML等标准已经并将继续对日益增长的包括移动通信在内的多媒体网络应用和多媒体电子出版业等行业产生深远的影响。
(4) 为降低教材篇幅,第2版中的部分内容没有保留,如MIDI系统。
(5) XHTML是用XML重写的HTML版本,2008年1月介绍的HTML 5(也称XHTML 5)也是用XML编写的。因此本版教材没有保留第2版中的第23章(XHML语言)。
三、 教材的使用建议
国内许多大学开设多媒体技术课程已有多年,在网上看到许多兄弟院校在教材建设和课程教学方面已有很多很好的经验,在学习和借鉴他们成功经验的基础上,为使用或打算使用本教材的老师和同学提出如下建议供参考。
1. 有所教有所不教
在编写本教材过程中笔者注意到,国外有些信息技术学院从本科到研究生阶段,每个年级都开设内容不同、深浅不同的多媒体课程,既有广度又有深度。考虑到我国目前的多媒体课程教学计划一般只安排一个学期,学时也不多,因此教师可采用有所教有所不教和有所学有所不学的策略。任课教师可根据自己的兴趣和专长、学生已有的基础和专业方向,有的放矢地选择其中的部分内容。对于不作为重点的教学内容,如果有需要,学生自己就会主动去钻研。
2. 教材作为参考书
对于信息技术课程的教材来说,写进正式出版的教材的内容通常是比较成熟的,即使是刚刚出版的教材,其内容也不一定新。据观察,许多大学的多媒体课程内容是当前最新的技术,教师都有自己编写的教学提纲和材料,而把正式出版的教科书列为必要的参考材料加以推荐。这不是说正式出版的教材不重要,而是通过教授新技术来带动基本原理的学习。其结果是学的内容先进,学的基础扎实。
本教材共22章,比较系统地介绍多媒体技术。笔者有意使本教材覆盖多方面的重要技术,努力选取相对比较新的和实用的技术,力图对多媒体技术原理解释清楚和准确。因此可把本教材作为多媒体技术课程的起点,在此基础上教授最新的技术。
3. 用课程设计驱动
凡任课教师都很清楚,教一本书不等于开设一门课程。为配合我校加强实践教学的教学改革,更好地激励学生学习基础理论和技能的积极性,清华大学出版社出版了经过多年实际使用的《多媒体技术课程设计与学习辅导》。学生对课程设计反响强烈,由于严格实施“允许参考不许抄袭”的措施,学生普遍认为真正学到了知识。
辅助教材拟了多个难易程度不同的设计题目,每个题目都有原理介绍和示例。为便于学生撰写和教师评估课程设计报告,规范了课程设计报告的格式。由于设计题目的难度不大,任课教师可根据情况,从中选择一个或两个题目,也可在辅助教材所列的“参考选题”或其他参考选题中增加或更改设计题目。课程设计要求使用MATLAB语言来实现,因为MATLAB是攻读学位的大学生、硕士生和博士生必须掌握的基本工具。
4. 用评估系统引导
评估系统是一个无形的指挥棒,可以引导学生的学习方向。教授本教材是多媒体技术基础课程中的一个部分,而课程设计是课程的另一个重要组成部分。因此笔者的课程评估采用了“基础知识书面开卷考试约占50%,课程设计约占50%”的方法,但对不同专业的学生可以在评估标准或在所占分数的比例上加以调整。
四、 关于中文术语
随着信息科学和技术日新月异,新术语不断涌现,同时也给一些老术语赋予了新的含义,使用准确的术语有利于信息的交流。为使本教材中的中文术语尽量准确,笔者查阅了许多著名的英文词典,阅读了许多相关的科学和技术文献,参考了全国科学技术名词审定委员会2002年公布的《计算机科学技术名词》。
在本教材中,有几个常用术语有必要在此说明: (1)用“视频”作为video的释义是物理概念上的错误。video的真实含义是由一系列图像组成的(电)视(图)像,确切的中文译名应该是“视像”。“视频(video frequency)” 是电视信号频率的简称,在ITUR BT.601标准中,频率范围是0~6.75MHz。(2)不论什么场合,用“音频”作为audio的释义也是物理概念上的错误。audio是指人的听觉系统可感知的声音,是声音(sound)的同义词,作名词时的确切中文术语应该是“声音”。“音频(audio frequency)”是声音信号频率的简称,频率范围通常认为是15~20 000Hz。(3)“分组交换(packet switching)”是一个不确切的中文术语。“packet”的含义是一个由收、发送地址和实际数据组成的“数据包”,确切的术语应该是“包交换”。(4)“组播(multicast)”是一个容易被误认为“收发关系颠倒”的术语,本教材使用“多目标广播”。尽管我们习惯使用2~3个字构成的术语,但“多目标广播”是顾名就可思义的术语,即一个发送者向多个接收者(多目标)传送(广播)数据的意思。
五、 衷心感谢
特别感谢中国科学院院士张钹教授多年来的直接指导和各方面给予的实质性支持;衷心感谢我们课题组(智能多媒体组)所有老师和硕博研究生为本教材所做的贡献;衷心感谢使用本教材的老师和学生给予我们的热情鼓励和提出的宝贵建议。
参加本教材编写工作的有林彩荣、朱高建、朱高东、黄民德和谢霄艳,他们在多媒体语言、程序设计、多媒体通信、教育技术、软件评估、科研和教学方面都有各自的专长。
林福宗
清华大学计算机科学与技术系
智能技术与系统国家重点实验室
2008年10月15日
文摘
第5章彩色数字图像基础
图像是多媒体中携带信息的极其重要的媒体,有人发表过统计资料,认为人们获取的信息的70%来自视觉系统。由于图像数字化之后的数据量非常大,在因特网上传输时很费时间,在盘上存储时很占“地盘”,因此就必须要对图像数据进行压缩。压缩的目的就是要满足存储容量和传输带宽的要求,而付出的代价则是大量的计算。几十年来,许多科技工作者一直在孜孜不倦地寻找更有效的方法,用比较少的数据量表达原始的图像。
图像数据压缩主要是根据下面两个基本事实来实现的。一个事实是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据可减少数据量;另一个事实是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,也就达到压缩数据的目的。利用前一个事实的压缩技术是无损数据压缩技术,利用后一个事实的压缩技术是有损数据压缩技术。实际的图像压缩是综合使用各种有损和无损数据压缩技术来实现的。
本章将介绍表示数字彩色图像所需要的基本知识、使用得相当广泛的JPEG压缩标准和图像文件的存储格式。在介绍过程中,要涉及有关颜色的度量和颜色空间的转换问题,这些比较深入的问题将在第8章“颜色度量体系”和第9章“颜色空间转换”中介绍。
5.1视觉系统对颜色的感知
颜色是视觉系统对可见光的感知结果。可见光是波长在380~780nm之间的电磁波,我们看到的大多数光不是一种波长的光,而是由许多不同波长的光组合成的。人们在研究眼睛对颜色的感知过程中普遍认为,人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此颜色只存在于眼睛和大脑。在计算机图像处理中,杆状细胞还没有扮演什么角色。
人的视觉系统对颜色的感知可归纳出如下几个特性:
(1) 眼睛本质上是一个照相机。视网膜(human retina)通过神经元来感知外部世界的颜色,每个神经元是一个对颜色敏感的锥体(cone)或是一个对颜色不敏感的杆状体(rod)。
(2) 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同。这就意味着,人们可以使用数字图像处理技术来降低表示图像的数据量,而不使人感到图像质量有明显下降。
(3) 自然界中的任何一种颜色都可以由R、G、B这三种颜色值之和来确定,它们构成一个三维的RGB矢量空间。这就是说,R、G、B的数值不同,混合得到的颜色就不同,也就是光波的波长不同。
5.2图像的颜色模型
在文献和教材中,用于描述颜色的常用词有两个: 颜色模型和颜色空间。颜色模型(color model)是用数值指定颜色的方法,颜色空间(color space)是用空间中点的集合描述颜色的方法,它们互为同义词。RGB和CMYK是计算机系统使用最广泛的两个颜色模型。
5.2.1显示彩色图像用RGB相加混色模型
一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,并且使用RGB相加混色模型。电视机和计算机显示器使用的阴极射线管(Cathode Ray Tube,CRT)就是一个有源物体。CRT使用3个电子枪分别产生红(red)、绿(green)和蓝(blue)三种波长的光,并以各种不同的相对强度综合起来产生颜色,如图51(a)所示。虽然当今的电视机和计算机显示器几乎都使用彩色LED显示器,但生成颜色的原理与阴极射线管(CRT)类似。
组合这三种光波来产生特定颜色的方法叫作相加混色法(additive color mixture),因为这种相加混色是利用R、G和B颜色分量产生颜色,故称为RGB相加混色模型。相加混色是计算机应用中定义颜色的基本方法。
从理论上讲,任何一种颜色都可用三种基本颜色按不同的比例混合得到。三种颜色的光强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同。没有光到达眼睛,就是一片漆黑。当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜色。某一种颜色和这三种颜色之间的关系可用下面的式子来描述:
颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)
当三基色等量相加时,得到白色;等量的红绿相加而蓝为0时得到黄色;等量的红蓝相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。这些三基色相加的结果如图51(b)所示。
图51颜色生成原理
一幅彩色图像可以看成是由许多的点组成的,如图52所示。图像中的单个点称为像素(pixel),每个像素都有一个值,称为像素值,它表示特定颜色的强度。图52一幅图像由许多像素组成
一个像素值往往用R、G、B三个分量表示。如果每个像素的三个颜色分量都用二进制的1位来表示,那么每个颜色的分量只有“1”和“0”这两个值,这也就是说,每个颜色分量的强度是100%或者是0%。在这种情况下,每个像素所显示的颜色是8种可能的颜色之一,见表51。
对于标准的电视图形阵列(Video Graphics Array,VGA)适配卡的16种标准颜色,其对应的R、G、B值见表52。在Microsoft公司的Windows操作系统中,用代码0~15表示……
在HSL模型中,H定义颜色的波长,称为色调;S定义颜色的强度(intensity),表示颜色的深浅程度,称为饱和度;L定义掺入的白光量,称为亮度。用HSL表示颜色的重要性,是因为它比较容易为画家所理解。若把S和L的值设置为1,当改变H时就是选择不同的纯颜色;减小饱和度S时,就可体现掺入白光的效果;降低亮度时,颜色就暗,相当于掺入黑色。因此在Windows附带的画图软件也用了HSL表示法。表5216色VGA调色板的值代码RGBHSL相加色000016000黑(Black)10012816024060蓝(Blue)2012808024060绿(Green)3012812812024060青(Cyan)412800024060红(Red)5128012820024060品红(Magenta)612812804024060褐色(Dark Yellow)71921921921600180白(Light Gray)81281281281600120深灰(Dark Gray)900255160240120淡蓝(Light Blue)100255080240120淡绿(Light Green)110255255120240120淡青(Light Cyan)12255000240120淡红(Light Red)132550255200240120淡品红(Light Magenta)14255255040240120黄(Yellow)152552552551600240高亮白(Bright White)5.2.2打印彩色图像用CMY相减混色模型
一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用CMY相减混色模型。用彩色墨水或颜料进行混合,绘制的图画就是一种无源物体,用这种方法生成的颜色称为相减色。从理论上说,任何一种颜色都可以用三种基本颜色的颜料按一定比例混合得到。这三种颜色是青色(cyan)、图53相减混色
品红(magenta)和黄色(yellow),通常写成CMY,称为CMY模型。用这种方法产生的颜色之所以称为相减色,是因为它减少了为视觉系统识别颜色所需要的反射光。
在相减混色中,当三基色等量相减时得到黑色;等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。三基色相减结果如图53所示。
彩色打印机采用的就是这种原理,印刷彩色图片也是采用这种原理。按每个像素每种颜色用1位表示,相减法产生的8种颜色如表53所示。由于彩色墨水和颜料的化学特性,用等量的三基色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色(black ink),所以CMY又写成CMYK。表53相减色C(青色)M(品红)Y(黄色)相减色000白001黄010品红011红100青101绿110蓝111黑相加色与相减色之间有一个直接关系,见表54所示。利用它们之间的关系,可以把显示的颜色转换成输出打印的颜色。相加混色和相减混色之间成对出现互补色。例如,当RGB为1∶1∶1时,在相加混色中产生白色,而CMY为1∶1∶1时,在相减混色中产生黑色。从另一个角度也可以看出它们的互补性,例如,RGB为0∶1∶0,对应CMY为1∶0∶1。续表表54相加色与相减色的关系相加混色(RGB)相减混色(CMY)生成的颜色000111黑001110蓝010101绿011100青100011红101010品红110001黄111000白5.3图像的三个基本属性
属性是标识和描述被管理对象的特性,图像的属性包含分辨率、像素深度、真/伪彩色、图像的表示法和种类等,本节将介绍前面三个特性。
ISBN | 9787302454717 |
---|---|
出版社 | 清华大学出版社 |
作者 | 林福宗 |
尺寸 | 16 |