《国外计算机科学教材系列·计算机视觉:一种现代方法(第二版)》 福赛斯 (David A.Forsyth), 泊斯 (Jean Ponce), 高永强, 等 9787121276170
配送至
编辑推荐
《国外计算机科学教材系列·计算机视觉:一种现代方法(第二版)》可作为计算机几何学、计算机图形学、图像处理、模式识别、机器人学等专业高年级本科生和研究生的教材或参考书,也可供从事相关领域研究的工程技术人员参考阅读。
作者简介
作者:(美)David A. Forsyth(D. A. 福赛斯),(美)Jean Ponce(J. 泊斯) 译者:高永强等
David Forsyth:1984年于威特沃特斯兰德大学取得电气工程学士学位,1986年取得电气工程硕士学位,1989年于牛津贝列尔学院取得博士学位。之后在艾奥瓦大学任教3年,并在加州大学伯克利分校任教10年,之后在伊利诺斯大学任教。2000年和2001年任IEEE计算机视觉和模式识别会议执行副主席,2006年任CVPR常任副主席,2008年任欧洲计算机视觉会议执行副主席,是所有关于计算机视觉主要国际会议的常任执委会成员。他为SIGGRAPH执委会工作了5期。2006年获IEEE技术成就奖,2009年成为IEEE会士。
高永强,中国科学院深圳先进技术研究院集成所多媒体研究中心的博士,研究方向是数字图像处理,参与机器人ROS系统的关于视觉应用的项目,并整理总结了关于openCV应用的很多文章,研究方向是计算机视觉、模式识别和机器学习。
目录
第一部分图像生成
第1章摄像机的几何模型
1.1图像成像
1.1.1针孔透视
1.1.2弱透视
1.1.3带镜头的照相机
1.1.4人的眼睛
1.2内参数和外参数
1.2.1刚体变换和齐次坐标
1.2.2内参数
1.2.3外参数
1.2.4透视投影矩阵
1.2.5弱透视投影矩阵
1.3照相机的几何标定
1.3.1使用线性方法对照相机进行标定
1.3.2使用非线性方法对照相机进行标定
1.4注释
习题
编程练习
第2章光照及阴影
2.1像素的亮度
2.1.1表面反射
2.1.2光源及其产生的效果
2.1.3朗伯+镜面反射模型
2.1.4面光源
2.2阴影的估算
2.2.1辐射校准和高动态范围图像
2.2.2镜面反射模型
2.2.3对亮度和照度的推理
2.2.4光度立体技术:从多幅阴影图像恢复形状
2.3对互反射进行建模
2.3.1源于区域光在一个块上的照度
2.3.2热辐射和存在性
2.3.3互反射模型
2.3.4互反射的定性性质
2.4一个阴影图像的形状
2.5注释
习题
编程练习
第3章颜色
3.1人类颜色感知
3.1.1颜色匹配
3.1.2颜色感受体
3.2颜色物理学
3.2.1颜色的来源
3.2.2表面颜色
3.3颜色表示
3.3.1线性颜色空间
3.3.2非线性颜色空间
3.4图像颜色的模型
3.4.1漫反射项
3.4.2镜面反射项
3.5基于颜色的推论
3.5.1用颜色发现镜面反射
3.5.2用颜色去除阴影
3.5.3颜色恒常性:从图像颜色获得表面颜色
3.6注释
习题
编程练习
第二部分早期视觉:使用一幅图像
第4章线性滤波
4.1线性滤波与卷积
4.1.1卷积
4.2移不变线性系统
4.2.1离散卷积
4.2.2连续卷积
4.2.3离散卷积的边缘效应
4.3空间频率和傅里叶变换
4.3.1傅里叶变换
4.4采样和混叠
4.4.1采样
4.4.2混叠
4.4.3平滑和重采样
4.5滤波器与模板
4.5.1卷积与点积
4.5.2基的改变
4.6技术:归一化相关和检测模式
4.6.1通过归一化相关检测手势的方法来控制电视机
4.7技术:尺度和图像金字塔
4.7.1高斯金字塔
4.7.2多尺度表示的应用
4.8注释
习题
编程练习
第5章局部图像特征
5.1计算图像梯度
5.1.1差分高斯滤波
5.2对图像梯度的表征
5.2.1基于梯度的边缘检测子
5.2.2方向
5.3查找角点和建立近邻
5.3.1查找角点
5.3.2采用尺度和方向构建近邻
5.4通过SIFT特征和HOG特征描述近邻
5.4.1SIFT特征
5.4.2HOG特征
5.5实际计算局部特征
5.6注释
习题
编程练习
第6章纹理
6.1利用滤波器进行局部纹理表征
6.1.1斑点和条纹
6.1.2从滤波器输出到纹理表征
6.1.3实际局部纹理表征
6.2通过纹理基元的池化纹理表征
6.2.1向量量化和纹理基元
6.2.2k均值聚类的向量量化
6.3纹理合成和对图像中的空洞进行填充
6.3.1通过局部模型采样进行合成
6.3.2填充图像中的空洞
6.4图像去噪
6.4.1非局部均值
6.4.2三维块匹配(BM3D)
6.4.3稀疏编码学习
6.4.4结果
6.5由纹理恢复形状
6.5.1在平面内由纹理恢复形状
6.5.2从弯曲表面的纹理恢复形状
6.6注释
习题
编程练习
第三部分低层视觉:使用多幅图像
第7章立体视觉
7.1双目摄像机的几何属性和对极约束
7.1.1对极几何
7.1.2本征矩阵
7.1.3基础矩阵
7.2双目重构
7.2.1图像矫正
7.3人类立体视觉
7.4双目融合的局部算法
7.4.1相关
7.4.2多尺度的边缘匹配
7.5双目融合的全局算法
7.5.1排序约束和动态规划
7.5.2平滑约束和基于图的组合优化
7.6使用多台摄像机
7.7应用:机器人导航
7.8注释
习题
编程练习
第8章从运动中恢复三维结构
8.1内部标定的透视摄像机
8.1.1问题的自然歧义性
8.1.2从两幅图像估计欧氏结构和运动
8.1.3从多幅图像估计欧氏结构和运动
8.2非标定的弱透视摄像机
8.2.1问题的自然歧义性
8.2.2从两幅图像恢复仿射结构和运动
8.2.3从多幅图像恢复仿射结构和运动
8.2.4从仿射到欧氏图像
8.3非标定的透视摄像机
8.3.1问题的自然歧义性
8.3.2从两幅图像恢复投影结构和运动
8.3.3从多幅图像恢复投影结构和运动
8.3.4从投影到欧氏图像
8.4注释
习题
编程练习
……
第四部分中层视觉方法
第9章基于聚类的分割方法
第10章分组与模型拟合
第11章跟踪
第五部分高层视觉
第12章配准
第13章平滑的表面及其轮廓
第14章深度数据
第15章用于分类的学习
第16章图像分类
第17章检测图像中的物体
第18章物体识别
第六部分应用与其他主题
第19章基于图像的建模与渲染
第20章对人的观察
第21章图像搜索与检索
第七部分背景材料
第22章优化技术
文摘
版权页:
插图:
池化是表征同一个领域的模式元素的空间趋势,而不是表征空间的细节信息。一种池化的例子是构建视觉单词的直方图,这里的池是指直方图。这种策略通常也称为平均池化(average pooling)。另一种方式足构造一组向量,其中1为该视觉单词不管多长时间在该领域出现一次,而0表示不出现,这种方式通常称为最大池化(max pooling),或者通过tf—idf或其他权重构造直方图。池化具有很多准则:首先,池化可以抑制编码过程中产生的噪声,例如,如果期望两个相似的图像块得到不同的编码,则在不同图像块得到的直方图仍然可以提供有用的信息;其次,池化可以对不同模式之间的差异性进行强调——例如斑点和条纹应该包括不同的图像块族——同时抑制空间细节;最终,池化可以抑制小变换带来的影响,同样这些小变换包括平移、旋转和在同一领域进行表征计算的变形。
然而,池化同样将会产生新的问题。池化损失空间信息。这里有一个艰难的问题:池化可能在大的领域产生很好的噪声抑制,但是同样也抑制了更多的空间信息,池化在小的领域通过以较小噪声抑制为代价而得到更多的空间信息。如16.1.4节介绍的金宁塔构造方法,可以很好地缓解这种困难。
第二个困难是对具有非常不同意义的编码进行平均可能产生没有信息量的向量。这个问题在稀疏编码表征上将会变得异常困难。两个不同的图像块可能同时产生同样的非零成分。将这些项进行平均化看起来并不那么有用,而且会抑制信息。相反,我们可能仅仅需要在图像空间和特征空间连贯的领域进行池化。一种可能的处理办法是预聚类(preclustering)。在特征空间构建k均值聚类,每个聚类中心关联一个维度,我们仅仅对满足要求的特征编码进行池化,例如(a)落于同一个维度的,(b)在同一个图像池化领域。采取适当的池化策略和编码策略可以在测试数据上得到非常具有竞争力的性能。现在考虑采用这种不同的编码和池化策略的不同实验。
《国外计算机科学教材系列·计算机视觉:一种现代方法(第二版)》可作为计算机几何学、计算机图形学、图像处理、模式识别、机器人学等专业高年级本科生和研究生的教材或参考书,也可供从事相关领域研究的工程技术人员参考阅读。
作者简介
作者:(美)David A. Forsyth(D. A. 福赛斯),(美)Jean Ponce(J. 泊斯) 译者:高永强等
David Forsyth:1984年于威特沃特斯兰德大学取得电气工程学士学位,1986年取得电气工程硕士学位,1989年于牛津贝列尔学院取得博士学位。之后在艾奥瓦大学任教3年,并在加州大学伯克利分校任教10年,之后在伊利诺斯大学任教。2000年和2001年任IEEE计算机视觉和模式识别会议执行副主席,2006年任CVPR常任副主席,2008年任欧洲计算机视觉会议执行副主席,是所有关于计算机视觉主要国际会议的常任执委会成员。他为SIGGRAPH执委会工作了5期。2006年获IEEE技术成就奖,2009年成为IEEE会士。
高永强,中国科学院深圳先进技术研究院集成所多媒体研究中心的博士,研究方向是数字图像处理,参与机器人ROS系统的关于视觉应用的项目,并整理总结了关于openCV应用的很多文章,研究方向是计算机视觉、模式识别和机器学习。
目录
第一部分图像生成
第1章摄像机的几何模型
1.1图像成像
1.1.1针孔透视
1.1.2弱透视
1.1.3带镜头的照相机
1.1.4人的眼睛
1.2内参数和外参数
1.2.1刚体变换和齐次坐标
1.2.2内参数
1.2.3外参数
1.2.4透视投影矩阵
1.2.5弱透视投影矩阵
1.3照相机的几何标定
1.3.1使用线性方法对照相机进行标定
1.3.2使用非线性方法对照相机进行标定
1.4注释
习题
编程练习
第2章光照及阴影
2.1像素的亮度
2.1.1表面反射
2.1.2光源及其产生的效果
2.1.3朗伯+镜面反射模型
2.1.4面光源
2.2阴影的估算
2.2.1辐射校准和高动态范围图像
2.2.2镜面反射模型
2.2.3对亮度和照度的推理
2.2.4光度立体技术:从多幅阴影图像恢复形状
2.3对互反射进行建模
2.3.1源于区域光在一个块上的照度
2.3.2热辐射和存在性
2.3.3互反射模型
2.3.4互反射的定性性质
2.4一个阴影图像的形状
2.5注释
习题
编程练习
第3章颜色
3.1人类颜色感知
3.1.1颜色匹配
3.1.2颜色感受体
3.2颜色物理学
3.2.1颜色的来源
3.2.2表面颜色
3.3颜色表示
3.3.1线性颜色空间
3.3.2非线性颜色空间
3.4图像颜色的模型
3.4.1漫反射项
3.4.2镜面反射项
3.5基于颜色的推论
3.5.1用颜色发现镜面反射
3.5.2用颜色去除阴影
3.5.3颜色恒常性:从图像颜色获得表面颜色
3.6注释
习题
编程练习
第二部分早期视觉:使用一幅图像
第4章线性滤波
4.1线性滤波与卷积
4.1.1卷积
4.2移不变线性系统
4.2.1离散卷积
4.2.2连续卷积
4.2.3离散卷积的边缘效应
4.3空间频率和傅里叶变换
4.3.1傅里叶变换
4.4采样和混叠
4.4.1采样
4.4.2混叠
4.4.3平滑和重采样
4.5滤波器与模板
4.5.1卷积与点积
4.5.2基的改变
4.6技术:归一化相关和检测模式
4.6.1通过归一化相关检测手势的方法来控制电视机
4.7技术:尺度和图像金字塔
4.7.1高斯金字塔
4.7.2多尺度表示的应用
4.8注释
习题
编程练习
第5章局部图像特征
5.1计算图像梯度
5.1.1差分高斯滤波
5.2对图像梯度的表征
5.2.1基于梯度的边缘检测子
5.2.2方向
5.3查找角点和建立近邻
5.3.1查找角点
5.3.2采用尺度和方向构建近邻
5.4通过SIFT特征和HOG特征描述近邻
5.4.1SIFT特征
5.4.2HOG特征
5.5实际计算局部特征
5.6注释
习题
编程练习
第6章纹理
6.1利用滤波器进行局部纹理表征
6.1.1斑点和条纹
6.1.2从滤波器输出到纹理表征
6.1.3实际局部纹理表征
6.2通过纹理基元的池化纹理表征
6.2.1向量量化和纹理基元
6.2.2k均值聚类的向量量化
6.3纹理合成和对图像中的空洞进行填充
6.3.1通过局部模型采样进行合成
6.3.2填充图像中的空洞
6.4图像去噪
6.4.1非局部均值
6.4.2三维块匹配(BM3D)
6.4.3稀疏编码学习
6.4.4结果
6.5由纹理恢复形状
6.5.1在平面内由纹理恢复形状
6.5.2从弯曲表面的纹理恢复形状
6.6注释
习题
编程练习
第三部分低层视觉:使用多幅图像
第7章立体视觉
7.1双目摄像机的几何属性和对极约束
7.1.1对极几何
7.1.2本征矩阵
7.1.3基础矩阵
7.2双目重构
7.2.1图像矫正
7.3人类立体视觉
7.4双目融合的局部算法
7.4.1相关
7.4.2多尺度的边缘匹配
7.5双目融合的全局算法
7.5.1排序约束和动态规划
7.5.2平滑约束和基于图的组合优化
7.6使用多台摄像机
7.7应用:机器人导航
7.8注释
习题
编程练习
第8章从运动中恢复三维结构
8.1内部标定的透视摄像机
8.1.1问题的自然歧义性
8.1.2从两幅图像估计欧氏结构和运动
8.1.3从多幅图像估计欧氏结构和运动
8.2非标定的弱透视摄像机
8.2.1问题的自然歧义性
8.2.2从两幅图像恢复仿射结构和运动
8.2.3从多幅图像恢复仿射结构和运动
8.2.4从仿射到欧氏图像
8.3非标定的透视摄像机
8.3.1问题的自然歧义性
8.3.2从两幅图像恢复投影结构和运动
8.3.3从多幅图像恢复投影结构和运动
8.3.4从投影到欧氏图像
8.4注释
习题
编程练习
……
第四部分中层视觉方法
第9章基于聚类的分割方法
第10章分组与模型拟合
第11章跟踪
第五部分高层视觉
第12章配准
第13章平滑的表面及其轮廓
第14章深度数据
第15章用于分类的学习
第16章图像分类
第17章检测图像中的物体
第18章物体识别
第六部分应用与其他主题
第19章基于图像的建模与渲染
第20章对人的观察
第21章图像搜索与检索
第七部分背景材料
第22章优化技术
文摘
版权页:
插图:
池化是表征同一个领域的模式元素的空间趋势,而不是表征空间的细节信息。一种池化的例子是构建视觉单词的直方图,这里的池是指直方图。这种策略通常也称为平均池化(average pooling)。另一种方式足构造一组向量,其中1为该视觉单词不管多长时间在该领域出现一次,而0表示不出现,这种方式通常称为最大池化(max pooling),或者通过tf—idf或其他权重构造直方图。池化具有很多准则:首先,池化可以抑制编码过程中产生的噪声,例如,如果期望两个相似的图像块得到不同的编码,则在不同图像块得到的直方图仍然可以提供有用的信息;其次,池化可以对不同模式之间的差异性进行强调——例如斑点和条纹应该包括不同的图像块族——同时抑制空间细节;最终,池化可以抑制小变换带来的影响,同样这些小变换包括平移、旋转和在同一领域进行表征计算的变形。
然而,池化同样将会产生新的问题。池化损失空间信息。这里有一个艰难的问题:池化可能在大的领域产生很好的噪声抑制,但是同样也抑制了更多的空间信息,池化在小的领域通过以较小噪声抑制为代价而得到更多的空间信息。如16.1.4节介绍的金宁塔构造方法,可以很好地缓解这种困难。
第二个困难是对具有非常不同意义的编码进行平均可能产生没有信息量的向量。这个问题在稀疏编码表征上将会变得异常困难。两个不同的图像块可能同时产生同样的非零成分。将这些项进行平均化看起来并不那么有用,而且会抑制信息。相反,我们可能仅仅需要在图像空间和特征空间连贯的领域进行池化。一种可能的处理办法是预聚类(preclustering)。在特征空间构建k均值聚类,每个聚类中心关联一个维度,我们仅仅对满足要求的特征编码进行池化,例如(a)落于同一个维度的,(b)在同一个图像池化领域。采取适当的池化策略和编码策略可以在测试数据上得到非常具有竞争力的性能。现在考虑采用这种不同的编码和池化策略的不同实验。
商品详情
促销
促销
促销
促销
促销
促销
促销
促销
计算机视觉的经典教材,作者历经多年沉淀的全新修订版本。丰富的应用实例,大量的插图与详细的数学分析,带领读者全面了解计算机视觉领域的基础知识到高级应用。
计算机视觉是研究如何使人工系统从图像或多维数据中“感知”的科学。本书是计算机视觉领域的经典教材,内容涉及摄像机的几何模型、光照及阴影、颜色、线性滤波、局部图像特征、纹理、立体视觉、运动结构、聚类分割、分组与模型拟合、跟踪、配准、平滑表面及其轮廓、深度数据、图像分类、物体检测与识别、基于图像的建模与渲染、人形研究、图像搜索与检索、优化技术等。与前一版相比,本书简化了部分主题,增加了应用示例,重写了关于现代特征的内容,详述了现代图像编辑技术与物体识别技术。
第一部分图像生成
第章摄像机的几何模型
图像成像
针孔透视
弱透视
带镜头的照相机
人的眼睛
内参数和外参数
刚体变换和齐次坐标
内参数
外参数
透视投影矩阵
弱透视投影矩阵
照相机的几何标定
使用线性方法对照相机进行标定
使用非线性方法对照相机进行标定
注释
习题
编程练习
第章光照及阴影
像素的亮度
表面反射
光源及其产生的效果
朗伯镜面反射模型
面光源
阴影的估算
辐射校准和高动态范围图像
镜面反射模型
对亮度和照度的推理
光度立体技术从多幅阴影图像恢复形状
对互反射进行建模
源于区域光在一个块上的照度
热辐射和存在性
互反射模型
互反射的定性性质
一个阴影图像的形状
注释
习题
编程练习
第章颜色
人类颜色感知
颜色匹配
颜色感受体
颜色物理学
颜色的来源
表面颜色
颜色表示
线性颜色空间
非线性颜色空间
图像颜色的模型
漫反射项
镜面反射项
基于颜色的推论
用颜色发现镜面反射
用颜色去除阴影
颜色恒常性从图像颜色获得表面颜色
注释
习题
编程练习
第二部分早期视觉使用一幅图像
第章线性滤波
线性滤波与卷积
卷积
移不变线性系统
离散卷积
连续卷积
离散卷积的边缘效应
空间频率和傅里叶变换
傅里叶变换
采样和混叠
采样
混叠
平滑和重采样
滤波器与模板
卷积与点积
基的改变
技术归一化相关和检测模式
通过归一化相关检测手势的方法来控制电视机
技术尺度和图像金字塔
高斯金字塔
多尺度表示的应用
注释
习题
编程练习
第章局部图像特征
计算图像梯度
差分高斯滤波
对图像梯度的表征
基于梯度的边缘检测子
方向
查找角点和建立近邻
查找角点
采用尺度和方向构建近邻
通过特征和特征描述近邻
特征
特征
实际计算局部特征
注释
习题
编程练习
第章纹理
利用滤波器进行局部纹理表征
斑点和条纹
从滤波器输出到纹理表征
实际局部纹理表征
通过纹理基元的池化纹理表征
向量量化和纹理基元
均值聚类的向量量化
纹理合成和对图像中的空洞进行填充
通过局部模型采样进行合成
填充图像中的空洞
图像去噪
非局部均值
三维块匹配
稀疏编码学习
结果
由纹理恢复形状
在平面内由纹理恢复形状
从弯曲表面的纹理恢复形状
注释
习题
编程练习
第三部分低层视觉使用多幅图像
第章立体视觉
双目摄像机的几何属性和对极约束
对极几何
本征矩阵
基础矩阵
双目重构
图像矫正
人类立体视觉
双目融合的局部算法
相关
多尺度的边缘匹配
双目融合的全局算法
排序约束和动态规划
平滑约束和基于图的组合优化
使用多台摄像机
应用机器人导航
注释
习题
编程练习
第章从运动中恢复三维结构
内部标定的透视摄像机
问题的自然歧义性
从两幅图像估计欧氏结构和运动
从多幅图像估计欧氏结构和运动
非标定的弱透视摄像机
问题的自然歧义性
从两幅图像恢复仿射结构和运动
从多幅图像恢复仿射结构和运动
从仿射到欧氏图像
非标定的透视摄像机
问题的自然歧义性
从两幅图像恢复投影结构和运动
从多幅图像恢复投影结构和运动
从投影到欧氏图像
注释
习题
编程练习
第四部分中层视觉方法
第章基于聚类的分割方法
人类视觉分组和格式塔原理
重要应用
背景差分
镜头的边界检测
交互分割
形成图像区域
基于像素点聚类的图像分割
基本的聚类方法
分水岭算法
使用均值算法进行分割
均值漂移查找数据中的局部模型
采用均值漂移进行聚类和分割
分割、聚类和图论
图论术语和相关事实
根据图论进行凝聚式聚类
根据图论进行分解式聚类
归一化切割
图像分割在实际中的应用
对分割器的评估
注释
习题
编程练习
第章分组与模型拟合
霍夫变换
用霍夫变换拟合直线
霍夫变换的使用
拟合直线与平面
拟合单一直线
拟合平面
拟合多条直线
拟合曲线
鲁棒性
估计法
搜寻正常点
用概率模型进行拟合
数据缺失问题
混合模型和隐含变量
混合模型的算法
算法的难点
基于参数估计的运动分割
光流和运动
光流模型
用分层法分割运动
模型选择哪个最好
利用交叉验证选择模型
注释
习题
编程练习
第章跟踪
简单跟踪策略
基于检测的跟踪
基于匹配的平移跟踪
使用仿射变换来确定匹配
匹配跟踪
匹配摘要表征
流跟踪
基于卡尔曼滤波器的线性动态模型跟踪
线性测量值和线性动态模型
卡尔曼滤波
前向后向平滑
数据相关
卡尔曼滤波检测方法
数据相关的关键方法
粒子滤波
概率分布的采样表示
最简单的粒子滤波器
跟踪算法
可行的粒子滤波器
创建粒子滤波器中的粒子问题
注释
习题
编程练习
第五部分高层视觉
第章配准
刚性物体配准
迭代最近点
通过关联搜索转换关系
应用建立图像拼接
基于模型的视觉使用投影配准刚性物体
验证比较转换与渲染后的原图与目标图
配准可形变目标
使用主动外观模型对纹理进行变形
实践中的主动外观模型
应用医疗成像系统中的配准
注释
习题
编程练习
第章平滑的表面及其轮廓
微分几何的元素
曲线
表面
表面轮廓几何学
遮挡轮廓和图形轮廓
图像轮廓的歧点和拐点
定理
视觉事件微分几何的补充
高斯映射的几何关系
渐近曲线
渐近球面映射
局部视觉事件
双切射线流形
多重局部视觉事件
外观图
注释
习题
第章深度数据
主动深度传感器
深度数据的分割
分析微分几何学的基本元素
在深度图像中寻找阶跃和顶边
把深度图像分割为平面区域
深度图像的配准和模型获取
四元组
使用最近点迭代方法配准深度图像
多幅深度图像的融合
物体识别
使用解释树匹配分段平面表示的表面
使用自旋图像匹配自由形态的曲面
特征
技术决策树和随机森林
标记像素
计算关节位置
注释
习题
编程练习
第章用于分类的学习
分类、误差和损失函数
基于损失的决策
训练误差、测试误差和过拟合
正则化
错误率和交叉验证
受试者工作特征曲线
主要的分类策略
示例采用归一化类条件密度的马氏距离
示例类条件直方图和朴素贝叶斯
示例采用最近邻的非参分类器
示例线性支持向量机
示例核机器
示例级联和
构建分类器的实用方法
手动调整训练数据并提升性能
通过二类分类器构建多类分类器
求解和核机器的方案
注释
习题
第章图像分类
构建好的图像特征
示例应用
采用特征进行编码布局
采用视觉单词总结图像
空间金字塔
采用主分量进行降维
采用典型变量分析进行降维
示例应用检测不雅图片
示例应用材料分类
示例应用场景分类
分类单一物体的图像
图像分类策略
图像分类的评估系统
固定类数据集
大量类的数据集
花、树叶和鸟某些特定的数据集
在实践中进行图像分类
关于图像特征的代码
图像分类数据库
数据库偏差
采用众包平台进行数据库收集
注释
编程练习
第章检测图像中的物体
滑动窗口法
人脸检测
行人检测
边界检测
检测形变物体
物体检测算法的发展现状
数据库和资源
注释
编程练习
第章物体识别
物体识别应该做什么
物体识别系统应该做什么
目前物体识别的策略
什么是类别
选择应该怎么描述
特征问题
提升当前图像特征
其他类型的图像特征
几何问题
语义问题
属性和不熟悉
部分、姿态部件和一致性
块的意义部分、姿态部件、物体、短语和场景
第六部分应用与其他主题
第章基于图像的建模与渲染
可视外壳
可视外壳模型的主要元素
跟踪相交曲线
分割相交曲线
锥带三角化
结果
更进一步雕刻可视外壳
基于贴片的多视立体视觉
模型的主要元素
初始特征匹配
扩张
过滤
结果
光场
注释
习题
编程练习
第章对人的观察
隐马尔可夫模型、动态规划和基于树形结构的模型
隐马尔可夫模型
关于的推理
通过拟合
树形结构的能量模型
对图像中的人进行解析
图形结构模型的解析
估计衣服的表面
人的跟踪
为什么人的跟踪如此困难
通过表面进行运动跟踪
采用模板进行运动人体跟踪
从二维到三维提升
在正视图进行重构
利用外貌进行精确重构
利用运动进行精确重构
行为识别
背景人类运动数据
人体结构和行为识别
采用外貌特征识别人类行为
采用组合的模型识别人类行为
资源
注释
第章图像搜索与检索
应用背景
应用
用户需求
图像查询的类别
什么样的用户使用图像采集
源自信息检索的基本技术
单词统计
单词统计的平滑
最近邻估计和哈希
文本排序
图像文件
没有量化的匹配
根据查询结果对图像进行排序
浏览与布局
图像浏览布局
对注释的图片预测
源于邻近文字的注释
源于整幅图的注释
采用分类器预测关联的单词
人名与人脸
通过分割生成标签
目前最先进的单词预测器
资源
方法比较
开放问题
注释
第七部分背景材料
第章优化技术
线性最小二乘法
正则方程和伪逆
齐次方程组和特征值问题
广义特征值问题
示例拟合平面上的一条直线
奇异值分解
非线性最小二乘法
牛顿方法平方非线性方程组
牛顿方法过约束的非线性方程组
高斯牛顿法和法
稀疏编码和字典学习
稀疏编码
字典学习
监督字典学习
最小切最大流问题和组合优化
最小切问题
二次伪布尔函数
泛化为整型变量
注释
高永强,中国科学院深圳先进技术研究院集成所多媒体研究中心的博士,研究方向是数字图像处理,参与机器人系统的关于视觉应用的项目,并整理总结了关于应用的很多文章,研究方向是计算机视觉、模式识别和机器学习。
促销
促销
促销
促销
促销
促销
促销
促销
计算机视觉的经典教材,作者历经多年沉淀的全新修订版本。丰富的应用实例,大量的插图与详细的数学分析,带领读者全面了解计算机视觉领域的基础知识到高级应用。
计算机视觉是研究如何使人工系统从图像或多维数据中“感知”的科学。本书是计算机视觉领域的经典教材,内容涉及摄像机的几何模型、光照及阴影、颜色、线性滤波、局部图像特征、纹理、立体视觉、运动结构、聚类分割、分组与模型拟合、跟踪、配准、平滑表面及其轮廓、深度数据、图像分类、物体检测与识别、基于图像的建模与渲染、人形研究、图像搜索与检索、优化技术等。与前一版相比,本书简化了部分主题,增加了应用示例,重写了关于现代特征的内容,详述了现代图像编辑技术与物体识别技术。
第一部分图像生成
第章摄像机的几何模型
图像成像
针孔透视
弱透视
带镜头的照相机
人的眼睛
内参数和外参数
刚体变换和齐次坐标
内参数
外参数
透视投影矩阵
弱透视投影矩阵
照相机的几何标定
使用线性方法对照相机进行标定
使用非线性方法对照相机进行标定
注释
习题
编程练习
第章光照及阴影
像素的亮度
表面反射
光源及其产生的效果
朗伯镜面反射模型
面光源
阴影的估算
辐射校准和高动态范围图像
镜面反射模型
对亮度和照度的推理
光度立体技术从多幅阴影图像恢复形状
对互反射进行建模
源于区域光在一个块上的照度
热辐射和存在性
互反射模型
互反射的定性性质
一个阴影图像的形状
注释
习题
编程练习
第章颜色
人类颜色感知
颜色匹配
颜色感受体
颜色物理学
颜色的来源
表面颜色
颜色表示
线性颜色空间
非线性颜色空间
图像颜色的模型
漫反射项
镜面反射项
基于颜色的推论
用颜色发现镜面反射
用颜色去除阴影
颜色恒常性从图像颜色获得表面颜色
注释
习题
编程练习
第二部分早期视觉使用一幅图像
第章线性滤波
线性滤波与卷积
卷积
移不变线性系统
离散卷积
连续卷积
离散卷积的边缘效应
空间频率和傅里叶变换
傅里叶变换
采样和混叠
采样
混叠
平滑和重采样
滤波器与模板
卷积与点积
基的改变
技术归一化相关和检测模式
通过归一化相关检测手势的方法来控制电视机
技术尺度和图像金字塔
高斯金字塔
多尺度表示的应用
注释
习题
编程练习
第章局部图像特征
计算图像梯度
差分高斯滤波
对图像梯度的表征
基于梯度的边缘检测子
方向
查找角点和建立近邻
查找角点
采用尺度和方向构建近邻
通过特征和特征描述近邻
特征
特征
实际计算局部特征
注释
习题
编程练习
第章纹理
利用滤波器进行局部纹理表征
斑点和条纹
从滤波器输出到纹理表征
实际局部纹理表征
通过纹理基元的池化纹理表征
向量量化和纹理基元
均值聚类的向量量化
纹理合成和对图像中的空洞进行填充
通过局部模型采样进行合成
填充图像中的空洞
图像去噪
非局部均值
三维块匹配
稀疏编码学习
结果
由纹理恢复形状
在平面内由纹理恢复形状
从弯曲表面的纹理恢复形状
注释
习题
编程练习
第三部分低层视觉使用多幅图像
第章立体视觉
双目摄像机的几何属性和对极约束
对极几何
本征矩阵
基础矩阵
双目重构
图像矫正
人类立体视觉
双目融合的局部算法
相关
多尺度的边缘匹配
双目融合的全局算法
排序约束和动态规划
平滑约束和基于图的组合优化
使用多台摄像机
应用机器人导航
注释
习题
编程练习
第章从运动中恢复三维结构
内部标定的透视摄像机
问题的自然歧义性
从两幅图像估计欧氏结构和运动
从多幅图像估计欧氏结构和运动
非标定的弱透视摄像机
问题的自然歧义性
从两幅图像恢复仿射结构和运动
从多幅图像恢复仿射结构和运动
从仿射到欧氏图像
非标定的透视摄像机
问题的自然歧义性
从两幅图像恢复投影结构和运动
从多幅图像恢复投影结构和运动
从投影到欧氏图像
注释
习题
编程练习
第四部分中层视觉方法
第章基于聚类的分割方法
人类视觉分组和格式塔原理
重要应用
背景差分
镜头的边界检测
交互分割
形成图像区域
基于像素点聚类的图像分割
基本的聚类方法
分水岭算法
使用均值算法进行分割
均值漂移查找数据中的局部模型
采用均值漂移进行聚类和分割
分割、聚类和图论
图论术语和相关事实
根据图论进行凝聚式聚类
根据图论进行分解式聚类
归一化切割
图像分割在实际中的应用
对分割器的评估
注释
习题
编程练习
第章分组与模型拟合
霍夫变换
用霍夫变换拟合直线
霍夫变换的使用
拟合直线与平面
拟合单一直线
拟合平面
拟合多条直线
拟合曲线
鲁棒性
估计法
搜寻正常点
用概率模型进行拟合
数据缺失问题
混合模型和隐含变量
混合模型的算法
算法的难点
基于参数估计的运动分割
光流和运动
光流模型
用分层法分割运动
模型选择哪个最好
利用交叉验证选择模型
注释
习题
编程练习
第章跟踪
简单跟踪策略
基于检测的跟踪
基于匹配的平移跟踪
使用仿射变换来确定匹配
匹配跟踪
匹配摘要表征
流跟踪
基于卡尔曼滤波器的线性动态模型跟踪
线性测量值和线性动态模型
卡尔曼滤波
前向后向平滑
数据相关
卡尔曼滤波检测方法
数据相关的关键方法
粒子滤波
概率分布的采样表示
最简单的粒子滤波器
跟踪算法
可行的粒子滤波器
创建粒子滤波器中的粒子问题
注释
习题
编程练习
第五部分高层视觉
第章配准
刚性物体配准
迭代最近点
通过关联搜索转换关系
应用建立图像拼接
基于模型的视觉使用投影配准刚性物体
验证比较转换与渲染后的原图与目标图
配准可形变目标
使用主动外观模型对纹理进行变形
实践中的主动外观模型
应用医疗成像系统中的配准
注释
习题
编程练习
第章平滑的表面及其轮廓
微分几何的元素
曲线
表面
表面轮廓几何学
遮挡轮廓和图形轮廓
图像轮廓的歧点和拐点
定理
视觉事件微分几何的补充
高斯映射的几何关系
渐近曲线
渐近球面映射
局部视觉事件
双切射线流形
多重局部视觉事件
外观图
注释
习题
第章深度数据
主动深度传感器
深度数据的分割
分析微分几何学的基本元素
在深度图像中寻找阶跃和顶边
把深度图像分割为平面区域
深度图像的配准和模型获取
四元组
使用最近点迭代方法配准深度图像
多幅深度图像的融合
物体识别
使用解释树匹配分段平面表示的表面
使用自旋图像匹配自由形态的曲面
特征
技术决策树和随机森林
标记像素
计算关节位置
注释
习题
编程练习
第章用于分类的学习
分类、误差和损失函数
基于损失的决策
训练误差、测试误差和过拟合
正则化
错误率和交叉验证
受试者工作特征曲线
主要的分类策略
示例采用归一化类条件密度的马氏距离
示例类条件直方图和朴素贝叶斯
示例采用最近邻的非参分类器
示例线性支持向量机
示例核机器
示例级联和
构建分类器的实用方法
手动调整训练数据并提升性能
通过二类分类器构建多类分类器
求解和核机器的方案
注释
习题
第章图像分类
构建好的图像特征
示例应用
采用特征进行编码布局
采用视觉单词总结图像
空间金字塔
采用主分量进行降维
采用典型变量分析进行降维
示例应用检测不雅图片
示例应用材料分类
示例应用场景分类
分类单一物体的图像
图像分类策略
图像分类的评估系统
固定类数据集
大量类的数据集
花、树叶和鸟某些特定的数据集
在实践中进行图像分类
关于图像特征的代码
图像分类数据库
数据库偏差
采用众包平台进行数据库收集
注释
编程练习
第章检测图像中的物体
滑动窗口法
人脸检测
行人检测
边界检测
检测形变物体
物体检测算法的发展现状
数据库和资源
注释
编程练习
第章物体识别
物体识别应该做什么
物体识别系统应该做什么
目前物体识别的策略
什么是类别
选择应该怎么描述
特征问题
提升当前图像特征
其他类型的图像特征
几何问题
语义问题
属性和不熟悉
部分、姿态部件和一致性
块的意义部分、姿态部件、物体、短语和场景
第六部分应用与其他主题
第章基于图像的建模与渲染
可视外壳
可视外壳模型的主要元素
跟踪相交曲线
分割相交曲线
锥带三角化
结果
更进一步雕刻可视外壳
基于贴片的多视立体视觉
模型的主要元素
初始特征匹配
扩张
过滤
结果
光场
注释
习题
编程练习
第章对人的观察
隐马尔可夫模型、动态规划和基于树形结构的模型
隐马尔可夫模型
关于的推理
通过拟合
树形结构的能量模型
对图像中的人进行解析
图形结构模型的解析
估计衣服的表面
人的跟踪
为什么人的跟踪如此困难
通过表面进行运动跟踪
采用模板进行运动人体跟踪
从二维到三维提升
在正视图进行重构
利用外貌进行精确重构
利用运动进行精确重构
行为识别
背景人类运动数据
人体结构和行为识别
采用外貌特征识别人类行为
采用组合的模型识别人类行为
资源
注释
第章图像搜索与检索
应用背景
应用
用户需求
图像查询的类别
什么样的用户使用图像采集
源自信息检索的基本技术
单词统计
单词统计的平滑
最近邻估计和哈希
文本排序
图像文件
没有量化的匹配
根据查询结果对图像进行排序
浏览与布局
图像浏览布局
对注释的图片预测
源于邻近文字的注释
源于整幅图的注释
采用分类器预测关联的单词
人名与人脸
通过分割生成标签
目前最先进的单词预测器
资源
方法比较
开放问题
注释
第七部分背景材料
第章优化技术
线性最小二乘法
正则方程和伪逆
齐次方程组和特征值问题
广义特征值问题
示例拟合平面上的一条直线
奇异值分解
非线性最小二乘法
牛顿方法平方非线性方程组
牛顿方法过约束的非线性方程组
高斯牛顿法和法
稀疏编码和字典学习
稀疏编码
字典学习
监督字典学习
最小切最大流问题和组合优化
最小切问题
二次伪布尔函数
泛化为整型变量
注释
高永强,中国科学院深圳先进技术研究院集成所多媒体研究中心的博士,研究方向是数字图像处理,参与机器人系统的关于视觉应用的项目,并整理总结了关于应用的很多文章,研究方向是计算机视觉、模式识别和机器学习。
| ISBN | 9787121276170 |
|---|---|
| 出版社 | 电子工业出版社 |
| 作者 | 福赛斯 (David A.Forsyth) |
| 尺寸 | 16 |