1.3 本书架构

本书共5部分,后续每部分的内容结构安排如下。

第1部分为图像获取,包括第2章和第3章。第2章介绍了关于图像的基础知识,包括常见的图像与视频格式介绍、图像的数字化,以及灰度图像、彩色图像、深度图像的相关知识。第3章介绍了照相机成像的相关知识,包括照相机模型、照相机内/外参数与标定,以及镜头畸变与校正。

第2部分为图像特征提取与匹配,包括第4~6章。第4章介绍了图像的全局特征,包括颜色特征和纹理特征。第5章介绍了图像的局部特征,包括Harris角点、FAST特征、霍夫变换(霍夫线变换和霍夫圆变换)、SIFT特征、SURF特征、ORB特征。第6章介绍了图像的特征点匹配优化算法,包括距离筛选算法、交叉匹配算法、KNN算法、RANSAC算法。

第3部分为视觉室内定位,包括第7~9章。第7章介绍了几何变换,这是视觉室内定位的基础知识,包括二维空间和三维空间中的变换、旋转向量等相关知识。第8章介绍了如何对照相机进行位置求解与估计,这是视觉室内定位的核心,主要介绍了采用对极几何约束实现室内定位的方法。第9章介绍了视觉室内定位的经典框架,即SLAM,这一章对视觉室内定位进行了完整的系统方案阐述,并在最后简单介绍了几个典型的SLAM系统。

第4部分为数据库与地图建立,包括第10~12章。第10章是关于图像拼接的知识,首先介绍了图像预处理操作,然后介绍了4种图像拼接融合算法,包括平均值融合算法、加权平均融合算法、渐入渐出融合算法、多频段融合算法。第11章重点介绍了点云的相关知识,包括点云的基本数据类型、点云检索、点云滤波和点云匹配操作(ICP算法)。第12章介绍了可视化建图与渲染,包括稠密建图、图形渲染和点云渲染与可视化的操作。

第5部分为图像语义识别,包括第13章和第14章。第13章介绍了图像语义的一些基本概念和两种图像标注方法。第14章介绍了图像语义的相关知识。